6주차 커리큘럼 통괄 개요

1. 커리큘럼의 핵심 목적
2. 학습 단계별 연결 고리
3. 기대 효과

주제
Kafka 생태계를 활용한 엔드 투 엔드(End-to-End) 실시간 데이터 파이프라인 구축
세부 내용
실시간 스트리밍 데이터의 철학적 이해
Docker 기반 분산 클러스터 인프라 구성
프로그래밍을 통한 메시징 핸들링
CDC 기술을 이용한 소스 데이터 캡처
최종 Object Storage(MinIO) 적재까지의 전 과정 실습

1. 커리큘럼의 핵심 목적

1.1 데이터 중심 아키텍처로의 전환

목적:
- 전통적인 요청-응답(Request-Response) 모델, 배치(Batch) 위주의 데이터 처리에서 벗어나,
- 모든 이벤트를 실시간 흐름으로 파악하는 아키텍처 이해
의의:
- 비즈니스에서 발생하는 사건(Event)을 즉각적으로 가공하여 가치를 창출할 수 있는
- 현대적 데이터 기반 의사결정의 토대 마련

1.2 시스템 간 결합도 해제 및 확장성 확보

목적:
- Kafka를 중앙의 메시지 중추(Backbone)로 활용하여
- 소스 시스템(DB)과 타겟 시스템(Storage) 간의 의존성을 분리하는 방법의 학습
의의:
- 특정 서비스의 장애가 전체 시스템으로 전이되지 않도록 방어
- 트래픽 증가에 따라 유연하게 인프라를 확장할 수 있는 능력 배양

1.3 데이터 무결성 및 자동화 파이프라인 구축

목적:
- CDC(Debezium)를 통해 소스 DB의 부하를 최소화하면서 데이터 변경분을 누락 없이 추적
- Kafka Connect를 이용한 적재 과정의 자동화
의의:
- 수작업 코딩을 줄이고
- 선언적인 설정만으로 대규모 데이터를 안정적으로 이동시키는 ‘데이터 운영(DataOps)’ 역량 강화

2. 학습 단계별 연결 고리

이 과정은 ‘인프라 🡲 개발 🡲 확장 🡲 운영’의 흐름으로 설계됨

기초: 실시간 데이터의 특성을 배우며 왜 Kafka가 필요한지 철학적 근거 마련
환경: Docker를 통해 실제 운영 환경과 유사한 분산 클러스터를 로컬에 구현
구현: 직접 코딩(Producer/Consumer)을 통해 데이터가 Kafka 내부 파티션에 어떻게 저장되고 소비되는지 디테일하게 제어
심화: DB의 변경사항을 자동으로 감지(CDC)하여 데이터 유실 없는 원천 데이터 확보
완성: 확보된 데이터를 클라우드 네이티브 저장소(MinIO)에 실시간으로 적재함으로써 소비 가능한 형태의 데이터 레이크 완성

3. 기대 효과

개발자:
- 마이크로서비스(MSA) 간의 효율적인 비동기 통신 방식을 마스터하고, 이벤트 소싱 패턴의 기초를 다질 수 있음
데이터 엔지니어:
- 고성능 분산 메시징 시스템을 운영하고, 실시간 ETL(Extract, Transform, Load) 파이프라인을 독자적으로 설계 및 구축할 수 있는 실무 능력 확보

이 과정은
단순히 기술 도구를 배우는 것을 넘어
“데이터는 멈춰있지 않고 흐른다”는 스트리밍의 정수를 경험하는 단계
이 과정을 마친 학습자는
실시간 분석 엔진(Flink, Spark Streaming)이나 실시간 대시보드 시각화 과정으로 넘어가기 위한 완벽한 하부 인프라 지식을 보유하게 됨
CDC와 Kafka Connect의 조합을 성공적으로 수행한다면, 기업 현장의 레거시 시스템을 현대화하는 핵심 엔지니어로서의 자질을 증명하게 될 것

6주차 커리큘럼 통괄 개요

1. 커리큘럼의 핵심 목적

1.1 데이터 중심 아키텍처로의 전환

1.2 시스템 간 결합도 해제 및 확장성 확보

1.3 데이터 무결성 및 자동화 파이프라인 구축

2. 학습 단계별 연결 고리

3. 기대 효과

AiDA Lectures

Error

1. 커리큘럼의 핵심 목적

1.1 데이터 중심 아키텍처로의 전환

1.2 시스템 간 결합도 해제 및 확장성 확보

1.3 데이터 무결성 및 자동화 파이프라인 구축

2. 학습 단계별 연결 고리

3. 기대 효과

Templates (for web app):

Error