# [03.03~05.16] 데이터 분석 스쿨 4기(397H) ## [강의 개요] * 고객사: 멋쟁이 사자처럼 * 주제: 데이터 분석 * 강의기간: 2024.12.19~2025.05.16 중 2025.03.03~2025.05.16 * 강의시간: 397H (전체 760H) * 특이사항: 전체 760H 중 기완료 강의 시간 및 특강 제외하여 397H ## [강의 내용] ### 1. 데이터 분석 핵심 다지기 1 (2024.12.20~2024.12.24: 22H) - 데이터 활용 및 과학 방법론: 데이터 분석 입문 - 통계 분석 ### 2. Python과 컴퓨터 공학 역량 (2024.12.26~2025.01.22: 128H) #### 2-1. Python 기초 / 심화 - Python 기초 - Pandas - Series / Dataframe 속성, Pandas 함수, 데이터 결측치와 병합 - 예제를 통한 Pandas 실습 - 인당 GRDP와 사회조사지표, 데이터 산업 현황, 음주운전 교통사고 현황 - 데이터 시각화 - Matplotlib를 이용한 시각화, Pandas를 이용한 시각화, Seaborn을 이용한 시각화 - Python 기반 데이터 부석 및 시각화 실습 #### 2-2. 자료구조와 알고리즘 - 복잡도(빅오표기법), 그리디 알고리즘, 시뮬레이션과 완전 탐색 - 자료구조(스택, 큐, 트리), DFS / BFS, 정렬, 이진 탐색 - 다이나믹 프로그래밍, 그래프 이론, 기타 그래프 알고리즘 #### 2-3. SQL - MySQL 설치 - DDL / DML / DCL, View, Index - 파일 Import / Export - Procedure, Function, Cursor, Over, With - Python 연동 ### 3. 데이터 분석 핵심 다지기 2 (2025.01.22~2025.01.23: 10H) - 데이터 활용 및 과학 방법론: GitHub - Git 설치, Git 명령어 - Git vs Github ### 4. 데이터 핸들링 (2025.01.23~2025.02.06: 40H) #### 4-1. 데이터 수집 - 데이터와 데이터 분석의 상관 관계 - 데이터 수집 시 고려사항 - Requests, BeautifulSoup #### 4-2. 웹크롤링을 통한 데이터 수집 - Scrapy 원리 및 사용법, 활용 실습 - Selenium 원리 및 사용법, 활용 실습 #### 4-3. API를 통한 데이터 수집 - API의 동작과정(OAuth 인증) - Open API를 이용한 데이터 수집, 활용실습 ### 5. 데이터 분석 핵심 다지기 3 (2025.02.06~2025.02.28: 128H) #### 5-1. EDA - EDA란? - 데이터 정제의 중요성 - 기초 통계량 확인(평균, 산포도, 분포 형태) - 결측치, 이상치 처리, 불균형 데이터 처리, 데이터 변환(범주화, 정규화) - 변수 선택, 상관분석, 차원축소(PCA) #### 5-2. 태블로 - 태블로란? - 태블로 퍼블릭 설치, 태블로 기본 사용법 - 버블차트(워드클라우드), 막대차트, 라인차트, 영역차트, 산점도, 박스플롯. 텍스트 테이블, 트리맵, 지도 시각화 - 데이터 결합(유니온, 조인, 관계, 블랜딩), 필터, 분석패널(보조선, 클러스터링, 예측) - 대시보드, 스토리 - 데이터 전처리 #### 5-3. 데이터 활용 및 과학 방법론: 머신러닝 - 머신러닝 개요, 주요개념 정리 - Regression: Linear, Polynomial, Ridge, Lasso, Logistic - Clustering: KNN, 군집분석, DBSCAN - Tree, Decision Tree, Ensemble, Grid Search, XGBoost, LightGBM - 모델 성능 평가, 교차검증 --- 여기까지는 기존 강사가 진행함 --- ### 6. 데이터 분석 모델링 (40H) - 인공지능을 활용한 데이터 분석 모델링 - [데이터 분석 모델링 개요](/materials/P03_1-6-1_Analysis_Modeling) - 데이터 분석 모델 설계 - 데이터 분석 기법의 적용 - 데이터 분석 결과 해석 - 인공지능 기술의 활용 ### 7. 데이터 분석 핵심 다지기 4 (24H) - 데이터 활용 및 과학 방법론: 생성형 AI - 생성형 AI - 생성형 AI 개요 - 생성형 AI의 기본 원리 - 기반 모델의 소개 - 자동 인코더(Autoencoder) - 변이형 자동 인코더(Variational Autoencoder, VAE) - 생성적 적대 신경망(Generative Adversarial Network, GAN) - GAN 모델의 이해 - 생성형 AI와 데이터 분석 - 데이터 증강 - 생성형 AI를 활용한 데이터 분석 - 생성형 AI를 활용한 예측 모델링 ### 8. 미드 프로젝트 (48H) - 데이터 대시보드 구현 ### 9. 파이널 프로젝트 (112H) - 머신러닝 / 딥러닝을 활용한 데이터 분석 ### 10. 데이터톤 프로젝트 (168H) - 대시보드 및 분석법을 활용한 데이터 분석 리포트 작성 ### 11. 데이터톤 프로젝트 발표 및 종강 (5H) - 데이터톤 프로젝트 발표 - 종강