시민 데이터 과학

본격적인 데이터 과학을 다루기 전에 시민 데이터 과학자로 필요한 역량을 학습합니다.
저자
소속
공개

2023년 01월 25일

1 학습 내용

데이터 과학 교육과정

과정상세 데이터셋
1주차 - Introduction
- Defining and solving problems
- Quantifying performance indicators
- Stats and Probability for Data Science
2주차 - Data Science
- Python 기초 문법 복습 및 NumPy, Pandas 등 연습
- Kaggle: MPG / Titanic - Machine Learning from Disaster를 이용한 EDA의 개념과 Data science의 전체적인 Flow를 습득
- EDA, Feature engineering, Visualization, Correlating 등 Preprocessing 작업 수행
- Model, predict and evaluation 의 전체 과정을 습득
3주차 - Regression and Prediction
- Regression에 대한 개념 및 이론 설명 Breast Cancer, Boston housing, California housing prices, Bike-sharing-demand etc.
- EDA 및 preprocessing (Impute missing value, Turn categorical into booleans, scale the numerical variables, merge etc.)
- Linear Regression을 중심으로 설명하되, 추가적으로 CART, SVM, Ensemble기법 등을 적용
- Training & Evaluation (MSE, MAE, RMSE, RMSLE, R-Squared, etc.)
- Basic hyperparameter tuning 수행
4주차 - Classification and Hypothesis Testing
- Classification과 필요 개념 및 이론 설명 Titanic, Iris, Penuins, San Francisco Crime etc.
- EDA & preprocessing
- Logistic Regression과 Decision Tree를 중심으로 설명하되, 추가적으로 SVC, Random Forest, XGBoost, LGBM 등 적용
- Training & Evaluation (Accuracy, Precision, Recall, F1-score, Confusion Matrix, Cross-validation, etc.)
- Basic hyperparameter tuning 수행
5주차 - Case Studies and Projects
- 기존 수업에서 다루었던 이론/실습 개념을 바탕으로 한 Case Study 3종 (+Final Quiz)
- Case Study 및 Final Quiz 해설
- 개인 별 Project 인터뷰 및 Grouping / 공통과제 선정
- Project 진행, 발표, Best Project 선정 및 공유