- 안지민(팀장), 김예원, 김영서, 정은혜
- 강좌소개
- 파이썬 기반의 머신러닝과 생태계 이해
- 머신러닝의 개념
- 파이썬 기반 머신러닝의 특징 및 장점과 구성요소
- 파이썬 기반 머신러닝을 위한 SW 설치
- 주피터 노트북 사용법과 넘파이/판다스의 필요성
- 강의에 사용될 예제 소스 코드 다운로드 받기
- 넘파이 배열 ndarray 소개
- 넘파이 배열 ndarray 초기화 방법과 ndarray 차원과 크기를 변경하는 reshape()의 이해
- 넘파이 ndarray 의 인덱싱을 통한 데이터 세트 선택하기 - 01
- 넘파이 ndarray 의 인덱싱을 통한 데이터 세트 선택하기 - 02
- 넘파이 ndarray의 정렬과 선형대수 연산
- 파이썬 기반의 머신러닝과 생태계 이해
11. 판다스 개요와 기본 API-01
12. 판다스 개요와 기본 API-02
13. 판다스 DataFrame의 변환, 컬럼 세트 생성/수정, 삭제 및 Index 객체 소개
14. 판다스 데이터 셀렉션과 필터링 - 01
15. 판다스 데이터 셀렉션과 필터링 - 02
16. 판다스 Aggregation 함수와 Group by 수행
17. 판다스 결손 데이터 처리하기
18. 판다스 람다식 적용하여 데이터 가공하기
19. 파이썬 기반의 머신러닝과 생태계 이해 Summary
- 사이킷런으로 시작하는 머신러닝
- 사이킷런 소개와 첫번째 머신러닝 애플리케이션 만들어보기 -붓꽃 품종 예측
- 사이킷런의 기반 프레임 워크 익히기
- 학습과 테스트 데이터 세트의 분리
- 교차검증 - K-fold와 Stratified K-fold
- 교차검증 성능평가 cross_val_score()와 하이퍼 파라미터 튜닝을 위한 GridSearchCV
- 데이터 전처리 - 인코딩과 스케일링 - 01
- 데이터 전처리 - 인코딩과 스케일링 - 02
- 사이킷런으로 수행하는 타이타닉 생존자 예측
- 평가
- 분류 성능 평가지표 개요와 정확도 소개
- 오차행렬, 정밀도, 재현율 소개
- 정밀도와 재현율의 트레이드 오프-01
- 정밀도와 재현율의 트레이드 오프-02
- F1 Score와 ROC-AUC 소개
- 평가 실습 - 피마 인디언 당뇨병 예측