경마 데이터 분석을 통한 경마 경기 결과 예측
경마의 다양한 데이터를 사용하여 코로나로 축소됬던 경마 산업을 살리기 위하여 쉽게 접근 할수 있는 경마 결과 예측 모델을 만드는 것
- 출처 : 마사회 (http://kra.co.kr/)
- 기간 : 2022.11.11 ~ 2022.11.14
- 수집 내용
- 부마 / 모마 데이터
- 경주마 등급 데이터
- 경주마 경기 성적 데이터
- 현직 경주마 목록 데이터
- 조교사 데이터
- 기수 데이터
이름 | 역할 |
---|---|
심재만 | 데이터 크롤링 및 모델링 |
권효은 | 데이터 전처리 및 시각화, 모델링, 발표자료 제작 |
박재원 | 데이터 크롤링 및 모델링 |
이승희 | (PM)데이터 전처리 및 시각화 |
정진명 | 데이터 전처리 및 모델링 |
최규광 | 데이터 크롤링 및 시각화 |
Scoring / Null 처리 / Scaling / Encoding
경마 경기 결과를 예측하는 모델을 만들기 때문에, 예측 결과가 얼마나 정확한지가 중요 -> Precision
원래 여러 모델을 Voting해서 결정하기로 하였으나 다른 모델들의 과적합이 너무 심해서 RandomForest 모델만을 사용