- 1992~2020년도 K-pop 아이돌 발매곡 데이터 셋을 이용한 NLP
- 팀 주제 : 특정 시대의 노래를 타깃으로 비슷한 분위기의 다른 세대 노래를 추천해주는 프로그램
팀원 | 역할 | 책임 |
---|---|---|
jiminAn(안지민) | 팀장, 모델 설계, UI 개발 | LDA 모델 초기 설계 및 pyqt5을 이용한 UI디자인 |
201810794(이은후) | 모델 설계 | K-means초기 설계 & LDA 모델 최종 설계 |
kky0426(김준영) | 데이터 전처리, 모델 설계 | 가사 전처리 및 LDA 모델 최종 설계 |
lee1996-ui(이선우) | 문서관리 | 프로젝트 최종 발표 및 ppt제작 |
: 간트차트
1. Final_Data_Crawling 파일
1992_1999_idol_get_id.ipynb
: 92~99년도 아이돌 고유 아이디 크롤링 코드idol_list_with_id.csv
: 92~99년도 멜론 아이디를 담은 csv 파일melon_song_data_crawling.ipynb
: 멜론에서 곡 정보 크롤링 코드k_pop_92_99.tsv
: 최종 92~99년도 곡 정보 tsv 파일
2. Final_LDA_Modeling 파일
preprocessing.ipynb
: 공통 전처리 코드(불용어 등)- LDA_
preprocess.ipynb
: LDA 모델에 맞는 형태로 데이터 전처리 코드 kpop_LDA_nva.ipynb
: 가사에서 명사/동사/형용사를 추출하여 LDA 모델링 및 시각화 코드
3. Final_LDA_Model_Training 파일
Model_training_try13.ipynb
: hyper-parameter 13개로 조정 후 테마 지정num=13.tsv
: 위 파일 실행 후 tsv형태로 저장한 파일 (곡별로 테마 열 추가된 형태)model_13.h5
: 학습시킨 모델을 저장한 파일
4. Final_Pyqt5_UI 파일
-
: 팀원들의 개인 코드 수정 및 초안 버전 코드 저장 공간, 자세한 내용은 각 폴더의 README 파일(LOG.md)을 참고할 것
: 온/오프라인으로 진행한 회의록을 yyyy_mm_dd.docx 파일로 정리하여 기록