==========================
파이썬 기초 외 :
캐글 입문:
==========================
Lecture | Description | kaggle | code&data | etc |
---|---|---|---|---|
1 | word2vec nlp tutorial | 위드투백 튜토리얼 | English_data | python 3 으로 작업 |
2 | sentiment analysis on movie reviews | 영화평 감성분석 | English_data | 긍정과 부정으로 레이블 |
3 | jigsaw toxic comment classification challenge | 약평분류 | English_data | toxic, severe_toxic, obscene, threat, insult, identity로 레이블 되어 있는 위키피디아 데이터를 분류하는 대회입니다. 한국어는 Naver sentiment movie corpus에서 약 2만개를 핸드 레이블로 toxic, obscene, threat, insult, identity로 5단계로 분류하였습니다 |
4 | quora-question-pairs | 두 개의 질문이 같은가, 다른가 | English_data | 네이버 지식인과 비슷한 싸이트인 Quora에 올라오는 질문들을 두 개씩 비교해서 같은 질문인지 아닌지 맞추는 대회입니다. 한국어 데이터는 6888개의 train 데이터와 688개 test data를 질문 페어로 만들어서 분석했습니다. |
5 | tensorflow speech recognition challenge | 텐서플로우로 음성인식 | English_data [Korean_data] |
참가자 발표 동영상을 참고하세요 |