Skip to content

songys/Kaggle_NLP_Song

Repository files navigation

Kaggle_NLP_Song

Kaggle compitition

캐글에 나왔던 자연어처리 관련 대회 전체 자료 보관

==========================

선수 학습

파이썬 기초 외 :

Charles

캐글 입문:

corazzon 깃헙 동영상 강의

==========================

Lecture Description kaggle code&data etc
1 word2vec nlp tutorial 위드투백 튜토리얼 English_data

code1_description

code2_More_fun.ipynb

python 3 으로 작업
2 sentiment analysis on movie reviews 영화평 감성분석 English_data

Korean_data

English_code

Korean_code

긍정과 부정으로 레이블
3 jigsaw toxic comment classification challenge 약평분류 English_data

Korean_data

English_code

Korean_code

toxic, severe_toxic, obscene, threat, insult, identity로 레이블 되어 있는 위키피디아 데이터를 분류하는 대회입니다. 한국어는 Naver sentiment movie corpus에서 약 2만개를 핸드 레이블로 toxic, obscene, threat, insult, identity로 5단계로 분류하였습니다
4 quora-question-pairs 두 개의 질문이 같은가, 다른가 English_data

Korean_data

English_code

korean_code

네이버 지식인과 비슷한 싸이트인 Quora에 올라오는 질문들을 두 개씩 비교해서 같은 질문인지 아닌지 맞추는 대회입니다. 한국어 데이터는 6888개의 train 데이터와 688개 test data를 질문 페어로 만들어서 분석했습니다.
5 tensorflow speech recognition challenge 텐서플로우로 음성인식 English_data

[Korean_data]

English_code

참가자 발표 동영상을 참고하세요

Releases

No releases published

Packages

No packages published