Dataset yang digunakan adalah review produk face wash dari aplikasi Female Daily. Dataset didapatkan dari hasil crawling pada website www.review.femaledaily.com. ] Jumlah dataset yang digunakan adalah sebanyak 500 data berbahasa indonesia dan preprocessing dilakukan secara mandiri.
Proses preprocessing yang dilakukan sejumlah 6 preprocessing, yaitu: a. Penghapusan Stop Word b. Penanganan Emoji c. Penanganan Punctuation d. Stemming e. Penanganan Negative Words f. Tokenization
Pemilihan fitur dan ekstraksi fitur menggunakan dua cara, yaitu: a. Contains Words (native) b. TF-IDF (library)
Klasifikasi Teks untuk menentukan sentimen dari data menggunakan Naive Bayes Classifier.
TIM:
- Chlaudiah Julinar
- Vina Fadriani Effendi