PENGARUH STOPWORD TERHADAP PERFORMA KLASIFIKASI TWEET BERBAHASA INDONESIA
ABSTRACT: Data tweet telah
banyak dimanfaatkan dalam penelitian di bidang text mining. Salah satu
diantaranya adalah dalam klasifikasi teks. Namun, sebagian besar data tweet
merupakan data yang masih kotor dan mengandung banyak noise di dalamnya. Oleh
karena itu, pemrosesan awal terhadap tweet sangat penting untuk dilakukan.
Salah satu metode pemrosesan awal yang dilakukan untuk mereduksi noise dalam
tweet adalah stopword removal. Lebih lanjut penelitian ini akan melakukan
perbandingan hasil akurasi antara pemrosesan awal yang melibatkan proses
penghapusan stopword dengan permosesan awal yang tanpa melibatkan stopword
removal. Hal ini dilakukan untuk mengetahui signifikansi tahapan stopword
removal dalam klasifikasi teks berbahasa Indonesia. Dalam penelitian ini,
dilakukan dua model pemrosesan awal dimana salah satu proses melibatkan
stopword removal dan proses yang lainnya tanpa melakukan stopword removal.
Hasil eksperimen menunjukkan bahwa melakukan penghapusan stopword dalam
pre-processing mampu meningkatkan performa klasifikasi yang dibuktikan dengan
adanya peningkatan akurasi.
Penulis: Ahmad Fathan
Hidayatullah
Kode Jurnal: jptinformatikadd160736