Klasifikasi Teks Bahasa Bali dengan Metode Information Gain dan Naive Bayes Classifier

ABSTRACT: Ketersediaan dokumen teks bahasa Bali yang meningkat jumlahnya membuat proses pencarian informasi pada dokumen teks berbahasa Bali menjadi semakin sulit. Mengklasifikasikanya secara manual menjadi tidak efisien mengingat peningkatan jumlah dokumen yang semakin banyak. Pada penelitian ini dikembangkan sebuah aplikasi yang dapat mengklasifikasikan teks bahasa Bali ke dalam kategori yang ditentukan. Aplikasi ini menggunakan metode klasifikasi Naive Bayes Classifier (NBC) dan metode Information Gain(IG) untuk seleksi fitur. Aplikasi ini diuji dengan teknik cross validation. Hasilnya adalah nilai rata-rata akurasi dari 10 fold cross validation sebesar  95,22%.
KEYWORDS: information gain; naive bayes classifier; text mining; cross validation
Penulis: Ida Bagus Gede Widnyana Putra, Made Sudarma, I Nyoman Satya Kumara
Kode Jurnal: jptlisetrodd160290

Artikel Terkait :