Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama
Abstrak: Bahasa Jawa merupakan
salah satu bahasa daerah di Indonesia yang dipakai oleh sebagian besar penduduk
Indonesia. Bahasa Jawa memiliki tata bahasa yang kompleks karena menganut
nilai-nilai kesopanan yang ditentukan berdasarkan penggunaan dengan kata-kata
yang mengandung raos alus (rasa sopan). Setiap kata dalam Bahasa Jawa memiliki
jenis kata atau part of speech tertentu seperti halnya dengan bahasa-bahasa
lain. POS tagging merupakah bagian penting dari cakupan bidang ilmu Natural
Languange Processing (NLP). Penelitian ini menguji POS Tagging dengan Berbasis
Aturan dan distribusi probabilitas Maximum Entropy pada Bahasa Jawa Krama
menggunakan library OpenNLP untuk mengukur maximum entropy. Hasil yang
diperoleh adalah Maximum Entropy dan Rule Based dapat digunakan untuk POS Tagging
pada Bahasa Jawa Krama dengan akurasi tertinggi 97,67%.
Penulis: Hafiz Ridha
Pramudita, Ema Utami, Armadyah Amborowati
Kode Jurnal: jptinformatikadd160790