Meningkatkan Akurasi Pada Mesin Penerjemah Bahasa Indonesia Ke Bahasa Melayu Pontianak Dengan Part Of Speech
Abstract: Bahasa merupakan
alat komunikasi yang dijadikan sarana untuk berinteraksi dengan masyarakat
sekitar. Kemampuan akan penguasaan banyak bahasa tentunya akan mempermudah
untuk berinteraksi dengan orang lain dari berbagai daerah yang berbeda. Oleh
karena itu, diperlukan penerjemah untuk menambah pengetahuan akan berbagai
bahasa yang ada. Mesin Penerjemah Statistik (Statistical Machine Translation)
merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang
dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari
hasil analisis korpus paralel. Korpus paralel adalah pasangan korpus yang
berisi kalimat-kalimat dalam suatu bahasa dan terjemahannya. Salah satu fitur
yang digunakan untuk meningkatkan akurasi hasil terjemahan adalah dengan fitur
part of speech (PoS). Tujuan yang ingin dicapai dalam penelitian ini adalah
melakukan penggunaan fitur PoS pada mesin penerjemah statistik bahasa Indonesia
ke bahasa Melayu Pontianak untuk meningkatkan nilai akurasi hasil terjemahan. Pengujian
dilakukan dengan membandingkan nilai akurasi hasil terjemahan sebelum dan
setelah penggunaan PoS. Penelitian menggunakan korpus paralel sebanyak 3050
korpus. Pengujian dilakukan dengan dua cara, yaitu pengujian otomatis
menggunakan Bilingual Evaluation Understudy (BLEU) dan pengujian oleh ahli
bahasa Melayu Pontianak. Dari hasil penelitian, penggunaan PoS dapat
meningkatkan kualitas terjemahan untuk mesin penerjemah bahasa Indonesia ke
bahasa Melayu Pontianak. Hal itu terlihat dari hasil pengujian dengan
menambahkan fitur PoS terdapat peningkatan nilai BLEU sebesar 0.6% pada
pengujian otomatis dan 21.67% pada pengujian oleh ahli bahasa. Berdasarkan hal
tersebut, mesin penerjemah statistik bahasa Indonesia ke bahasa Melayu
Pontianak dengan penggunaan fitur PoS dapat meningkatkan nilai akurasi hasil
terjemahan.
Kata Kunci: PoS, mesin
penerjemah statistik, korpus paralel, BLEU score, Indonesia, Melayu Pontianak
Penulis: Danny Indrayana
Kode Jurnal: jptinformatikadd160302