Penentuan Gender Otomatis Berdasarkan Isi Microblog Memanfaatkan Fitur Sosiolinguistik

Abstract: Penentuan gender secara otomatis dapat bermanfaat untuk kepentingan forensik dan komersial.  Penelitian ini membahas penentuan gender pengguna secara otomatis berdasarkan isi microblog (Twitter) yang ditulis dalam Bahasa Indonesia dengan memanfaatkan fitur sosiolinguistik. Dilakukan pengukuran akurasi model klasifikasi untuk tiga jenis fitur: leksikal, sosiolinguistik dan kombinasi keduanya. Fitur leksikal menghasilkan akurasi 84.94%, dan sosiolinguistik 83.01%. Hasil terbaik dengan akurasi  86.22% didapat dengan kombinasi kedua fitur tersebut. Ditemukan beberapa perbedaan aspek sosiolinguistik antara Bahasa Indonesia dengan Bahasa Inggris.
Kata Kunci: Microblog, Twitter, Gender, Sosiolinguistik, Klasifikasi Teks
Penulis: Yudi Wibisono, Naufal Faruqi
Kode Jurnal: jptinformatikadd130138

Artikel Terkait :