Penentuan Gender Otomatis Berdasarkan Isi Microblog Memanfaatkan Fitur Sosiolinguistik
Abstract: Penentuan gender
secara otomatis dapat bermanfaat untuk kepentingan forensik dan komersial. Penelitian ini membahas penentuan gender
pengguna secara otomatis berdasarkan isi microblog (Twitter) yang ditulis dalam
Bahasa Indonesia dengan memanfaatkan fitur sosiolinguistik. Dilakukan
pengukuran akurasi model klasifikasi untuk tiga jenis fitur: leksikal,
sosiolinguistik dan kombinasi keduanya. Fitur leksikal menghasilkan akurasi
84.94%, dan sosiolinguistik 83.01%. Hasil terbaik dengan akurasi 86.22% didapat dengan kombinasi kedua fitur
tersebut. Ditemukan beberapa perbedaan aspek sosiolinguistik antara Bahasa
Indonesia dengan Bahasa Inggris.
Penulis: Yudi Wibisono, Naufal
Faruqi
Kode Jurnal: jptinformatikadd130138