TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB
Abstract: Information
Retrieval berdasarkan query tertentu sudah jamak ditemukan pada sistem komputer
saat ini. Salah satu metode yang populer digunakan adalah perangkingan dokumen
menggunakan space vector model berbasis pada nilai term weighting TF.IDF. Pada
penelitian ini, terdapat beberapa buku berbahasa Arab yang memiliki puluhan
bahkan ratusan halaman. Masing-masing halaman dari buku tersebut adalah sebuah
dokumen yang akan diranking berdasarkan query dari pengguna. TF.IDF hanya
melakukan pembobotan berbasis pada dokumen tanpa memperhatikan indeks buku dan
kelas yang merupakan induk dokumen tersebut sehingga kinerjanya kurang maksimal
jika diimplementasikan pada kasus ini. Oleh karena itu, diusulkan metode baru
term weighting yang berbasis pada indeks buku dan kelas. Metode ini
memperhatikan frekuensi kemunculan term pada keseluruhan buku dan kelas. Metode
yang disebut inverse class frequency (ICF) dan inverse book frequency (IBF) ini
digabungkan dengan metode sebelumnya sehingga menjadi TF.IDF.ICF.IBF. Pengujian
metode ini menggunakan dataset dari beberapa e-book berbahasa arab. Hasil
penelitian menunjukkan bahwa metode yang diajukan terbukti dapat diaplikasikan
pada perangkingan dokumen berbahasa arab dan memiliki performa yang lebih bagus
dibanding metode sebelumnya dengan nilai F-Measure 75%, precision 76%, dan
recall mencapai 74%.
Penulis: M. Ali Fauzi
Kode Jurnal: jptkomputerdd140388