IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI
ABSTRAK: Sistem temu
kembali informasi merupakan
sistem yang digunakan
untuk menemukan informasi yang
relevan dengan kebutuhan
dari penggunanya secara
otomatis berdasarkan kesesuaian
dengan query dari suatu koleksi
informasi. Penelitian ini bertujuan untuk mengenal karakteristik beberapa
notasi pembobotan TF-IDF
serta mengimplementasikan model
ruang vektor menggunakan beberapa
notasi pada metode
pembobotan TF-IDF pada
sistem temu kembali informasi.
Notasi TF-IDF yang
digunakan pada penelitian
ini adalah anc.ntc,
lnc.ltc dan ltc.ltc. Pada
Model Ruang Vektor, pembobotan term dilakukan disisi dokumen dan
query. Pembobotan yang dihasilkan pada algoritma TF-IDF akan menjadi variabel dalam perhitungan cosine similarity.
Hasil dari cosine
similarity pada masing-masing
dokumen terhadap query akan diurutkan secara descending, sehingga hasil pencarian akan
menampilkan dokumen yang paling
mendekati kata kunci.
Sistem ini dikembangkan
menggunakan bahasa pemrograman PHP dan
dokumen yang digunakan
sebagai data uji
sebanyak 50 artikel
berita yang penulis kutip
dari beberapa situs
di internet. Penelitian
ini telah berhasil
mengimplementasikan vector space
model dan tiga notasi pembobotan TF-IDF. Hasil dari penelitian ini menunjukkan
bahwa tiap notasi pembobotan
TF-IDF memiliki karekteristik
yang berbeda-beda dan
menghasilkan urutan dokumen relevan yang berbeda, antara notasi satu
dengan notasi lainnya.
Penulis: Oka Karmayasa dan Ida
Bagus Mahendra
Kode Jurnal: jptkomputerdd120100