IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

ABSTRAK: Sistem  temu  kembali  informasi  merupakan  sistem  yang  digunakan  untuk  menemukan informasi  yang  relevan  dengan  kebutuhan  dari  penggunanya  secara  otomatis  berdasarkan kesesuaian dengan  query dari suatu koleksi informasi. Penelitian ini bertujuan untuk mengenal karakteristik  beberapa  notasi  pembobotan  TF-IDF  serta  mengimplementasikan  model  ruang vektor  menggunakan  beberapa  notasi  pada  metode  pembobotan  TF-IDF  pada  sistem  temu kembali  informasi.  Notasi  TF-IDF  yang  digunakan  pada  penelitian  ini  adalah  anc.ntc,  lnc.ltc dan  ltc.ltc.  Pada  Model  Ruang  Vektor, pembobotan  term dilakukan disisi dokumen  dan  query. Pembobotan yang dihasilkan pada algoritma TF-IDF  akan menjadi variabel dalam perhitungan cosine  similarity.  Hasil  dari  cosine  similarity  pada  masing-masing  dokumen  terhadap  query akan diurutkan secara  descending, sehingga hasil pencarian akan menampilkan dokumen yang paling  mendekati  kata  kunci.  Sistem  ini  dikembangkan  menggunakan  bahasa  pemrograman PHP  dan  dokumen  yang  digunakan  sebagai  data  uji  sebanyak  50  artikel  berita  yang  penulis kutip  dari  beberapa  situs  di  internet.  Penelitian  ini  telah  berhasil  mengimplementasikan  vector space model dan tiga notasi pembobotan TF-IDF. Hasil dari penelitian ini menunjukkan bahwa tiap  notasi  pembobotan  TF-IDF  memiliki  karekteristik  yang  berbeda-beda  dan  menghasilkan urutan dokumen relevan yang berbeda, antara notasi satu dengan notasi lainnya. 
Kata Kunci: Model Ruang Vektor, TF-IDF, Sistem temu kembali informasi
Penulis: Oka Karmayasa dan Ida Bagus Mahendra
Kode Jurnal: jptkomputerdd120100

Artikel Terkait :