PENERAPAN ALGORITMA TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF) UNTUK TEXT MINING
Abstract: Algoritma
Term Frequency Inverse-Document Frequency merupakan suatu algoritma yang
menggalikan antara Term frequency dengan Inverse Document Frequency. Term
frequency yaitu jumlah kemunculan sebuah term pada sebuah dokumen. Inverse
Document Frequency yaitu pengurangan dominasi term yang sering muncul
diberbagai dokumen, dengan memperhitungkan kebalikan frekuensi dokumen yang
mengandung suatu kata.
Text Mining pada umumnya adalah unstructured data, atau minimal
semistructured. Maka merupakan tantangan tambahan pada text mining yaitu
struktur teks yang kompleks dan tidak lengkap, arti yang tidak jelas dan tidak
standard, dan bahasa yang berbeda ditambah translasi yang tidak akurat.
Hasil dari penelitian menunjukan bahwa, penerapkan algoritma term
frequency inverse-document frequency untuk text mining sangat membantu
pengguna. untuk mendapatkan informasi pada kumpulan dokumen. Dengan format file
txt berdasarkan kata kunci yang dimasukan oleh pengguna pada sistem. Dengan
koleksi uji kata ‘upaya’ pada query maka didapatkan keluaran dengan bobot nilai
8.65441 yang merupakan jumlah kata terbanyak sesuai dengan query.
Penulis: Musfiroh Nurjannah,
Hamdani, Indah Fitri Astuti
Kode Jurnal: jptinformatikadd130388