Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen Skripsi
Abstrak: Banyaknya arsip
dokumen skripsi yang terkumpul dalam bentuk soft file yang tidak terklasifikasi
dengan baik mengakibatkan proses pencarian kembali menjadi sulit. Untuk
mengakses informasi yang dibutuhkan menjadi kurang cepat dan tepat apabila
keseluruhan dokumen disimpan dalam satu folder database. Maka dari itu
diperlukan suatu sistem yang dapat mengklasifikasikan dokumen secara otomatis ke
dalam folder berbeda pada database agar lebih mudah dalam mengelola dokumen
yang ada. Metode TF-IDF merupakan suatu cara untuk memberikan bobot hubungan
suatu kata (term) terhadap dokumen. Metode cosine similarity merupakan metode
untuk menghitung kesamaan antara dua buah objek yang dinyatakan dalam dua buah
vector dengan menggunakan keywords (kata kunci) dari sebuah dokumen sebagai
ukuran. Metode pengembangan sistem yang digunakan dalam penelitian ini adalah
model waterfall, sedangkan metode penelitian yang digunakan adalah metode
Research and Development (R&D). Data latih yang digunakan dalam penelitian
ini berjumlah 50 dokumen skripsi dengan beberapa kategori yang berbeda. Hasil penelitian
menunjukkan bahwa persentase tingkat ketepatan klasifikasi sistem adalah
sebesar 98%.
Penulis: Rizki Tri Wahyuni,
Dhidik Prastiyanto, dan Eko Supraptono
Kode Jurnal: jptlisetrodd170229