IMPLEMENTASI ALGORITMA RABIN-KARP UNTUK MENDETEKSI DUGAAN PLAGIARISME BERDASARKAN TINGKAT KEMIRIPAN KATA PADA DOKUMEN TEKS

ABSTRAK: Plagiarisme merupakan tindakan mengutip ataupun menafsirkan pemikiran-pemikiran atau pekerjaan orang lain yang dicakupkan atau dimasukkan ke dalam sebuah karya dengan metode penulisan yang kurang tepat atau tidak sesuai dengan disiplin atau aturan akademik yang berlaku. Cara untuk mengurangi plagiarisme bisa dilakukan dengan mencegah maupun mendeteksinya menggunakan tingkat kemiripan sebagai bahan pertimbangan. Pemanfaat Rabin-Karp sebagai algoritma pencocokan string dengan metode pencarian jamak mampu untuk mendeteksi dugaan plagiarisme berdasarkan tingkat kemiripan. Hasil dari penelitan ini adalah pendekatan matematis untuk mendapatkan nilai k-grams dan modulo yang ideal. Fungsi modus dipilih untuk menghitung nilai k-grams pada proses parsing dan pendekatan bilangan prima terbesar untuk menghitung nilai modulo pada proses hashing sesuai dengan hasil pengujian terhadap 7 data set dengan 2 varian dan 3 kali perlakuan baik dengan ataupun tanpa stemming. Hasil pengujian menunjukan bahwa fungsi modus mampu menghasilkan rata-rata nilai similarity 3,544% di atas fungsi mean dan 2,859% di atas fungsi median pada pengujian tanpa menggunakan stemming, dan 2,456% di atas fungsi mean serta 0,75% di atas fungsi median untuk pengujian yang menggunakan stemming, sedangkan pendekatan bilangan prima terbesar memiliki rata-rata selisih waktu yang lebih baik yaitu 2,04 detik terhadap sistem manual dengan nilai modulo yang kecil tanpa menggunakan stemming, dan 0,13 detik terhadap sistem manual yang menggunakan stemming, sedangkan dengan menggunakan nilai modulo yang sama sistem manual memiliki durasi yang lebih baik yaitu 0,07 detik dibandingkan sistem otomatis tanpa menggunakan stemming dan 0,06 detik pada pengujian yang menggunakan stemming, namun sistem yang menggunakan perhitungan bilangan prima tetap efektif karena mampu mencegah terjadinya quadratic.
Kata kunci: plagiarisme, sistem otomatis, k-grams ideal, modulo ideal, parsing, hashing, stemming, RabinKarp
Penulis: Pingky Alfa Ray Leo Lede
Kode Jurnal: jptkomputerdd140289

Artikel Terkait :