IMPLEMENTASI ALGORITMA RABIN-KARP UNTUK MENDETEKSI DUGAAN PLAGIARISME BERDASARKAN TINGKAT KEMIRIPAN KATA PADA DOKUMEN TEKS
ABSTRAK: Plagiarisme merupakan
tindakan mengutip ataupun menafsirkan pemikiran-pemikiran atau pekerjaan orang
lain yang dicakupkan atau dimasukkan ke dalam sebuah karya dengan metode
penulisan yang kurang tepat atau tidak sesuai dengan disiplin atau aturan
akademik yang berlaku. Cara untuk mengurangi plagiarisme bisa dilakukan dengan
mencegah maupun mendeteksinya menggunakan tingkat kemiripan sebagai bahan
pertimbangan. Pemanfaat Rabin-Karp sebagai algoritma pencocokan string dengan
metode pencarian jamak mampu untuk mendeteksi dugaan plagiarisme berdasarkan
tingkat kemiripan. Hasil dari penelitan ini adalah pendekatan matematis untuk
mendapatkan nilai k-grams dan modulo yang ideal. Fungsi modus dipilih untuk
menghitung nilai k-grams pada proses parsing dan pendekatan bilangan prima
terbesar untuk menghitung nilai modulo pada proses hashing sesuai dengan hasil
pengujian terhadap 7 data set dengan 2 varian dan 3 kali perlakuan baik dengan
ataupun tanpa stemming. Hasil pengujian menunjukan bahwa fungsi modus mampu
menghasilkan rata-rata nilai similarity 3,544% di atas fungsi mean dan 2,859%
di atas fungsi median pada pengujian tanpa menggunakan stemming, dan 2,456% di
atas fungsi mean serta 0,75% di atas fungsi median untuk pengujian yang menggunakan
stemming, sedangkan pendekatan bilangan prima terbesar memiliki rata-rata
selisih waktu yang lebih baik yaitu 2,04 detik terhadap sistem manual dengan
nilai modulo yang kecil tanpa menggunakan stemming, dan 0,13 detik terhadap
sistem manual yang menggunakan stemming, sedangkan dengan menggunakan nilai
modulo yang sama sistem manual memiliki durasi yang lebih baik yaitu 0,07 detik
dibandingkan sistem otomatis tanpa menggunakan stemming dan 0,06 detik pada
pengujian yang menggunakan stemming, namun sistem yang menggunakan perhitungan
bilangan prima tetap efektif karena mampu mencegah terjadinya quadratic.
Kata kunci: plagiarisme,
sistem otomatis, k-grams ideal, modulo ideal, parsing, hashing, stemming,
RabinKarp
Penulis: Pingky Alfa Ray Leo
Lede
Kode Jurnal: jptkomputerdd140289