Algoritma Ekstraksi Informasi Berbasis Aturan

Abstrak: Informasi  yang  terdapat  dalam  Laporan  Hasil Pemeriksaan  (LHP)  BPK  RI  saat  ini  belum  di-manaje  dengan baik  secara  digital.  Informasi  yang  terdapat  dalam  LHP  yang terdapat  pada  33  provinsi  sampai  saat  ini  hanya  terkumpul  di satu  tempat  tanpa  ada  proses  selanjutnya  untuk  mengambil informasi  inti  dalam  laporan  tersebut.  Ketiadaan  aplikasi pencarian informasi menghambat proses pembelajaran terhadap laporan-laporan  yang  ada  sebelumnya.  Oleh  karena  itu, diperlukan  sebuah  aplikasi  yang  mampu  melakukan  ekstraksi informasi  dari  sekumpulan  dokumen  LHP  untuk  dapat mengambil  data  inti  dari  dokumen  tersebut,  yaitu  criteria, akibat, sebab, tanggapan, dan saran pemeriksaan. Penelitian  ini  membuat  sebuah  tools  untuk  melakukan ekstraksi informasi  pada  dokumen Laporan Hasil Pemeriksaan (LHP)  atas  Laporan  Keuangan  Pemerintah  Daerah  (LKPD).Metode  yang  digunakan  dalam  penelitian  ini  adalah  rule-based classification, dan metode preprocessing yang digunakan adalah POS  Tagging.  Tujuan  ekstraksi  informasi  dalam  penelitian  ini adalah  mendapatkan  informasi  beberapa  bagian  penyusun  TP dalam  dokumen  LHP  LKPD,  yaitu  kriteria,  akibat,  sebab, tanggapan, dan saran pemeriksaan. Akurasi  dari  data  latih  dan  data  uji  masing-masing  adalah 98,27% dan 89,77%. Penurunan akurasi antara lain disebabkan oleh penggunaan aplikasi pdf2text yang tidak memberikan hasil konversi  yang  identik  antara  data  input  dan  output, serta penggunaan metode wordmatch untuk klasifikasi.
Kata kunci: LHP LKPD, ekstraksi informasi, klasifikasi, POS Tagging, rule-based classification
Penulis: Agny Ismaya
Kode Jurnal: jptlisetrodd140143

Artikel Terkait :