Ekstraksi Informasi Halaman Web Menggunakan Pendekatan Bootstrapping pada Ontology-Based Information Extraction
Abstrak: Ekstraksi informasi
merupakan suatu bidang ilmu untuk pengolahan bahasa alami, dengan cara mengubah
teks tidak terstruktur menjadi informasi dalam bentuk terstruktur. Berbagai
jenis informasi di Internet ditransmisikan secara tidak terstruktur melalui
website, menyebabkan munculnya kebutuhan akan suatu teknologi untuk menganalisa
teks dan menemukan pengetahuan yang relevan dalam bentuk informasi terstruktur.
Contoh informasi tidak terstruktur adalah informasi utama yang ada pada konten
halaman web. Bermacam pendekatan untuk ekstraksi informasi telah dikembangkan
oleh berbagai peneliti, baik menggunakan metode manual atau otomatis, namun
masih perlu ditingkatkan kinerjanya terkait akurasi dan kecepatan ekstraksi.
Pada penelitian ini diusulkan suatu penerapan pendekatan ekstraksi informasi
dengan mengkombinasikan pendekatan bootstrapping dengan Ontology-based
Information Extraction (OBIE). Pendekatan bootstrapping dengan menggunakan
sedikit contoh data berlabel, digunakan untuk memimalkan keterlibatan manusia
dalam proses ekstraksi informasi, sedangkan penggunakan panduan ontologi untuk
mengekstraksi classes (kelas), properties dan instance digunakan untuk
menyediakan konten semantik untuk web semantik. Pengkombinasian kedua
pendekatan tersebut diharapkan dapat meningkatan kecepatan proses ekstraksi dan
akurasi hasil ekstraksi. Studi kasus untuk penerapan sistem ekstraksi informasi
menggunakan dataset “LonelyPlanet”.
Kata kunci: Ekstraksi
informasi, ontologi, bootstrapping, Ontology-Based Information Extraction,
OBIE, kinerja
Penulis: Erma Susanti, Khabib
Mustofa
Kode Jurnal: jptinformatikadd150262