ANALISIS WEB SCRAPING UNTUK DATA BENCANA ALAM DENGAN MENGGUNAKAN TEKNIK BREADTH-FIRST SEARCH TERHADAP 3 MEDIA ONLINE
Abstract: Teknologi yang ada
saat ini memungkinkan seseorang untuk bekerja dengan mudah dan cepat. Salah
satunya dalam hal memperoleh informasi dari web. Proses pengambilan informasi
dari situs-situs web disebut dengan web scraping. Pada penelitian ini dilakukan
analisis web scraping terkait bencana alam dari 3 situs media online, yaitu
Detikcom, Liputan6, dan VivaNews. Fokus web scraping lebih kepada data yang
tidak terstruktur pada web, menjadi sebuah data yang dapat di analisis dan
disimpan. Data yang diambil dari media online berupa teks artikel dengan
keyword yang diinput sebagai parameternya, kemudian di ekstrak ke dalam format
Excel (.CSV) yang dilakukan dengan bantuan tool Web Content Extractor (WCE) dengan menggunakan teknik B r
e a d t h-First Search. Hasil yang didapat adalah data yang terstruktur berupa
tabel dengan beberapa field yaitu no, hari/tanggal, waktu posting, judul,
deskripsi, gambar, dan link halaman artikel. Berdasarkan analisis yang telah dilakukan,
media online Detikcom lebih banyak menghasilkan data yang relevan dibandingkan
dengan Liputan6 dan VivaNews, dan teknik B r e a d t h-First Search sangat membantu
dalam hal pencarian record dengan menelusuri URL utama hingga ke bagian terdalam
link.
Kata kunci: Web Scraping, Web
Mining, Media Online, Breadth-First Search
Penulis: Izatul Putri Sonya,
Prihandoko Prihandoko
Kode Jurnal: jptinformatikadd160514