ANALISIS WEB SCRAPING UNTUK DATA BENCANA ALAM DENGAN MENGGUNAKAN TEKNIK BREADTH-FIRST SEARCH TERHADAP 3 MEDIA ONLINE

Abstract: Teknologi yang ada saat ini memungkinkan seseorang untuk bekerja dengan mudah dan cepat. Salah satunya dalam hal memperoleh informasi dari web. Proses pengambilan informasi dari situs-situs web disebut dengan web scraping. Pada penelitian ini dilakukan analisis web scraping terkait bencana alam dari 3 situs media online, yaitu Detikcom, Liputan6, dan VivaNews. Fokus web scraping lebih kepada data yang tidak terstruktur pada web, menjadi sebuah data yang dapat di analisis dan disimpan. Data yang diambil dari media online berupa teks artikel dengan keyword yang diinput sebagai parameternya, kemudian di ekstrak ke dalam format Excel (.CSV) yang dilakukan dengan bantuan tool Web Content  Extractor (WCE) dengan menggunakan teknik B r e a d t h-First Search. Hasil yang didapat adalah data yang terstruktur berupa tabel dengan beberapa field yaitu no, hari/tanggal, waktu posting, judul, deskripsi, gambar, dan link halaman artikel. Berdasarkan analisis yang telah dilakukan, media online Detikcom lebih banyak menghasilkan data yang relevan dibandingkan dengan Liputan6 dan VivaNews, dan teknik B r e a d t h-First Search sangat membantu dalam hal pencarian record dengan menelusuri URL utama hingga ke bagian terdalam link.
Kata kunci: Web Scraping, Web Mining, Media Online, Breadth-First Search
Penulis: Izatul Putri Sonya, Prihandoko Prihandoko
Kode Jurnal: jptinformatikadd160514

Artikel Terkait :