JUSTIN (Jurnal Sistem dan Teknologi Informasi)
Vol 5, No 2 (2017)

Perancangan Aplikasi Web Crawler untuk Menghasilkan Dokumen Teks pada Domain Tertentu

Halim, Agustino (Unknown)
Nyoto, Rudy Dwi (Unknown)
Safriadi, Novi (Unknown)



Article Info

Publish Date
23 Feb 2017

Abstract

Untuk mendapatkan dan menyaring informasi yang dibutuhkan, pengguna Internet dapat menggunakan mesin pencarian (search engine) yang telah tersedia, misalnya Google, Yahoo, Bing, DuckDuckGo dan lain sebagainya. Mesin pencari tersebut melakukan pencarian berdasarkan kata kunci yang dimasukkan oleh pengguna, selanjutnya mencocokkan kata kunci dengan isi konten yang tersebar di Internet. Sehubungan dengan keterbatasan sumber daya komputasi dan waktu, maka dibutuhkan suatu cara untuk mengambil konten yang ada di Internet dalam waktu yang singkat dan dapat diindeks secara otomatis serta tersimpan pada database. Untuk memudahkan pengambilan informasi yang tersebar dan selalu berubah-ubah di Internet dalam jumlah besar diperlukan sebuah web crawler. Fungsi utama Web Crawler adalah melakukan penjelajahan dan pengambilan halaman-halaman web yang ada di Internet. Tujuan penelitian ini adalah menghasilkan aplikasi web crawler untuk menghasilkan dokumen teks pada domain tertentu dalam bidang Teknik Informatika atau komputer dan sejenisnya. Pengujian dilakukan dengan metode Black Box dengan teknik robustness testing, pengujian precision and recall serta pengujian F-Measure. Berdasarkan hasil pengujian, didapatkan nilai Recall sebesar 0,99 dan Precision sebesar 0,61 serta F-Measure sebesar 0,74.

Copyrights © 2017






Journal Info

Abbrev

justin

Publisher

Subject

Computer Science & IT

Description

JUSTIN aims to publish research results and thoughts among academics, researchers, scientists, and practitioners in the field of informatics/computer science so that they are freely available to the public, and support the exchange of knowledge. The scope of JUSTIN is but is not limited to the ...