Garuda - Garba Rujukan Digital

JUSTIN (Jurnal Sistem dan Teknologi Informasi)

Vol 5, No 2 (2017)

Halim, Agustino (Unknown)
Nyoto, Rudy Dwi (Unknown)
Safriadi, Novi (Unknown)

Publish Date
23 Feb 2017

Untuk mendapatkan dan menyaring informasi yang dibutuhkan, pengguna Internet dapat menggunakan mesin pencarian (search engine) yang telah tersedia, misalnya Google, Yahoo, Bing, DuckDuckGo dan lain sebagainya. Mesin pencari tersebut melakukan pencarian berdasarkan kata kunci yang dimasukkan oleh pengguna, selanjutnya mencocokkan kata kunci dengan isi konten yang tersebar di Internet. Sehubungan dengan keterbatasan sumber daya komputasi dan waktu, maka dibutuhkan suatu cara untuk mengambil konten yang ada di Internet dalam waktu yang singkat dan dapat diindeks secara otomatis serta tersimpan pada database. Untuk memudahkan pengambilan informasi yang tersebar dan selalu berubah-ubah di Internet dalam jumlah besar diperlukan sebuah web crawler. Fungsi utama Web Crawler adalah melakukan penjelajahan dan pengambilan halaman-halaman web yang ada di Internet. Tujuan penelitian ini adalah menghasilkan aplikasi web crawler untuk menghasilkan dokumen teks pada domain tertentu dalam bidang Teknik Informatika atau komputer dan sejenisnya. Pengujian dilakukan dengan metode Black Box dengan teknik robustness testing, pengujian precision and recall serta pengujian F-Measure. Berdasarkan hasil pengujian, didapatkan nilai Recall sebesar 0,99 dan Precision sebesar 0,61 serta F-Measure sebesar 0,74.

Citation Download

EndNote, Reference Manager, ProCite

Latex, Jabref

805.197 KB

Check in Google Scholar

Journal Info

JUSTIN (Jurnal Sistem dan Teknologi Informasi)

Website

Abbrev

justin

Publisher

Universitas Tanjungpura

Subject

Computer Science & IT

Description

JUSTIN aims to publish research results and thoughts among academics, researchers, scientists, and practitioners in the field of informatics/computer science so that they are freely available to the public, and support the exchange of knowledge. The scope of JUSTIN is but is not limited to the ...

Article Info

Abstract

Perancangan Aplikasi Web Crawler untuk Menghasilkan Dokumen Teks pada Domain Tertentu

Article Info

Abstract