Sebuah webpage selain berisi sekumpulan informasi utama (konten) juga mengandung konten presentasional yang digunakan untuk menampilkan isi informasi utama. Pada sebuah website, konten presentasional sebuah webpage cenderung mirip dengan konten presentasional dalam webpage lainnya di website tersebut. Meskipun mirip ataupun identik, setiap kali sebuah webpage dimuat dalam browser konten presentasional ini tetap mengalami proses pemuatan ulang. Jika kemiripan konten presentasional cukup besar, maka akan terjadi banyak pemborosan konten yang dimuat dari server. Penelitian ini bertujuan untuk mengembangkan perangkat lunak yang dapat menganalisis kemiripan sekelompok webpage dalam sebuah website. Data yang digunakan adalah kumpulan webpage dari sebuah website yang diunduh menggunakan web crawler. Berdasarkan hasil analisis pada website www.pusbangdik.unsri.ac.id , didapatkan bahwa konten presesentasional dari masing-masing webpage cukup mirip, dengan rata-rata kemiripan 67% untuk semua webpage dan 58% untuk webpage yang terhubung saja.
Copyrights © 2015