Sari Ernawati
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Klusterisasi Dokumen Berita Berbahasa Indonesia Menggunakan Document Index Graph Sari Ernawati; Arie Ardiyanti; Erwin Budi Setiawan
Seminar Nasional Aplikasi Teknologi Informasi (SNATI) 2009
Publisher : Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Berita elektronik merupakan media informasi yang paling populer dan interaktif saat ini. Begitu interaktifnya,hingga perkembangannya cukup pesat. Terbukti bertambah banyaknya situs perusahaan maupun situs personal,yang berarti semakin meningkatkan jumlah informasi dan data. Peningkatan yang pesat ini juga dipacu olehpenggunaan internet yang semakin berkembang dibandingkan era sebelumnya. Sebagai akibatnya, jumlahinformasi meningkat secara eksponensial. Banyaknya data yang ada, semestinya dapat memberikan manfaatyang banyak pula. Clustering merupakan salah satu metode untuk pengelompokan dokumen dengan menemukanketerkaitan antardokumen. Saat ini, kebanyakan metode klusterisasi hanya mengandalkan perhitungankesamaan berdasarkan kata dan tidak memperhatikan aspek lain, misalnya kesamaan frasa, misalnya VectorSpace Model. Pada makalah ini berusaha mengklusterkan dokumen dengan metode Document Index Graphyang menggunakan kombinasi dua kesamaan dokumen yaitu; kesamaan berbasis kata dan kesamaan berbasisfrasa. Metode ini diuji coba dengan menggunakan sampel berita berbahasa Indonesia dari media massaberbasis web. Pemilihan fragmentation factor dan similarity threshold yang tepat akan meningkatkan kualitaskluster. Hasil klusterisasi dievaluasi berdasarkan nilai precision dan recall.Kata Kunci: clustering, Document Index Graph, fragmentation factor, similarity threshold.