Claim Missing Document
Check
Articles

Found 1 Documents
Search
Journal : Semantik

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja; Abu Salam; Ardytha Luthfiarta; L Budi Handoko; Muhammad Jamhari
Semantik Vol 3, No 1 (2013): Semantik 2013
Publisher : Semantik

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (599.107 KB)

Abstract

Proses  clustering dokumen memudahkan pengguna menemukan dokumen yang diinginkan. Dalam prosesnya  dokumen  yang akan dicluster  direpresentasikan menggunakan Vector Space Model (VSM). Masalah  klasik  dalam VSM adalah matrik term-dokumen  yang  sangat jarang (banyak mengandung angka 0 dalam term-dokumen matrik) dan juga  berdimensi tinggi, sehingga dapat mengurangi kinerja clustering dokumen. Oleh karena itu diperlukan suatu metode untuk bisa mengurangi dimensi term-dokumen dan menghilangkan term yang bernilai 0 tersebut sehingga dapat meningkatkan kinerja proses clustering. Dalam penelitian ini diusulkan model peringkas dokumen otomatis  dengan penggabungan metode fitur dan latent semantic analysis (LSA) sebagai feature reduction pada proses clustering dokumen.Tujuan dari penelitian ini adalah untuk meningkatkan akurasi dari clustering dokumen dengan pengkombinasian metode padaperingkas dokumen otomatis yang diintegrasikan sebagai feature reduction. Beberapa tahapan clustering dalam penelitian ini, yaitu preprocessing, peringkas dokumen otomatis  dengan metode fitur ,LSA dan Kombinasi, pembobotan kata, feature selection, feature transformation dan algoritma clustering.   Hasil penelitian menunjukkan  tingkat akurasi menggunakan peringkas dokumen  otomatis yang diintegrasikan sebagai feature reduction  dengan menggabungkan metode fitur dan metode LSA  mencapai 93,33  %  yang diperoleh pada tingkat peringkas dokumen otomatis  LSA Summary + Feature Summary 50% + Feature Selection 20% + LSA  dibandingkan dengan feature selection 20 % tanpa menggunakan peringkas dokumen otomatis yang hanya mencapai tingkat akurasi 89,33 %.