Jurnal Pseudocode
Vol 1, No 2 (2014)

Pengaruh Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur Dan Latent Semantic Analysis (LSA) Pada Proses Clustering Dokumen Teks Berbahasa Indonesia

Muhammad Jamhari (Unknown)
Edi Noersasongko (Universitas Dian Nuswantoro)
Hendro Subagyo (Universitas Dian Nuswantoro)



Article Info

Publish Date
04 Feb 2015

Abstract

Penyimpulan adalah proses pengumpulan bagian yang paling penting dari sebuah sumber dokumen yang menghasilkan versi yang lebih singkat. Metode yang dianggap paling layak untuk melakukan penyimpulan adalah metode berbasis fitur dan LSA (Latent Semantic Analysis). Pengklusteran adalah proses pengelompokan dokumen yang mempunyai kesamaan topik. Metode yang paling seringd ilakukan adalah LSA dimana SVD (Singular Value Decomposition) digunakan untuk menghubungkan semantik antara istilah dan kalimat begitu juga dengan dokumen. SVD juga mengurangi dimensi yang besar dari matriks dokumen istilah. Yang bersama dengan metode Feature Selection melakukan pengurangan fitur. Tesis ini memeriksa pengaruh metode penggabungan fitur dan metode LSA pada penyimpulan pada kumpulan data yang hasilnya akan diklusterkan berdasarkan pada LSA dimana SVD dilakukan bersamaan dengan metode seleksifitur. Uji coba yang dilakukan pada 150 dokumen dari 5 topik dengan beberapa kombinasi metode fitur metode LSA dan kedua metode digabungkan, pada tingkatan penyimpulan yang diintegrasikan tingkatan klusterisasi berdasarkan pada LSA dengan nilai k 12 dan metode kontribusi tema pemilih tema terbimbing memperlihatkan pengaruh yang besar pada metode yang digabungkan pada tahapan penyimpulan yang mendapatkan hasil akurasi 93.33%  dan waktu komputasi yang relatif cepat berkisar 57 detik dengan proporsi penggabungan seperti berikut : Kesimpulan LSA + 50% kesimpulan Fitur+20% seleksifitur+ Klusterisasi LSA.

Copyrights © 2014






Journal Info

Abbrev

pseudocode

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering

Description

Pseudocodeis a scientific journal in the information science family that contains the results of informatics research, scientific literature on informatics, and reviews of the development of theories, methods, and application of informatics engineering science. Pseudocode is published by the ...