Salah satu cara yang umum digunakan untuk memperoleh informasi adalah dengan membacabeberapa dokumen yang membahas topik yang sama. Walaupun cara ini merupakan yang palingmudah namun pada pelaksanaannya banyak menghabiskan waktu. Penggunaan suatu sistemautomated document integration yang membantu menemukan kalimat penting dari masing-masingdokumen akan menghemat waktu serta tenaga yang diperlukan. Keluaran dari sistem yangdikembangkan dalam penelitian ini adalah suatu dokumen yang dibentuk dari integrasi (cluster)kalimat-kalimat dari dokumen asli.Kesamaan dokumen yang akan diintegrasikan ditentukan oleh cosine similarity. Sistemkemudian menghitung TF-IDF (term frequency-inverse document frequency) masing-masing kalimatpada dokumen. TF-IDF merupakan bobot dari suatu kalimat yang mencerminkan tingkat kepentingandari kalimat pada suatu dokumen serta terhadap kalimat-kalimat lain pada dokumen yang berbeda.Kalimat-kalimat yang memiliki kesamaan yang tinggi kemudian digabungkan secara agglomerativehierarchical menggunakan metode complete linkage. Hasil uji coba memperlihatkan 75% respondenmenyatakan keluaran sistem adalah benar.
Copyrights © 2012