Jurnal Ilmiah Teknik Informatika dan Komunikasi
Vol. 1 No. 3 (2021): November: Jurnal Ilmiah Teknik Informatika dan Komunikasi

MAXIMUM MARGINAL RELEVANCE BERBASIS BOOLEAN MODEL PADA PERINGKASAN ARTIKEL BERITA PENDEK

Arie Atwa Magriyanti (Universitas Sains dan Teknologi Komputer Semarang)



Article Info

Publish Date
01 Nov 2021

Abstract

Portal berita online merupakan situs yang memuat segala berita dan artikel untuk dibaca pengunjung, berisi opini dan komentar-komentar seputar politik, teknologi dan lain-lain. Ada berbagai portal berita online yang bisa kita akses, antara lain antaranews.com dan tribunnews.com. Meningkatnya jumlah portal berita online, mengakibatkan tingginya jumlah berita yang bisa dibaca masyarakat. Oleh sebab itu, kebutuhan peringkasan teks (text summarization) semakin diperlukan masyarakat untuk kemudahan dan penghematan waktu. Sistem peringkasan teks otomatis yang digunakan pada penelitian sebelumnya, menggunakan metode Maximum Marginal Relevance (MMR) berbasis Vector Space Model (VSM) dengan representasi algoritma pembobotan kata menggunakan TF-IDF-DF (Term Frequency-Inverse Document Frequency-Document Frequency). Pada algoritma ini, kata yang sering muncul memiliki jumlah yang tinggi, sehingga bobot hubungan antara sebuah kata dan kalimat rendah, sehingga metode ini cocok untuk artikel panjang yang memiliki banyak jumlah kalimat. Oleh karena itu, perlu diusulkan metode lain untuk menghitung kesamaan kata dengan menggunakan boolean model dengan representasi jaccard, dice dan cosine coefficient. Ketiga metode ini digunakan untuk mengetahui document yang paling relevan untuk kumpulan kata kunci (query) yang diberikan. Setelah proses boolean, perlu dilakukan metode ekstraksi teks yang diterapkan yaitu MMR (Maximum Marginal Relevance) untuk meringkas document tunggal dengan cara melakukan rangking, membandingkan similarity query dan document, dan similarity antar document. Dari hasil penelitian, boolean model memiliki nilai akurasi yang lebih tinggi daripada VSM, dan di antara ketiga metode boolean model, metode cosine coefficient lebih unggul dengan akurasi 59.3 %.

Copyrights © 2021






Journal Info

Abbrev

juitik

Publisher

Subject

Computer Science & IT Electrical & Electronics Engineering

Description

Bidang Teknik Elektro yang meliputi keahlian teknik tenaga listrik, teknik telekomunikasi dan informasi, serta kendali dan instrumentasi. Bidang Teknik Informatika yang meliputi keahlian di bidang teknik Komputer, Sistem Komputer, Ilmu ...