Journal Information System Development
Vol 5, No 1 (2020): Journal Information System Development (ISD)

PEMODELAN TOPIK BERITA MENGGUNAKAN LATENT DIRICHLET ALLOCATION DAN K-MEANS CLUSTERING

Siringoringo, Rimbun (Unknown)
Jamaluddin, Jamaluddin (Unknown)
Gea, Asaziduhu (Unknown)



Article Info

Publish Date
29 Jun 2020

Abstract

Mayoritas pengguna internet saat ini melakukan penelusuran internet untuk mengetahui berita atau informasi yang sedang berkembang. Pertumbuhan internet dan media sosial telah mendorong munculnya ratusan portal atau berita online dengan topik berita yang sangat beragam. Menelusuri topik berita secara manual merupakan metode yang tidak efektif serta menghabiskan waktu yang banyak.  Pada penelitian ini dilakukan pemodelan topik berita menggunakan Latent Dirichlet Allocation (LDA). Sebelum penerapan model LDA, juga diterapkan proses-proses pendukung yaitu tokenisasi, lemmatisasi, faktorisasi tf-idf, dan non-negative matrix factorization. Hasil penelitian menunjukkan bahwa LDA dapat diterapkan untuk memodelkan topik berita dengan baik dengan nilai  skor loglikelihood -13615.912 dan skor perplexity 378.958. Selain menggunakan LDA, pemodelan topik juga dilakukan dalam bentuk klaster dengan menerapkan k-means clustering. Dengan metode elbow diperoleh jumlah klaster yang ideal untuk k-means clustering adalah 5 klaster serta performa nilai silhouette 0.62

Copyrights © 2020






Journal Info

Abbrev

isd

Publisher

Subject

Computer Science & IT Decision Sciences, Operations Research & Management Engineering

Description

Jurnal Information System Development (ISD) hadir sebagai wadah bagi para Akademisi, Developer, Peneliti, dan Ilmuwan yang hendak menyumbangkan karya ilmiahnya bagi dunia ilmu pengetahuan di bidang Sistem Informasi. Jurnal yang diterbitkan oleh Prodi Sistem Informasi Universitas Pelita Harapan ini ...