Mayoritas pengguna internet saat ini melakukan penelusuran internet untuk mengetahui berita atau informasi yang sedang berkembang. Pertumbuhan internet dan media sosial telah mendorong munculnya ratusan portal atau berita online dengan topik berita yang sangat beragam. Menelusuri topik berita secara manual merupakan metode yang tidak efektif serta menghabiskan waktu yang banyak. Pada penelitian ini dilakukan pemodelan topik berita menggunakan Latent Dirichlet Allocation (LDA). Sebelum penerapan model LDA, juga diterapkan proses-proses pendukung yaitu tokenisasi, lemmatisasi, faktorisasi tf-idf, dan non-negative matrix factorization. Hasil penelitian menunjukkan bahwa LDA dapat diterapkan untuk memodelkan topik berita dengan baik dengan nilai skor loglikelihood -13615.912 dan skor perplexity 378.958. Selain menggunakan LDA, pemodelan topik juga dilakukan dalam bentuk klaster dengan menerapkan k-means clustering. Dengan metode elbow diperoleh jumlah klaster yang ideal untuk k-means clustering adalah 5 klaster serta performa nilai silhouette 0.62
Copyrights © 2020