Jurnal Riset Statistika
Volume 2, No. 2, Desember 2022, Jurnal Riset Statistika (JRS)

Aplikasi Algoritma K-Nearest Neighbor pada Analisis Sentimen Omicron Covid-19

Alfiari Firdaus (Statistika, Universitas Islam Bandung)



Article Info

Publish Date
20 Dec 2022

Abstract

Abstract. K-Nearest Neighbor (KNN) is one of the most widely used classification algorithms in Machine learning methods. KNN classification is a conventional non-parametric classification method that has been used as a primary classifier in many pattern classification problems. The KNN search technique used in this research is the cosine similarity distance formula. The advantage of this method is that it is effective against noise data and is effective when the training data is large. However, this method still has drawbacks, namely the problem of the accuracy of the method used to measure the similarity between the objects being compared. This study aimed to determine the application of the KNN method to sentiment analysis. The data used is 12,951 tweets taken from Twitter using the hashtags #OmicronVariant and #Covid19. The results showed that the best k value parameter was 15. Using the cosine similarity distance, the accuracy was quite good, and the recall was quite good and the precision was good, so the prediction results obtained that the positive category value was higher than the neutral category value and the negative category value. It can be concluded that the public's perception of Covid-19 Omicron is positive, meaning that they believe in Omicron. Abstrak. K-Nearest Neighbor (KNN) merupakan salah satu algoritma klasifikasi yang paling banyak digunakan dalam metode Machine learning. Klasifikasi KNN merupakan metode klasifikasi non-parametrik konvensional yang telah digunakan sebagai pengklasifikasi dasar dalam banyak masalah klasifikasi pola. Teknik pencarian KNN yang digunakan dalam penelitian ini dengan menggunakan rumus jarak cosine similarity. Keuntungan dari metode ini adalah efektif terhadap data noise dan efektif ketika data training berukuran besar. Namun metode ini masih memiliki kekurangan yaitu masalah tingkat akurasi metode yang digunakan untuk mengukur kemiripan antar objek yang dibandingkan. Tujuan dari penelitian ini adalah untuk mengetahui penerapan metode KNN pada analisis sentimen. Data yang digunakan adalah data tweet sebanyak 12.951 yang diambil dari twitter dengan menggunakan hastag #OmicronVariant dan #Covid19. Hasil penelitian menunjukkan bahwa parameter nilai k terbaik adalah 15. Menggunakan jarak cosine similarity akurasi cukup baik, dan recallnya pun cukup baik kemudian presisinya baik, maka hasil prediksi diperoleh nilai kategori positif lebih tinggi dibandingkan nilai kategori netral dan nilai kategori negatif. Dapat disimpulkan bahwa persepsi masyarakat terhadap Covid-19 Omicron adalah positif, artinya mereka percaya dengan adanya Omicron.

Copyrights © 2022






Journal Info

Abbrev

JRS

Publisher

Subject

Decision Sciences, Operations Research & Management Mathematics

Description

Jurnal Riset Statistika (JRS) adalah jurnal peer review dan dilakukan dengan double blind review yang mempublikasikan kajian teoritik dan hasil riset terhadap isu-isu empirik dalam sub kajian statistika. JRS ini dipublikasikan pertamanya 2021 dengan eISSN 2798-6578 yang diterbitkan oleh UPT ...