Jurnal Linguistik Komputasional
Vol 5 No 1 (2022): Vol. 5, NO. 1

Pengaruh Synthetic Minority Oversampling Technique pada Analisis Sentimen Menggunakan Algoritma K-Nearest Neighbors

Raisha Fatiya (Unknown)
Novi Yusliani (Unknown)
Mastura Diana Marieska (Unknown)
Danny Matthew Saputra (Unknown)



Article Info

Publish Date
13 Apr 2022

Abstract

Salah satu permasalahan yang kerap timbul dan mempengaruhi proses pengklasifikasian adalah data tidak seimbang (imbalanced data). Suatu data dikatakan tidak seimbang apabila data tersebut terbagi menjadi kelas minoritas dan mayoritas. Hal tersebut akan memberikan pengaruh berupa dampak buruk pada hasil klasifikasi karena hasil yang didapatkan akan bias terhadap kelas mayoritas. Penelitian ini bertujuan untuk mengetahui pengaruh Synthetic Minority Oversampling Technique untuk menangani permasalahan imbalance data pada analisis sentimen menggunakan algoritma K-Nearest Neighbors. Synthetic Minority Oversampling Technique (SMOTE) adalah salah satu metode yang dapat digunakan untuk melakukan pembentukan data synthetic untuk mengatasi imbalanced data. Metode klasifikasi yang digunakan adalah K-Nearest Neighbors (KNN) dengan nilai k=3. Penelitian ini menggunakan tiga dataset sentimen yang memiliki topik Covid, Pilkada 1, dan Pilkada 2. Hasil evaluasi dari ketiga dataset tersebut menghasilkan nilai rata-rata accuracy sebesar 70% pada KNN tanpa SMOTE dan menghasilkan 78% pada KNN+SMOTE. Hal ini menunjukkan bahwa SMOTE dapat mengatasi permasalahan imbalanced data dan dapat memberikan pengaruh berupa peningkatan akurasi pada penelitian ini.

Copyrights © 2022






Journal Info

Abbrev

jlk

Publisher

Subject

Computer Science & IT

Description

Jurnal Linguistik Komputasional (JLK) menerbitkan makalah orisinil di bidang lingustik komputasional yang mencakup, namun tidak terbatas pada : Phonology, Morphology, Chunking/Shallow Parsing, Parsing/Grammatical Formalisms, Semantic Processing, Lexical Semantics, Ontology, Linguistic Resources, ...