Jurnal Fokus Elektroda (Energi Listrik, Telekomunikasi, Komputer, Elektronika dan Kendali)
Vol. 7 No. 4 (2022): Jurnal Fokus Elektroda Vol 7 No 4 2022

Optimasi Normalisasi Kata Pada Data Twitter Untuk Meningkatkan Akurasi Analisis Sentimen (Studi Kasus Respon Masyarakat Terhadap Layanan Teman Bus)

M. Adnan Nur (STMIK Handayani Makassar)
Nurilmiyanti Wardhani (Unknown)



Article Info

Publish Date
30 Nov 2022

Abstract

Teman Bus merupakan layanan yang disediakan oleh Kementerian Perhubungan RI. Untuk mengetahui tingkat kepuasan masyarakat terhadap layanan Teman Bus, Analsis sentimen dapat diterapkan menggunakan data media sosial twitter. Teks yang tidak terstruktur pada twitter menjadi permasalahan dalam analsis sentimen khsusnya kesalahan ejaan kata dan penggunaan kata slang. Tujuan dari penelitian ini adalah melakukan optimasi normalisasi kata dengan menerapkan koreksi ejaan kata dan konversi kata slang menjadi kata baku. Tahapan penelitian terdiri atas pengumpulan data, prapemrosesan, analsis sentimen dan pengujian akurasi. Data yang digunakan terdiri atas data twitter dengan kata kunci teman bus, dataset kata dasar (kata baku) dan dataset kata slang. Untuk prapemrosesan, tahapannya meliputi tokenizing, case folding, filtering, stemming, koreksi ejaan kata dengan levenshtein distance dan konversi kata slang dengan model word2vec. Pembagian data latih dan data uji untuk pengujian klasifikasi analisis sentimen menggunakan k-fold cross validation. Tahap pengujian disiapkan 5 skenario pengujian dengan pengaturan parameter levenshtein distance dan word2vec serta terdapat 1 skenario pengujian yang tidak melibatkan normalisasi kata. Hasil yang diperoleh pada tahap pengujian menunjukkan peningkatan akurasi dengan menerapkan normalisasi kata sebesar 0,776. Normalisasi kata ini menggunakan ratio levenshtein distance sebesar 0,9 dan min-count word2vec sebesar 10.

Copyrights © 2022