Indonesian Journal of Networking and Security - IJNS
Vol 6, No 1 (2017): IJNS Januari 2017

Komparasi Teknik Klasifikasi Teks Mining Pada Analisis Sentimen

Ipmawati, Joang (Unknown)
., Kusrini (Unknown)
- STMIK AMIKOM Yogyakarta, Emha Taufiq Luthfi (Unknown)



Article Info

Publish Date
01 Dec 2016

Abstract

Abstract - Opininion mining also called sentiment analysis is a computational research of opinions, sentiments and emotions that are textually to see opinion on an issue, or to identify the tendency of things in the market. This time public opinion be an important resource in making decisions for a product. Classification algorithm to perform text mining including Support Vector Machine (SVM), Naïve Bayessian classification (NBC) and K-Nearest Neighbor (K-NN). These of algorithms will compired to find out a good performance in terms of accuracy for two different datasets that imdb movie reviews and twitter sentiment. The results of the comparison showed SVM obtain good results in accuracy in the data imdb movie reviews 78.55% and on twitter dataset 72%. Similarly, NBC obtained the data accuracy at 78.55% twitter but different data twitter 67.33%. The results of F-Measure SVM movie review show and NBC showed the same results, namely 0.785 and also for the AUC, the results surpass NBC 0.869, SVM get results 0.786 and while KNN obtain the results 0.572. F-Measure to twitter SVM is superior obtaining results of 0.720 and 0.673 NBC obtained results while K-NN 0.545. and for the results of the AUC, as dataset imdb, on twitter this dataset NBC also outperformed SVM and K-NN. AUC to obtain results NBC 0.735, SVM obtain results K-NN 0.658 and 0.618 get results. Keywords : Text Mining, Sentiment Analysis, SVM, Naïve Bayessian, K-NN, compare, comparation Abstrak - Opininion mining juga disebut analisis sentimen adalah riset komputasional dari opini, sentimen dan emosi yang diekspresikan secara tekstual dilakukan untuk melihat pendapat terhadap sebuah masalah, atau untuk identifikasi kecenderungan hal di pasar. Saat ini pendapat masyarakat menjadi sumber yang penting dalam pengambilan keputusan akan suatu produk. Algoritma klasifikasi yang dapat melakukan teks mining diantaranya Support Vector Machine (SVM), Naïve Bayessian classification (NBC) dan K-Nearest Neighbor (K-NN). Ketiga algoritma ini akan dikomparasi untuk mengetahui performa yang baik dalam hal akurasi untuk dua dataset yang berbeda yaitu imdb review film dan sentimen twitter. Hasil dari komparasi menunjukkan SVM memperoleh hasil yang baik dalam akurasi pada data imdb review film 78,55% dan pada dataset twitter 72%. Sama halnya dengan NBC yang memperoleh akurasi pada data twitter 78.55% tetapi berbeda pada data twitter 67,33%. Hasil F-Measure review film menunjukan SVM dan NBC memperoleh hasil yang sama yaitu 0,785 dan untuk hasil AUC, NBC mengungguli hasil 0,869, SVM memperoleh hasil 0,786 sedangkan KNN memperoleh hasil 0,572. F-Measure untuk twitter SVM lebih unggul memperoleh hasil 0,720 dan NBC memperoleh hasil 0,673 sedangkan K-NN 0,545. Dan untuk hasil AUC, sama seperti dataset imdb, pada dataset twitter ini NBC juga mengungguli SVM dan K-NN. AUC untuk NBC memperoleh hasil 0,735, SVM memperoleh hasil 0,658 dan K-NN memperoleh hasil 0,618. Kata kunci: teks mining, sentimen analisis, SVM, Naïve Bayessian, K-NN, komparasi

Copyrights © 2017






Journal Info

Abbrev

ijns

Publisher

Subject

Computer Science & IT Control & Systems Engineering Education Electrical & Electronics Engineering Engineering

Description

Indonesian Journal of Networking and Security (IJNS) adalah majalah ilmiah yang digunakan untuk mempublikasikan riset yang berkenaan dengan Jaringan, Mobile Programming, Keamanan Sistem untuk guru, dosen, praktisi atau siapapun yang melakukan riset agar bisa dipublikasikan dan dimanfaatkan hasilnya ...