Claim Missing Document
Check
Articles

Found 5 Documents
Search

Identifikasi Konten Kasar Pada Tweet Bahasa Indonesia Ahmad Fathan Hidayatullah; Aufa Aulia Fadila; Kiki Purnama Juwairi; Royan Abida Nayoan
Jurnal Linguistik Komputasional Vol 2 No 1 (2019): Vol. 2, No. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (497.009 KB) | DOI: 10.26418/jlk.v2i1.15

Abstract

This study aims to identify tweets containing abusive or offensive content. To do this, we performed five steps, such as, data collection, preprocessing, feature extraction, classification, and evaluation. We employed Multinomial Naïve Bayes and Support Vector Machine with linear kernel as our classification algorithm. Based on the experiment, it is known that the performance of the Support Vector Machine algorithm with linear kernel is superior overall compared to the Multinomial Naïve Bayes algorithm. It can be seen from the result of the values ​​of accuracy, precision, recall, and F1-score for the SVM algorithm, respectively 0.9928; 0.9914; 0.9946; and 0.9930. Whereas the value of accuracy, precision, recall, and F1-score of the Multinomial Naïve Bayes algorithm are 0.9834; 0.9912; 0.9762; and 0.9836. However, it can be concluded that the Support Vector Machine and Multinomial Naïve Bayes algorithm have almost the same performance. This is evidenced by the difference in performance achievements that are not too striking from both algorithm.
ANALISIS SENTIMEN DAN KLASIFIKASI KATEGORI TERHADAP TOKOH PUBLIK PADA TWITTER Ahmad Fathan Hidayatullah; Azhari SN Azhari
Seminar Nasional Informatika (SEMNASIF) Vol 1, No 1 (2014): Business Intelligence
Publisher : Jurusan Teknik Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Keberadaan Twitter telah digunakan secara luas oleh berbagai lapisan masyarakat dalam beberapa tahun terakhir. Kebiasaan masyarakat mem-posting tweet untuk menilai tokoh publik adalah salah satu media yangmerepresentasikan tanggapan masyarakat terhadap tokoh publik. Menjelang pemilihan umum, biasanya ada pihak-pihak tertentu yang ingin mengetahui sentimen dan tanggapan terhadap tokoh publik. Tokoh publik yangdinilai adalah tokoh yang dianggap layak dan memiliki kemampuan untuk dipilih menjadi pemimpin. Oleh karena itu, penelitian ini mencoba menganalisis tweet berbahasa Indonesia yang membicarakan tentang tokohpublik. Analisis dilakukan dengan melakukan klasifikasi tweet yang berisi sentimen masyarakat tentang tokoh tertentu. Metode klasifikasi yang digunakan dalam penelitian ini adalah Naive Bayes Classifier. Naive BayeClassifier dikombinasikan dengan fitur untuk dapat mendeteksi negasi dan pembobotan menggunakan term frequency serta TF-IDF. Klasifikasi tweet pada penelitian ini diperoleh berdasarkan kombinasi antara kelasentimen dan kelas kategori. Klasifikasi sentimen terdiri dari positif dan negatif sedangkan klasifikasi kategori terdiri dari kapabilitas, integritas, dan akseptabilitas. Hasil pengujian pada aplikasi yang dibangun dan padatools RapidMiner memperlihatkan bahwa akurasi dengan term frequency memberikan hasil akurasi yang lebih baik daripada akurasi dengan fitur TF-IDF. Metode Support Vector Machine menghasilkan akurasi performansyang lebih baik daripada metode Naive Bayes baik dalam klasifikasi sentimen maupun dalam klasifikas kategori. Namun demikian, secara keseluruhan penggunaan metode Support Vector Machine dan Naive Baye sama-sama memiliki performansi yang cukup baik untuk melakukan klasifikasi tweet.
KAJIAN LITERATUR: IDENTIFIKASI KONTEN NEGATIF PADA TWITTER DENGAN DEEP LEARNING Anggara Chandra Dwinata; Ahmad Fathan Hidayatullah
AUTOMATA Vol. 2 No. 1 (2021)
Publisher : AUTOMATA

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Media sosial telah menjadi media komunikasi antara satu pengguna dengan pengguna lainnya, salah satunya Twitter. Akan tetapi, tidak semua isi dari media sosial mengandung hal yang positif. Terdapat konten negatif yang beredar di sosial media, diantaranya adalah umpatan, pornografi, cyberbullying, hate speech, dan sebagainya. Telah banyak penelitian yang membahas tentang identifikasi data teks, dan menggunakan berbagai metode untuk mendapatkan hasil luaran yang diinginkan. Penelitian ini merupakan literature review untuk membandingkan beberapa penelitian sebelumnya tentang identifikasi teks pada sosial media. Selain itu, pada kajian literatur ini dilakukan perbandingan metode untuk mendeteksi konten negatif pada teks. Hasil literature review ini dapat dijadikan referensi pengembangan dalam identifikasi konten negatif pada teks. 
Tinjauan Literatur Named Entity Recognition dengan Machine Learning dan Deep Learning pada Ulasan Wisata Muhammad Irfan; Ahmad Fathan Hidayatullah
AUTOMATA Vol. 2 No. 2 (2021)
Publisher : AUTOMATA

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Negara Indonesiaadalah negara yang dipenuhi dengan pariwisata. Wisatawan akan melihat ulasan wisata tersebut, tetapi dengan banyaknya ulasan wisatawan menjadi kesulitan mendapatkan informasi tersebut. Metode Named Entity Recognition (NER) adalah sebuah ekstraksi informasi dan pemrosesan dokumen secara terstruktur dan tidak terstruktur. NER dapat digunakan untuk mengidentifikasi informasi misal wisata, nama tempat, fasilitas, maupun suasana. Literatur ini mengkaji sebanyak 12 referensi literatur mengenai NER pada lingkup wisata yang didapat dengan mencari di Google Scholar dengan kata kunci pencarian “NER for Tourism”. Penelitian NER paling banyak ditemukan dibidang wisata dengan menggunakan model Bidirectional Encoder Representations from Transformer (BERT). Model BERT adalah pelatihan dalam representasi kata yang berguna untuk mencegah agar kata tidak menjadi ambigu sehingga tidak terjadi kesalahan dalam pengenalan entitas. Hasil dari penelitian ini diharapakan dapat membantu pengembangan NER pada bidang pariwisata.
Pengaruh Stopword Terhadap Performa Klasifikasi Tweet Berbahasa Indonesia Ahmad Fathan Hidayatullah
JISKA (Jurnal Informatika Sunan Kalijaga) Vol. 1 No. 1 (2016): Mei 2016
Publisher : UIN Sunan Kalijaga Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (160.051 KB) | DOI: 10.14421/jiska.2016.11-01

Abstract

Data tweet telah banyak dimanfaatkan dalam penelitian di bidang text mining. Salah satu diantaranya adalah dalam klasifikasi teks. Namun, sebagian besar data tweet merupakan data yang masih kotor dan mengandung banyak noise di dalamnya. Oleh karena itu, pemrosesan awal terhadap tweet sangat penting untuk dilakukan. Salah satu metode pemrosesan awal yang dilakukan untuk mereduksi noise dalam tweet adalah stopword removal. Lebih lanjut penelitian ini akan melakukan perbandingan hasil akurasi antara pemrosesan awal yang melibatkan proses penghapusan stopword dengan permosesan awal yang tanpa melibatkan stopword removal. Hal ini dilakukan untuk mengetahui signifikansi tahapan stopword removal dalam klasifikasi teks berbahasa Indonesia. Dalam penelitian ini, dilakukan dua model pemrosesan awal dimana salah satu proses melibatkan stopword removal dan proses yang lainnya tanpa melakukan stopword removal. Hasil eksperimen menunjukkan bahwa melakukan penghapusan stopword dalam pre-processing mampu meningkatkan performa klasifikasi yang dibuktikan dengan adanya peningkatan akurasi. Kata Kunci : Stopword removal, pre-processing, klasifikasi teks, klasifikasi tweet