INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS : Journal of Information System
Vol 4 No 1 (2019): INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS (Desember 2019)

Klasifikasi Tweet Berdasarkan Keterkaitan Tweet Terhadap Topik Tertentu Pada Twitter Menggunakan Naïve Bayes

Muhamad Baydhowi (Sistem Informasi
Universitas Bina Insani)

Widya Apriliah (Sistem Informasi
Universitas Bina Sarana Informatika)

Ilham Kurniawan (Sistem Informasi
Universitas Bina Sarana Informatika)



Article Info

Publish Date
02 Dec 2019

Abstract

Abstrak: Twitter merupakan salah satu jejaring sosial atau mikroblog yang memungkinkan penggunanya untuk mengirim dan membaca pesan yang di sebut kicauan (tweets) yang berisi 140 karakter. Indonesia menduduki urutan ke lima jumlah pengguna (user) Twitter terbanyak di seluruh dunia dan Jakarta adalah kota yang paling aktif diseluruh dunia dalam membuat posting di Twitter. Berdasarkan informasi tersebut, kita dapat memanfaatkan data tweet untuk kepentingan tertentu seperti mengklasifikasikan tweet berdasarkan ketertarikan terhadap topik tertentu dengan kriteria yang telah ditentukan. Hasil penelitian ini diharapkan dapat digunakan untuk mendapatkan user potensial yang terkait dengan topik yang telah ditentukan sebagai sasaran marketing dari produk yang berkaitan dengan topik yang telah ditentukan sebelumnya. Namun penentuan klasifikasi tweet yang terkait dan tidak terkait dengan suatu topik manjadi kendala bagi para internet marketer. Tujuan penelitian ini adalah untuk menemukan metode klasifikasi tweet berdasarkan label terkait dan tidak terkait untuk kategori tertentu berdasarkan isi teks dari tweet tersebut. Data tweet diolah sehingga membentuk Bag of Words yang nantinya akan digunakan sebagai data training untuk melakukan klasifikasi dengan algoritma Naïve Bayes terhadap tweet yang diinput sebagai data testing. Kata kunci: Bag of words, Internet marketer, Klasifikasi, Naïve Bayes, Tweet. Abstract: Twitter is one of the social network or microblog that allows users to send and read messages called tweets that contain 140 characters. Indonesia ranks the fifth largest number of Twitter users worldwide and Jakarta is the most active city in the world in posting on Twitter. Based on that information, we can utilize tweet data for specific purposes such as classifying tweets based on interest in a particular topic with predetermined criteria. The results of this study are expected to be used to obtain potential users associated with the topic that has been determined as a marketing target of the product relating to a predetermined topic. But determining the classification of related tweets and unrelated tweets to a topic becomes an obstacle for the internet marketers. The purpose of this research is to find the method of tweet classification based on related and unrelated labels for certain categories based on the text content of the tweet. Tweet data is processed and becomes Bag of Words which will be used as training data to classify tweet that inputted as testing data with Naïve bayes algorithm. Keywords: Bag of words, Classification, Internet marketer, Naïve bayes, Tweet.

Copyrights © 2019






Journal Info

Abbrev

ISBI

Publisher

Subject

Computer Science & IT Decision Sciences, Operations Research & Management

Description

JURNAL INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS merupakan jurnal ilmiah yang diterbitkan oleh Program Studi Sistem Informasi Universitas Bina Insani. Jurnal ini berisi tentang karya ilmiah hasil penelitian yang bertemakan: Big Data, Computer Base Information System (CBIS), Customer ...