Informatika : Jurnal Informatika, Manajemen dan Komputer
Vol 15, No 1 (2023): MEI, 2023

KLASIFIKASI SITUASI BENCANA ALAM BANJIR MENGGUNAKAN SUPPORT VECTOR MACHINE BERDASARKAN DATA TWITTER

Ramses Caniago (Universitas Jenderal Achmad Yani Yogyakarta)
Muhammad Habibi (Universitas Jenderal Achmad Yani Yogyakarta)



Article Info

Publish Date
21 Jul 2023

Abstract

Bencana alam banjir sering terjadi di Indonesia karena banyaknya pulau dan iklim tropisnya. Setiap harinya tweet masyarakat mengenai banjir di Twitter bertambah banyak dan dapat mencapai ribuan hanya dalam beberapa hari saja. Tujuan dari penelitian ini adalah membuat suatu model klasifikasi untuk melakukan klasifikasi situasi bencana alam banjir berdasarkan data Twitter. Penelitian ini menggunakan algoritma Support Vector Machine (SVM) yang merupakan salah satu metode dari data mining untuk melakukan klasifikasi. Tahapan yang dilakukan dalam penelitian ini, diantaranya, pengumpulan data, pelabelan manual membagi data ke dalam tiga jenis situasi yaitu ringan, sedang, dan berat. Pembobotan menggunakan TF-IDF dan dilakukan proses training untuk menghasilkan sebuah model. Hasil pengujian model dengan confusion matrix dan K-fold cross validation menghasilkan nilai akurasi sebesar 90,61% dan nilai F1-score sebesar 90,64%. Hasil klasifikasi tweet terkait data banjir menunjukkan bahwa sebanyak 67,40% tweet masuk ke dalam kategori ringan, 19,79% tweet kategori sedang, dan 12,81% tweet kategori berat. Kata kunci : Banjir, Data Mining, Klasifikasi, SVM , TwitterDue to its numerous islands and warm environment, Indonesia frequently experiences flood natural disasters. Tweets about floods on Twitter grow every day and can reach thousands in a matter of days. This study's objective is to develop a classification model for categorizing flood-related natural catastrophe events using data from Twitter. The Support Vector Machine (SVM) algorithm, a data mining technique for categorizing, is used in this work. Data gathering, manual labeling, and segmenting the data into three categories—mild, moderate, and severe—were all steps taken in this study. A training process is carried out to create a model before weighting is applied. The accuracy value and F1-score obtained by evaluating the model using the confusion matrix and K-fold cross-validation are 90.61% and 90.64%, respectively. 67.40% of the tweets classified as having flood-related data fell into the light category, followed by 19.79% of tweets classified as medium tweets, and 12.81% of tweets classified as heavy tweets.Keywords: Classification, Data Mining, Flood, SVM, Twitter

Copyrights © 2023






Journal Info

Abbrev

path

Publisher

Subject

Computer Science & IT

Description

Jurnal Informatika adalah merupakan wadah publikasi bagi peneliti, Dosen, Mahasiswa dalam mengembangkan penelitiannya dalam bidang kecerdasan buatan, kriptografi, pengolahan citra, data mining, system pendukung keputusan, mobile computing, system operasi, multimedia, system pakar, GIS, jaringan ...