Bencana alam banjir sering terjadi di Indonesia karena banyaknya pulau dan iklim tropisnya. Setiap harinya tweet masyarakat mengenai banjir di Twitter bertambah banyak dan dapat mencapai ribuan hanya dalam beberapa hari saja. Tujuan dari penelitian ini adalah membuat suatu model klasifikasi untuk melakukan klasifikasi situasi bencana alam banjir berdasarkan data Twitter. Penelitian ini menggunakan algoritma Support Vector Machine (SVM) yang merupakan salah satu metode dari data mining untuk melakukan klasifikasi. Tahapan yang dilakukan dalam penelitian ini, diantaranya, pengumpulan data, pelabelan manual membagi data ke dalam tiga jenis situasi yaitu ringan, sedang, dan berat. Pembobotan menggunakan TF-IDF dan dilakukan proses training untuk menghasilkan sebuah model. Hasil pengujian model dengan confusion matrix dan K-fold cross validation menghasilkan nilai akurasi sebesar 90,61% dan nilai F1-score sebesar 90,64%. Hasil klasifikasi tweet terkait data banjir menunjukkan bahwa sebanyak 67,40% tweet masuk ke dalam kategori ringan, 19,79% tweet kategori sedang, dan 12,81% tweet kategori berat. Kata kunci : Banjir, Data Mining, Klasifikasi, SVM , TwitterDue to its numerous islands and warm environment, Indonesia frequently experiences flood natural disasters. Tweets about floods on Twitter grow every day and can reach thousands in a matter of days. This study's objective is to develop a classification model for categorizing flood-related natural catastrophe events using data from Twitter. The Support Vector Machine (SVM) algorithm, a data mining technique for categorizing, is used in this work. Data gathering, manual labeling, and segmenting the data into three categories—mild, moderate, and severe—were all steps taken in this study. A training process is carried out to create a model before weighting is applied. The accuracy value and F1-score obtained by evaluating the model using the confusion matrix and K-fold cross-validation are 90.61% and 90.64%, respectively. 67.40% of the tweets classified as having flood-related data fell into the light category, followed by 19.79% of tweets classified as medium tweets, and 12.81% of tweets classified as heavy tweets.Keywords: Classification, Data Mining, Flood, SVM, Twitter
Copyrights © 2023