Claim Missing Document
Check
Articles

Found 8 Documents
Search

Klasifikasi Kebakaran Hutan Dan Lahan Menggunakan Algoritma Naïve Bayes Di Kabupaten Pelalawan Trya Ayu Pratiwi; Muhammad Irsyad; Rahmad Kurniawan; Surya Agustian; Benny Sukma Negara
CESS (Journal of Computer Engineering, System and Science) Vol 6, No 1 (2021): Januari 2021
Publisher : Universitas Negeri Medan

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (558.293 KB) | DOI: 10.24114/cess.v6i1.22555

Abstract

Kebakaran hutan dan lahan merupakan salah satu masalah lingkungan dalam hal ekonomis dan ekologis yang merugikan. Jumlah hotspot kebakaran hutan di Provinsi Riau telah meningkat secara dramatis menyebabkan kabut asap yang berbahaya. Penelitian ini bertujuan untuk mengklasifikasi kebakaran hutan dan lahan di Kabupaten Pelalawan, Riau. Penelitian ini telah menggunakan 792 data dalam lima tahun (2015-2019). Model klasifikasi kebakaran hutan menggunakan algoritma Naïve Bayes. Atribut yang digunakan untuk klasifikasi terdiri dari suhu, kelembaban, curah hujan, kecepatan angin, dan kelas dari keempat faktor tersebut didapatkan hasil probabilitas tertinggi yaitu suhu dengan nilai 0.978260870 dan nilai akurasi tertinggi adalah dataset tahun 2017 dengan nilai akurasi adalah 81.03% sehingga nilai akurasi tertinggi tersebut dapat diterapkan pada dataset baru yaitu pada tahun 2019 dengan nilai akurasinya adalah 82%. Dengan demikian, dapat disimpulkan bahwa model klasifikasi menggunakan Naïve Bayes memiliki potensi untuk digunakan secara efektif sehingga dapat membantu pihak berwenang dalam mencegah kebakaran hutan dan lahan.
Klasifikasi Sentimen Masyarakat Terhadap Pemerintah Terkait Penerapan Kebijakan New Normal Menggunakan Metode K-Nearest Neighbor Fuji Astuti; Reski Mai Candra; Surya Agustian; Siti Ramadhani
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 5, No 3 (2022): Juni 2022
Publisher : Program Studi Teknik Informatika, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v5i3.4455

Abstract

Abstrak - Instagram memiliki berbagai macam pengguna tanpa terkecuali pemerintah, akun instagram pemerintah sendiri memiliki fungsi sebagai salah satu media informasi bagi masyarakat untuk mengetahui berita terbaru. Pemerintah telah melakukan berbagai upaya untuk mengurangi dan memutus rantai penyebaran virus covid-19, salah satu langkah yang diambil pemerintah dalam menghadapi covid-19 dengan menerapkan kebijakan New Normal. Tujuan penulis dari penelitian ini adalah untuk menghitung akurasi metode K-Nearest Neighbor pada klasifikasikan sentimen dari opini masyarakat terkait penerapan kebijakan new normal. Penelitian ini dilakukan melalui beberapa tahapan yaitu pengumpulan data dari akun yang dikelola pemerintah. Setelah itudata tersebut dilakukan proses preprocessing. Lalu membuat model dengan menggunakan word embedding FastText. Selanjutnya menggunakan feature engineering dalam melakukan improve untuk menghasilkan fitur terbaik. Dataset dalam penelitian ini berjumlah 4717 data yang terbagi dari 1456 data kelas pro, 1662 data kelas netral,  1599 data kelas kontra. Pengujian yang dilakukan menggunakan confusion matrix dengan cara menguji data latih dan data uji sebanyak 3 kali dengan perbandingan data 90:10 yaitu nilai akurasi sebesar 60,169% dan pada k-40 dengan perbandingan 80:20 yaitu nilai akurasi 60,16%, sedangkan akurasi terendah terdapat pada perbandingan data 70:30 yaitu 58,12%.Kata kunci: New Normal, Instagram, Klasifikasi, Sentimen, K-Nearest Neighbor Abstract - Instagram has various kinds of users without the exception of the government, the government's own Instagram account has a function as a medium of information for the public to find out the latest news. The government has made various efforts to reduce and break the chain of the spread of the COVID-19 virus, one of the steps taken by the government in dealing with COVID-19 by implementing the New Normal policy. The author's aim of this study is to calculate the accuracy of the K-Nearest Neighbor method in classifying sentiments from public opinion regarding the implementation of the new normal policy. This research was conducted through several stages, namely collecting data from accounts managed by the government. After that, the data is preprocessed. Then create a model using word embedding FastText. Then use feature engineering to improve to produce the best features. The dataset in this study amounted to 4717 data which was divided into 1456 pro class data, 1662 neutral class data, 1599 contra class data. The test was carried out using a confusion matrix by testing training data and test data 3 times with a data comparison of 90:10, namely the accuracy value of 60.169% and at k-40 with a ratio of 80:20, namely the accuracy value of 60.16%, while the lowest accuracy there is a comparison of 70:30 data that is 58.12%.Keywords: New Normal, Instagram, Classification, Sentiment, K-Nearest Neighbor 
Algoritme Logistic Regression untuk Mendeteksi Ujaran Kebencian dan Bahasa Kasar Multilabel pada Twitter Berbahasa Indonesia Ayu Fransiska; Surya Agustian; Fitri Insani; Muhammad Fikry; Pizaini Pizaini
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 5, No 4 (2022): Agustus 2022
Publisher : Program Studi Teknik Informatika, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v5i4.4524

Abstract

Abstrak - Ujaran kebencian semakin meningkat bersamaan dengan banyaknya pengguna media sosial. Twitter merupakan salah satu media sosial yang membantu penyeberan ujaran ujaran melalui fitur twit-nya yang dilakukan berulang-ulang. Penelitian ini dilakukan untuk mengklasifikasi apakah sebuah twit mengandung ujaran kebencian atau bahasa kasar, dan jika terdeteksi mengandung ujaran kebencian maka akan diukur tingkatannya. Dataset yang digunakan diambil dari twitter sebanyak 13.126 twit asli. Klasifikasi menggunakan Algoritma logistic Regression dan fitur teks word embedding. Dilakukan beberapa kali percobaan untuk mendapatkan model terbaik agar pengujian didapatkan secara optimal. Rata-rata akurasi yang dari ketiga kelas sebesar 75,59%, untuk kelas hate speech 75,86%,kelas abusive 80,05%, kelas level 70,86% dengan komposisi 90:10.Kata kunci: Klasifikasi, Logistic Regression, Ujaran Kebencian, Twitter. Abstract - Hate speech is increasing along with the number of social media users. Twitter is one of the social media that helps spread utterances through its repeated tweet features. This study was conducted to classify whether a tweet contains hate speech or abusive language, and if it is detected to contain hate speech, the level will be measured. The dataset used was taken from twitter as many as 13,126 original tweets. Classification using Logistic Regression Algorithm and word embedding text feature. Several experiments were carried out to get the best model so that the test was obtained optimally. The average accuracy of the three classes is 75.59%, for the hate speech class is 75.86%, the abusive class is 80.05%, the level class is 70.86% with a composition of 90:10.Keyword : Classification, Logistic Regression, Hate Speech, Twitter.
SVM Method with FastText Representation Feature for Classification of Twitter Sentiments Regarding the Covid-19 Vaccination Program Mukti M Kusairi; Surya Agustian
Digital Zone: Jurnal Teknologi Informasi dan Komunikasi Vol. 13 No. 2 (2022): Digital Zone: Jurnal Teknologi Informasi dan Komunikasi
Publisher : Publisher: Fakultas Ilmu Komputer, Institution: Universitas Lancang Kuning

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31849/digitalzone.v13i2.11531

Abstract

Covid-19 is a virus that has a high level of spread, making the government implement a mass vaccination program throughout Indonesia. This program received a lot of responses from the public, with positive and negative opinions or comments. Currently, the public's response through social media is also an input and consideration for the government to implement a program. Therefore, this study was conducted to produce a method approach to assessing the Covid-19 vaccination program by calculating the percentage of each sentiment class. The method used is the Support Vector Machine (SVM) and the fasttext language model feature as a representation of words in the Covid-19 vaccination sentiment dataset collected from Twitter. The data used has been dataset balancing, feature selection and parameter tuning, the optimal SVM model is obtained with a composition of 2536 training data, 778 development data and testing of 400 testing data, resulting in the best value of fi-1 score of 59% with an accuracy rate of 68%. The system is quite successful in detecting sentiment in tweets compared to before. Keywords: sentiment classification, FastText, SVM, Covid-19 vaccine.
Analisis Sentimen Masyarakat Terhadap Kebijakan Vaksinasi Covid-19 pada Media Sosial Twitter menggunakan Metode Logistic Regression Ash Shiddicky; Surya Agustian
Computer Science and Information Technology Vol 3 No 2 (2022): Jurnal Computer Science and Information Technology (CoSciTech)
Publisher : Universitas Muhammadiyah Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37859/coscitech.v3i2.3836

Abstract

Kebijakan melakukan vaksinasi ini hadir sebagai upaya pemerintah dalam merespon wabah penyakit menular Covid-19, tentu dalam suatu kebijakan tidak terlepas dari dukungan maupun kontra. Berbagai komentar ini muncul dari masyarakat baik berupa opini atau fakta pengalaman yang mereka alami, ratusan bahkan ribuan komentar ini dapat menjadi data yang berharga untuk dijadikan bahan analisis dan mengetahui reaksi masyarakat ketika kebijakan vaksinasi Covid-19 ini diterapkan ke masyarakat, data komentar ini dapat diproses untuk mendapatkan informasi, salah satu analisis pendapat atau review dapat dilakukan adalah menggunakan analisis sentimen. Berdasarkan uraian diatas, dapat memanfaatkan pembelajaran mesin menggunakan algoritma Logistic Regression untuk membantu dalam mengolah data informasi tersebut, dalam hal ini klasifikasi. Hasil pengujian menunjukan tingkat akurasi mencapai 82% terhadap data dev akan tetapi tidak diikuti oleh nilai F1-Score yang cukup baik untuk membangun sebuah model, hal ini disebabkan oleh data train memiliki distribusi klasifikasi yang tak seimbang. Maka dilakukan proses Slicing data serta Tuning Hyperparameters yang bertujuan untuk mendapatkan model terbaik, setelah menerapkan model terbaik yang didapat dari data dev maka dilakukan pengujian terhadap data test, metode Logistic Regression menghasilkan nilai akurasi 67% dan F1-score 60% terhadap data test hasil ini membuktikan bahwa model yang dibangun cukup handal dalam melakukan klasifkasi, terbukti nilai f1-score dan akurasi cukup berimbang dan lebih baik dari Naïve Bayes, SVM dan LSTM.
Peringkasan teks otomatis (automated text summarization) pada artikel berbahasa indonesia menggunakan algoritma lexrank Halimah; Surya Agustian; Siti Ramadhani
Jurnal CoSciTech (Computer Science and Information Technology) Vol 3 No 3 (2022): Jurnal Computer Science and Information Technology (CoSciTech)
Publisher : Universitas Muhammadiyah Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37859/coscitech.v3i3.4300

Abstract

Artikel merupakan kumpulan teks atau kalimat yang panjang dan berisikan gagasan atau pendapat terhadap suatu topik tertentu. Artikel yang sangat panjang akan menghabiskan waktu cukup lama untuk membaca dan memahami poin-poin penting yang disampaikan. Penelitian ini mengusulkan algoritma Lexrank untuk meringkas teks otomatis pada artikel berbahasa indonesia. Penelitian ini menggunakan dataset berupa korpus yang tersusun atas 300 artikel dari berbagai topik. Kalimat yang dipilih menjadi ringkasan untuk gold standard dirata-ratakan dari dua orang annotator. Metode peringkas dokumen dikembangkan untuk menghasilkan ringkasan yang performanya dibandingkan dengan gold standard tersebut menggunakan ROUGE score. Metode bekerja dengan beberapa tahap, mulai dari text preprocessing yang meliputi segmentasi kalimat, case folding, tokenisasi, punctuation removal, stemming dan stopword removal. Kemudian menghitung bobot tf-idf, bobot similarity, pembentukan graf, pemeringkatan kalimat, dan tahap akhir adalah membentuk hasil ringkasan. Untuk pengembangan sistem, 150 dokumen diuji coba dengan variasi pemilihan ranking similarity, dan yang terbaik digunakan sebagai model untuk test document. Hasil pengujian dengan compression rate 50% menghasilkan nilai f-measure rata-rata untuk 150 test document, pada metrik ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 67,53%, 59,10%, dan 67,05%. Sedangkan untuk compression rate 30% menghasilkan rata-rata f-measure pada ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 55,82%, 45,51%, dan 54,76%. Penelitian ini menghasilkan akurasi f-measure yang lebih baik dan kompetitif bila merujuk pada hasil-hasil penelitian sejenis.
Pebandingan Metode Decision Tree dan XGBoost untuk Klasifikasi Sentimen Vaksin Covid-19 di Twitter Habib Hakim Sinaga; Surya Agustian
Jurnal Nasional Teknologi dan Sistem Informasi Vol 8, No 3 (2022): Desember 2022
Publisher : Jurusan Sistem Informasi, Fakultas Teknologi Informasi, Universitas Andalas

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25077/TEKNOSI.v8i3.2022.107-114

Abstract

Pemerintah Indonesia melaksanakan vaksinasi dalam upaya pencegahan virus COVID-19. Namun upaya tersebut memicu pro dan kontra dalam masyarakat. Pro dan kontra tersebut dapat dikatakan sebagai sentimen. Sentimen dapat diungkapkan di berbagai media, salah satunya adalah media sosial. Teknik yang digunakan untuk mendeteksi sentimen pada media sosial salah satunya adalah klasifikasi teks dengan machine learning. Penelitian ini akan membandingkan Decision tree dan XGBoost untuk mengklasifikasikan sentimen di twitter. Data diperoleh dengan cara crawling menggunakan pemograman pyton dan Twitter API. Data diberi label dengan teknik crowdsourcing dan majority voting. Data yang digunakan setelah diseimbangkan adalah 6000 data latih, 778 data validasi dan 400 data uji. Hasil pengujian Decision tree dan XGBoost mendapatkan hasil terbaik pada model XGBoost dengan nilai akurasi sebesar 66% dan f1-score sebesar 57%. Hasil ini juga merupakan yang terbaik dibanding metode yang digunakan pada penelitian sebelumnya dengan dataset yang sama.
Peringkasan Teks Otomatis Artikel Berbahasa Indonesia Menggunakan Algoritma Textrank Faizah Husniah; Surya Agustian; Iis Afrianty
Prosiding Seminar Nasional Teknoka Vol 7 (2022): Proceeding of TEKNOKA National Seminar - 7
Publisher : Fakultas Teknik, Universitas Muhammadiyah Prof. Dr. Hamka, Jakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Banyaknya informasi yang terdapat pada media online salah satunya adalah artikel. Artikel pada umumnya berisikan kumpulan kalimat yang panjang sehingga pembaca membutuhkan waktu yang lebih banyak untuk memperoleh intisari dari artikel. Sistem peringkasan teks otomatis membantu pengguna mengetahui isi artikel tanpa harus membaca keseluruhan dokumen, sehingga dapat menghemat waktu. Penelitian ini menyelidiki algoritma textrank untuk peringkasan dokumen. Algoritma textrank akan menghitung skor dari setiap kalimat, kemudian memilih sejumlah kalimat sebagai ringkasan. ROUGE scoring digunakan untuk menghitung performa sistem berdasarkan ringkasan manual yang dibuat oleh manusia (human annotator) sebagai gold standard. Hasil pengujian dengan compression rate 50% pada pilihan ranking kalimat yang terpilih sebagai ringkasan, menghasilkan nilai pada ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 68.76%, 60.60%, dan 68.29%. Sedangkan untuk compression rate 30%, rata-rata pada ROUGE-1, ROUGE2 dan ROUGE-L berturut-turut adalah 45.00%, 31.62%, dan 43.59%. Hasil ini sangat kompetitif dibandingkan dengan score pada penelitian tentang sistem peringkasan dokumen lainnya.