Articles
Deteksi Topik Tentang Tokoh Publik Politik Menggunakan Latent Dirichlet Allocation (LDA)
Faizun Nuril Hikmah;
Setio Basuki;
Yufis Azhar
Jurnal Repositor Vol 2 No 4 (2020): April 2020
Publisher : Universitas Muhammadiyah Malang
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.22219/repositor.v2i4.52
Twitter merupakan salah satu Social Networking yang memperbolehkan pengguna untuk mengirim dan membaca sebanyak 140 karakter. Berdasarkan survey sekitar 500 juta tweet tiap harinya yang dikirim melalui twitter. Data-data tersebut dapat berupa opini-opini publik mengenai politik, tokoh publik, makanan, dan lain sebagainya. Data tersebut akan diolah dengan teknik Topic Detection untuk menghasilkan suatu topik yang sedang marak dibicarakan masyarakat tentang tokoh publik politik. Permasalahan dalam penulisan ini yaitu, bagaimana mengekstraksi suatu tweet tentang tokoh publik politik dari pengguna Twitter. Data tweet yang diambil tentang tokoh publik politik diantaranya yaitu mengenai Joko Widodo, Basuki Tjahaja Purnama (Ahok), Anies Baswedan, Sandiaga Uno, dan Habib Rizieq Shihab. Dengan adanya data atau tweet tentang tokoh publik politik dapat diolah menggunakan metode Agglomerative untuk mengcluster tiap data yang akan digunakan sebagai topik acuan, LDA (Latent Dirichlet Allocation) yang akan berfungsi sebagai pemodelan topik dari tweet-tweet yang telah tercluster, serta TF-IDF untuk mengetahui tweet mana saja yang mengandung kata-kata dalam LDA yang akan dijadikan sebagai topik acuan. Sehingga akan menghasilkan deteksi topik yang relevan berdasarkan tweet mengenai tokoh publik politik.
Analisis Sentimen Data Kritik Dan Saran Pelatihan Aplikasi Teknologi Informasi Menggunakan Algoritma Support Vector Machine
Alimuddin Hasan Al Kabir;
Setio Basuki;
Galih Wasis Wicaksono
Jurnal Repositor Vol 1 No 1 (2019): November 2019
Publisher : Universitas Muhammadiyah Malang
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.22219/repositor.v1i1.11
Opini publik merupakan salah satu instrumen yang bisa digunakan untuk melakukan evaluasi terhadap suatu kegiatan. Penelitian ini dilandasi oleh beberapa masalah diantaranya (1) perlunya peningkatan kualitas pelaksanaan kegiatan Pelatihan Aplikasi Teknologi Informasi, (2) opini peserta yang sudah ditampung belum dimanfaatkan secara maksimal karena terkendala banyaknya data dan tidak mungkin di analisis secara manual. Kritik dan saran diambil dari data periode pelaksanaan 2016/2017 sebanyak 1050 data. Support Vector Machine digunakan sebagai metode dalam analisis sentimen. Proses latih data akan menghasilkan hyperplane terbaik yang dijadikan acuan untuk menentukan kelas sentimen mana sesuai untuk suatu kalimat. Pengujian dilakukan dengan membagi dataset ke dalam data uji sebanyak 20% dan data latih sebanyak 80% sehingga bisa dilakukan proses analisis hingga 5 kali iterasi dengan susunan data yang berbeda. Hasil pengujian menunjukkan perhitungan Akurasi, Precision, Recall, dan F-Measure yang dihasilkan oleh sistem adalah sebesar 82,08%, 83,42%, 81,16%, dan 81,82%.
Implementasi Deep Learning Menggunakan Arsitektur Long Short Term Memory(LSTM) Untuk Prediksi Curah Hujan Kota Malang
Muhammad Rizki;
Setio Basuki;
Yufis Azhar
Jurnal Repositor Vol 2 No 3 (2020): Maret 2020
Publisher : Universitas Muhammadiyah Malang
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.22219/repositor.v2i3.470
Tidak selamanya cuaca di Indonesia berjalan dengan normal atau sesuai dengan musimnya, cuaca sering berubah secara tiba-tiba setiap saat karena ada faktor-faktor yang mempengaruhi penurunan dan peningkatan curah hujan. perkiraan cuaca sangatlah dibutuhkan dan sangat bermanfaat olah berbagai pihak karena bisa menjadi acuan bagi berbagai kalangan untuk menjalani kegiatan mereka sehari-hari. Penelitian dilakukan menggunakan metode Deep Learning karena dari beberapa penelitian sebelumnya yang menggunakan Deep Learning dalam kasus yang berbeda mampu menghasilkan akurasi diatas 85%. Deep learning adalah jaringan yang terdiri dari beberapa layer. Layer-layer tersebut berasal dari kumpulan node-node. Arsitektur yang digunakan yaitu Long Short Term Memory(LSTM) karena pada penelitian-penelitian sebelumnya menggunakan LSTM dalam kasus yang berbeda mendapat hasil yang baik yaitu RME yang dihasilkan kecil. LSTM memiliki struktur seperti rantai dan struktur pada tiap sel terdapat 3 gate yaitu forget gate, input gate, dan output gate. Oleh karena itu, perhitungan yang dilakukan lebih kompleks ditambah lagi dengan Deep Learning diharapkan mendapat hasil yang lebih akurat. Data yang digunakan yaitu data curah hujan kota Malang yang berasal dari BMKG.
Implementasi Teknik Seleksi Fitur Pada Klasifikasi Malware Android Menggunakan Support Vector Machine
Hendra Saputra;
Setio Basuki;
Mahar Faiqurahman
Fountain of Informatics Journal Vol 3, No 1 (2018): Mei
Publisher : Universitas Darussalam Gontor
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.21111/fij.v3i1.1875
Android Malware has grown significantly along with the advance of the times and the increasing variety of technique in the development of Android. Machine Learning technique is a method that now we can use in the modeling the pattern of a static and dynamic feature of Android Malware. In the level of accuracy of the Malware type classification, the researcher connect between the application feature with the feature required by each type of Malware category. The category of malware used is a type of Malware that many circulating today, to classify the type of Malware in this study used Support Vector Machine (SVM). The SVM type will be used is class SVM one against one using the RBF Kernel. The feature will be used in this classification are the Permission and Broadcast Receiver. To improve the accuracy of the classification result in this study used Feature Selection method. Selection of feature used is Correlation-based Feature Selection (CFS), Gain Ratio (GR) and Chi-Square (CHI). A result from Feature Selection will be evaluated together with result that not use Feature Selection. Accuracy Classification Feature Selection CFS result accuracy of 90.83%, GR and CHI of 91.25% and data that not use Feature Selection of 91.67%. The result of testing indicates that permission and broadcast receiver can be used in classifying type of Malware, but the Feature Selection method that used have accuracy is a little below the data that are not using Feature Selection.
Case Based Reasioning (CBR) for Medical Question Answering System
Wicaksono, Galih Wasis;
Rizky, Alfira;
Basuki, Setio
Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control Vol 3, No 2, May-2018
Publisher : Universitas Muhammadiyah Malang
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (421.366 KB)
|
DOI: 10.22219/kinetik.v3i2.263
In this research, the researchers implement a medical Question Answering System (QAS), a complaint system in the form of sentences or paragraphs of questions about the complaint (illness) suffered by a person. Afterwards, the system will give answer to the questions with answers in the form of diagnosis based on the system knowledge. The system in this study has knowledge of the system obtained based on Case Based Reasoning (CBR) method from the previous cases stored in the database. When there is a new case, the system will perform a matching process using CBR and Sorenson Coefficient calculations to find out which the previous cases have the highest percentage of matches with the new case. Then the selected previous cases will be taken and given to the new case. Testing is processed by using 2 types of testing, expert validation testing with result of 28 data of appropriate test from 30 test data and accuracy testing resulting of 93,33% from the appropriate test data.
Detect Malware in Portable Document Format Files (PDF) Using Support Vector Machine and Random Decision Forest
Charim, Abdachul;
Basuki, Setio;
Akbi, Denar Regata
JOIN (Jurnal Online Informatika) Vol 3, No 2 (2018)
Publisher : Department of Informatics, UIN Sunan Gunung Djati Bandung
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.15575/join.v3i2.196
Portable Document Format is a very powerful type of file to spread malware because it is needed by many people, this makes PDF malware not to be taken lightly. PDF files that have been embedded with malware can be Javascript, URL access, media that has been infected with malware, etc. With a variety of preventive measures can help to spread, for example in this study using the classification method between dangerous files or not. Two classification methods that have the highest accuracy value based on previous research are Support Vector Machine and Random Forest. There are 500 datasets consisting of 2 classes, namely malicious and not malicius and 21 malicius PDF features as material for the classification process. Based on the calculation of Confusion Matrix as a comparison of the results of the classification of the two methods, the results show that the Random Forest method has better results than Support Vector Machine even though its value is still not perfect.
Diabetes prediction based on discrete and continuous mean amplitude of glycemic excursions using machine learning
Lailis Syafaah;
Setio Basuki;
Fauzi Dwi Setiawan Sumadi;
Amrul Faruq;
Mauridhi Hery Purnomo
Bulletin of Electrical Engineering and Informatics Vol 9, No 6: December 2020
Publisher : Institute of Advanced Engineering and Science
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.11591/eei.v9i6.2387
Chronic hyperglycemia and acute glucose fluctuations are the two main factors that trigger complications in diabetes mellitus (DM). Continuous and sustainable observation of these factors is significant to be done to reduce the potential of cardiovascular problems in the future by minimizing the occurrence of glycemic variability (GV). At present, observations on GV are based on the mean amplitude of glycemic excursion (MAGE), which is measured based on continuous blood glucose data from patients using particular devices. This study aims to calculate the value of MAGE based on discrete blood glucose observations from 43 volunteer patients to predict the diabetes status of patients. Experiments were carried out by calculating MAGE values from original discrete data and continuous data obtained using Spline Interpolation. This study utilizes the machine learning algorithm, especially k-Nearest Neighbor with dynamic time wrapping (DTW) to measure the distance between time series data. From the classification test, discrete data and continuous data from the interpolation results show precisely the same accuracy value that is equal to 92.85%. Furthermore, there are variations in the MAGE value for each patient where the diabetes class has the most significant difference, followed by the pre-diabetes class, and the typical class.
Case Based Reasioning (CBR) for Medical Question Answering System
Setio Basuki;
Alfira Rizky;
Galih Wasis Wicaksono
Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control Vol 3, No 2, May-2018
Publisher : Universitas Muhammadiyah Malang
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (421.366 KB)
|
DOI: 10.22219/kinetik.v3i2.263
In this research, the researchers implement a medical Question Answering System (QAS), a complaint system in the form of sentences or paragraphs of questions about the complaint (illness) suffered by a person. Afterwards, the system will give answer to the questions with answers in the form of diagnosis based on the system knowledge. The system in this study has knowledge of the system obtained based on Case Based Reasoning (CBR) method from the previous cases stored in the database. When there is a new case, the system will perform a matching process using CBR and Sorenson Coefficient calculations to find out which the previous cases have the highest percentage of matches with the new case. Then the selected previous cases will be taken and given to the new case. Testing is processed by using 2 types of testing, expert validation testing with result of 28 data of appropriate test from 30 test data and accuracy testing resulting of 93,33% from the appropriate test data.
Seleksi Fitur Relieff Pada Klasifikasi Malware Android Menggunakan Support Vector Machine(SVM)
irma fitriani;
Setio Basuki;
Agus Eko Minarno
Jurnal Repositor Vol 2 No 11 (2020): November 2020
Publisher : Universitas Muhammadiyah Malang
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.22219/repositor.v2i11.901
Seiring berkembangnya jaman perkembangan malware android terus mengalami peningkatan setiap tahunnya.Machine Learning adalah salah satu teknik yang bisa kita gunakan dalam melakukan analisa malware android dengan 2 model pendekatan statis dan dinamis.Penulis menggunakan Support Vector Machine(SVM) untuk proses klasifikasiannya dan menggunakan kernel RBF. Fitur yang digunakan dalam penelitian ini adalah Permission dan Broadcast Receiver. Untuk menambah hasil akurasinya digunakan metode Seleksi Fitur Relieff. Dan Seleksi Fitur pembandingnya adalah Chi-Square(CHI),Correlation-based Feature Selection(CFS), dan Gain Ratio(GR). Hasil dari Seleksi Fitur Relieff akan di evaluasi dengan Seleksi Fitur pembandingnya serta juga dengan hasil klasifikasi tanpa menggunakan Seleksi Fitur. Akurasi klasifikasi Seleksi Fitur Relieff menghasilkan 33.33333%, hasil akurasi Seleksi Fitur pembanding lainnya juga memberikan hasil sama dengan Seleksi Fitur Relieff. Sedangkan hasil klasifikasi tanpa Seleksi Fitur memberikan hasil yang cukup tinggi yaitu 95%. Hasil pengujian menunjukkan bahwa Seleksi Fitur tidak cocok digunakan dengan data yang sedikit karna memberikan hasil yang jauh lebih rendah dari tanpa menggunakan Seleksi Fitur.
Klasifikasi Sinopsis Novel Menggunakan Metode Naïve Bayes Classifier
Vinna Rahmayanti Setyaning Nastiti;
Setio Basuki;
Hilman Hilman
Jurnal Repositor Vol 1 No 2 (2019): Desember 2019
Publisher : Universitas Muhammadiyah Malang
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.22219/repositor.v1i2.799
Tidak dapat dipungkiri kemajuan teknologi berkembang dengan sangat cepat terutama di bidang komputer, saat ini dengan komputer pekerjaan yang mulanya dikerjakan oleh manusia dapat di ambil alih komputer guna membantu pekerjaan manusia itu sendiri, seperti halnya studi kasus pada penelitian ini yaitu sebuah sistem yang dapat mengklasifikasikan teks berupa sinopsis kedalam kelompok genrenya. Genre adalah gaya cerita dalam sebuah novel, terdapat banyak genre pada novel diantaranya genre romantis, komedi, misteri, horor dan lain-lain, dengan mengetahui genre novel pembaca akan dapat mengetahui gaya cerita novel tersebut. Metode yang digunakan pada penelitian ini adalah metode TF-IDF (Term Frequency Inverse Document Frequency) dan Naïve Bayes Classifier. Metode TF-IDF digunakan untuk mendapatkan bobot dari setiap kata yang terkandung dalam dokumen yang hasilnya digunakan dalam metode Naïve Bayes Classifier untuk mendapatkan hasil klasifikasi sinopsis kedalam bentuk genre. Berdasarkan evaluasi menggunakan confusion matrix dengan menggunakan 600 data latih dan 200 data uji didapatkan akurasi sebesar 80,5%.