Claim Missing Document
Check
Articles

Found 7 Documents
Search

Prediksi Kemungkinan Diabetes pada Tahap Awal Menggunakan Algoritma Klasifikasi Random Forest Widya Apriliah; Ilham Kurniawan; Muhamad Baydhowi; Tri Haryati
Sistemasi: Jurnal Sistem Informasi Vol 10, No 1 (2021): Sistemasi: Jurnal Sistem Informasi
Publisher : Program Studi Sistem Informasi Fakultas Teknik dan Ilmu Komputer

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (686.917 KB) | DOI: 10.32520/stmsi.v10i1.1129

Abstract

AbstrakDiabetes adalah salah satu penyakit kronis yang mengancam jiwa dengan pertumbuhan tercepat yang telah mempengaruhi 422 juta orang di seluruh dunia menurut laporan Organisasi Kesehatan Dunia (WHO), pada tahun 2018. Diabetes dianggap sebagai salah satu penyakit paling mematikan dan kronis yang menyebabkan peningkatan gula darah. Banyak komplikasi terjadi jika diabetes tetap tidak diobati dan tidak teridentifikasi. Namun, peningkatan pendekatan machine learning memecahkan masalah kritis ini. Tujuan dari penelitian ini adalah merancang model yang dapat memprakirakan kemungkinan terjadinya diabetes pada pasien dengan ketelitian yang maksimal. Klasifikasi adalah teknik data mining yang menetapkan kategori pada kumpulan data untuk membantu dalam memprediksi dan analisis yang lebih akurat. Oleh karena itu tiga algoritma klasifikasi machine learning yaitu Suport Vector Machine, Naive Bayes dan Random Forest digunakan dalam percobaan ini untuk mendeteksi diabetes secara dini. Eksperimen dilakukan menggunakan dataset Diabetes Hospital in Sylhet, Bangladesh yang bersumber dari UCI repository. Performa ketiga algoritma dievaluasi pada berbagai ukuran seperti Precision, Accuracy, F-Measure, dan Recall. Akurasi diukur melalui instance yang diklasifikasikan dengan benar dan salah. Hasil yang diperoleh menunjukkan Random Forest mengungguli dengan nilai akurasi tertinggi 97,88% dibandingkan algoritma lain. Hasil ini diverifikasi menggunakan kurva Receiver Operating Characteristic (ROC) secara tepat dan sistematis.Kata Kunci: diabetes, naive bayes, random forest, akurasi, support vector machine, machine learning AbstractDiabetes is one of the fastest growing, life-threatening chronic diseases affecting 422 million people worldwide, according to a report by the World Health Organization (WHO) in 2018. Diabetes is considered to be one of the most deadly and chronic diseases that cause elevated blood sugar. Many complications occur if diabetes remains untreated and unidentified. However, an improved machine learning approach solves this critical problem. The aim of this study is to design a model that can predict the likelihood of diabetes occurr in patients with maximum accuracy. Therefore, three machine learning classification algorithms, namely Support Vector Machine, Naive Bayes and Random Forest, were used in this experiment to detect diabetes early. Experiments were conducted using the Diabetes Hospital in Sylhet, Bangladesh dataset sourced from the UCI repository. The performance of the three algorithms is evaluated on various measures such as Precision, Accuracy, F-Measure, and Recall. Accuracy is measured through correctly and incorrectly classified instances. The results obtained showed that Random Forest outperformed with the highest accuracy value of 97.88% compared to other algorithms. These results are verified using the Receiver Operating Characteristic (ROC) curve accurately and systematically.Keywords: diabetes, naive bayes, random forest, accuracy,  machine learning, support vector machine
Klasifikasi Tweet Berdasarkan Keterkaitan Tweet Terhadap Topik Tertentu Pada Twitter Menggunakan Naïve Bayes Muhamad Baydhowi; Widya Apriliah; Ilham Kurniawan
INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS : Journal of Information System Vol 4 No 1 (2019): INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS (Desember 2019)
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat Universitas Bina Insani

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (244.434 KB)

Abstract

Abstrak: Twitter merupakan salah satu jejaring sosial atau mikroblog yang memungkinkan penggunanya untuk mengirim dan membaca pesan yang di sebut kicauan (tweets) yang berisi 140 karakter. Indonesia menduduki urutan ke lima jumlah pengguna (user) Twitter terbanyak di seluruh dunia dan Jakarta adalah kota yang paling aktif diseluruh dunia dalam membuat posting di Twitter. Berdasarkan informasi tersebut, kita dapat memanfaatkan data tweet untuk kepentingan tertentu seperti mengklasifikasikan tweet berdasarkan ketertarikan terhadap topik tertentu dengan kriteria yang telah ditentukan. Hasil penelitian ini diharapkan dapat digunakan untuk mendapatkan user potensial yang terkait dengan topik yang telah ditentukan sebagai sasaran marketing dari produk yang berkaitan dengan topik yang telah ditentukan sebelumnya. Namun penentuan klasifikasi tweet yang terkait dan tidak terkait dengan suatu topik manjadi kendala bagi para internet marketer. Tujuan penelitian ini adalah untuk menemukan metode klasifikasi tweet berdasarkan label terkait dan tidak terkait untuk kategori tertentu berdasarkan isi teks dari tweet tersebut. Data tweet diolah sehingga membentuk Bag of Words yang nantinya akan digunakan sebagai data training untuk melakukan klasifikasi dengan algoritma Naïve Bayes terhadap tweet yang diinput sebagai data testing. Kata kunci: Bag of words, Internet marketer, Klasifikasi, Naïve Bayes, Tweet. Abstract: Twitter is one of the social network or microblog that allows users to send and read messages called tweets that contain 140 characters. Indonesia ranks the fifth largest number of Twitter users worldwide and Jakarta is the most active city in the world in posting on Twitter. Based on that information, we can utilize tweet data for specific purposes such as classifying tweets based on interest in a particular topic with predetermined criteria. The results of this study are expected to be used to obtain potential users associated with the topic that has been determined as a marketing target of the product relating to a predetermined topic. But determining the classification of related tweets and unrelated tweets to a topic becomes an obstacle for the internet marketers. The purpose of this research is to find the method of tweet classification based on related and unrelated labels for certain categories based on the text content of the tweet. Tweet data is processed and becomes Bag of Words which will be used as training data to classify tweet that inputted as testing data with Naïve bayes algorithm. Keywords: Bag of words, Classification, Internet marketer, Naïve bayes, Tweet.
Prediksi Gejala Autism Spectrum Disorders pada Remaja Menggunakan Optimasi Particle Swarm Optimization dan Algoritma Support Vector Machine Ilham Kurniawan
INFORMATICS FOR EDUCATORS AND PROFESSIONAL : Journal of Informatics Vol 4 No 2 (2020): INFORMATICS FOR EDUCATORS AND PROFESSIONAL : JOURNAL OF INFORMATICS (Juni 2020)
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat Universitas Bina Insani

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (374.863 KB) | DOI: 10.51211/itbi.v4i2.1306

Abstract

Abstrak: Telah ada peningkatan prevalensi diagnosis Autism Spectrum Disorder (ASD) secara global selama dekade terakhir. Perkiraan prevalensi ASD yang diperbarui dan keseluruhan di Asia akan membantu para profesional kesehatan untuk mengembangkan strategi kesehatan masyarakat yang relevan. Dalam penelitian ini, mengusulkan metode untuk prediksi gejala ASD menggunakan teknik integrasi seleksi fitur PSO dan algoritma Support Vector Machine. Penelitian ini menggunakan dataset dari UCI repository. Model yang diusulkan meliputi penerapan seleksi fitur menggunakan particle swarm optimization (PSO), dengan algoritma pengklasifikasi. Hasil akhir akan dilakukan perbandingan pengujian dan analisa terhadap model prediksi yang memiliki tingkat akurasi tertinggi atau terbaik dalam prediksi gejala ASD. Dalam penelitian ini menggunakan dataset UCI repository yaitu data ASD pada remaja, data tersebut memiliki jumlah data sebanyak 104 instance dan 21 atribut, 41 orang tidak menderita ASD dan 63 orang menderita ASD, tools yang digunakan untuk menerapkan model usulan menggunakan aplikasi Weka versi 3.8.4. Untuk mengetahui model usulan yang diajukan pada penelitian ini, pertama menguji dengan klasifikasi tunggal SVM, dan kedua, menguji dengan seleksi fitur PSO dan algoritma klasifikasi SVM. Untuk mengetahui apakah seleksi fitur PSO berpengaruh terhadap performa algoritma klasifikasi SVM. Pengujian pertama, nilai akurasi yang dihasilkan oleh algoritma klasifikasi SVM adalah sebesar 89.42%, dan nilai AUC sebesar 0.891. Berdasarkan pengujian yang kedua yaitu menggunakan seleksi fitur PSO, seleksi fitur PSO dapat meningkatkan performa algoritma klasifikasi SVM sebesar 2,88% dan nilai AUC sebesar 0,024. Kata kunci: Autism Spectrum Disorder, Particle Swarm Optimizatio, Support Vector Machine Abstract: There has been an increase in the prevalence of diagnoses of Autism Spectrum Disorder (ASD) globally over the past decade. Updated and overall ASD prevalence estimates in Asia will help health professionals to develop relevant public health strategies. In this study, proposing a method for ASD symptom prediction using PSO feature selection integration techniques and the Support Vector Machine algorithm. This study uses a dataset from the UCI repository. The proposed model includes the application of feature selection using particle swarm optimization (PSO), with the classification algorithm. The final result will be a comparison test and analysis of prediction models that have the highest or best accuracy in predicting ASD symptoms. In this study using the UCI repository dataset, ASD data on adolescents, the data has 104 data and 21 attributes, 41 people do not suffer from ASD and 63 people suffer from ASD, tools used to implement the proposed model using the Weka application version 3.8.4 . To find out the proposed model proposed in this study, firstly testing with SVM single classification, and secondly, testing with PSO feature selection and SVM classification algorithm. To find out whether the PSO feature selection affects the performance of the SVM classification algorithm. The first test, the accuracy value generated by the SVM classification algorithm is 89.42%, and the AUC value is 0.891. Based on the second test using PSO feature selection, PSO feature selection can improve the performance of the SVM classification algorithm by 2.88% and the AUC value of 0.024. Keywords: Autism Spectrum Disorder, Particle Swarm Optimizatio, Support Vector Machine.
Klasifikasi Tweet Berdasarkan Keterkaitan Tweet Terhadap Topik Tertentu Pada Twitter Menggunakan Naïve Bayes Muhamad Baydhowi; Widya Apriliah; Ilham Kurniawan
INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS : Journal of Information System Vol 4 No 1 (2019): INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS (Desember 2019)
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat Universitas Bina Insani

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (244.434 KB)

Abstract

Abstrak: Twitter merupakan salah satu jejaring sosial atau mikroblog yang memungkinkan penggunanya untuk mengirim dan membaca pesan yang di sebut kicauan (tweets) yang berisi 140 karakter. Indonesia menduduki urutan ke lima jumlah pengguna (user) Twitter terbanyak di seluruh dunia dan Jakarta adalah kota yang paling aktif diseluruh dunia dalam membuat posting di Twitter. Berdasarkan informasi tersebut, kita dapat memanfaatkan data tweet untuk kepentingan tertentu seperti mengklasifikasikan tweet berdasarkan ketertarikan terhadap topik tertentu dengan kriteria yang telah ditentukan. Hasil penelitian ini diharapkan dapat digunakan untuk mendapatkan user potensial yang terkait dengan topik yang telah ditentukan sebagai sasaran marketing dari produk yang berkaitan dengan topik yang telah ditentukan sebelumnya. Namun penentuan klasifikasi tweet yang terkait dan tidak terkait dengan suatu topik manjadi kendala bagi para internet marketer. Tujuan penelitian ini adalah untuk menemukan metode klasifikasi tweet berdasarkan label terkait dan tidak terkait untuk kategori tertentu berdasarkan isi teks dari tweet tersebut. Data tweet diolah sehingga membentuk Bag of Words yang nantinya akan digunakan sebagai data training untuk melakukan klasifikasi dengan algoritma Naïve Bayes terhadap tweet yang diinput sebagai data testing. Kata kunci: Bag of words, Internet marketer, Klasifikasi, Naïve Bayes, Tweet. Abstract: Twitter is one of the social network or microblog that allows users to send and read messages called tweets that contain 140 characters. Indonesia ranks the fifth largest number of Twitter users worldwide and Jakarta is the most active city in the world in posting on Twitter. Based on that information, we can utilize tweet data for specific purposes such as classifying tweets based on interest in a particular topic with predetermined criteria. The results of this study are expected to be used to obtain potential users associated with the topic that has been determined as a marketing target of the product relating to a predetermined topic. But determining the classification of related tweets and unrelated tweets to a topic becomes an obstacle for the internet marketers. The purpose of this research is to find the method of tweet classification based on related and unrelated labels for certain categories based on the text content of the tweet. Tweet data is processed and becomes Bag of Words which will be used as training data to classify tweet that inputted as testing data with Naïve bayes algorithm. Keywords: Bag of words, Classification, Internet marketer, Naïve bayes, Tweet.
Penerapan Teknik Random Undersampling untuk Mengatasi Imbalance Class dalam Prediksi Kebakaran Hutan Menggunakan Algoritma Decision Tree Ilham Kurniawan; Duwi Cahya Putri Buani; abdussomad abdussomad; Widya Apriliah; Eka Fitriani
Academic Journal of Computer Science Research Vol 5, No 1 (2023): Academic Journal of Computer Science Research (AJCSR)
Publisher : Institut Teknologi dan Bisnis Bina Sarana Global

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.38101/ajcsr.v5i1.617

Abstract

Kebakaran hutan ialah bencana yang memicu kerusakan ekonomi dan ekologi juga meneror kehidupan manusia. Oleh karena itu, memprediksi problem lingkungan semacam kebakaran hutan benar-benar penting untuk meminimalisir ancaman kejadian bencana alam seperti kebakaran hutan. Dalam penelitian ini kami mengusulkan algoritma klasifikasi decision tree untuk memprediksi kebakaran hutan. Prediksi kebakaran hutan dilandaskan pada data meteorologi yang sesuai dengan elemen cuaca yang mempengaruhi terjadinya kebakaran hutan, yaitu suhu, kelembaban relatif dan kecepatan angin. Kami telah mendapati akurasi sekitar 94,52% mengenai prediksi kebakaran hutan dengan algoritma klasifikasi decision tree yang diusulkan. Nilai akurasi tersebut diperkuat dengan nilai ROC sebesar 0,950 yang melambangkan representasi dari algoritma klasifikasi yang dibangun untuk memprediksi kebakaran hutan, semakin mendekati angka 1 maka semakin baik juga algoritma klasifikasi yang dibangun.
Implementasi Algoritma Random Forest Untuk Menentukan Penerima Bantuan Raskin Ilham Kurniawan; Duwi Cahya Putri Buani; Abdussomad Abdussomad; Widya Apriliah; Rizal Amegia Saputra
Jurnal Teknologi Informasi dan Ilmu Komputer Vol 10 No 2: April 2023
Publisher : Fakultas Ilmu Komputer, Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25126/jtiik.20231026225

Abstract

Kemiskinan adalah salah satu perhatian mendasar dari setiap pemerintah. Program Beras Keluarga Miskin (Raskin) merupakan  salah satu program pemerintah. Skema raskin mempunyai tujuan meminimalisir beban rumah tangga tidak mampu sebagai bentuk bantuan untuk menaikkan ketahanan pangan melalui perlindungan sosial. Tujuan penelitian ini adalah menemukan akurasi tertinggi di antara algoritma klasifikasi prediktif yang diusulkan penerima bantuan raskin menggunakan tools python machine learning dan di implementasikan melalui suatu website. Klasifikasi adalah metode penambangan data yang menentukan kategori pada kelompok data untuk mendukung prediksi dan analisa yang semakin akurat. Beberapa algoritma klasifikasi pembelajaran mesin seperti, SVM, NB dan RF, digunakan pada penelitian ini demi menentukan penerima bantuan raskin. Eksperimen dilakukan menggunakan dataset Raskin Kelurahan Gunungparang, Kota Sukabumi yang bersumber dari Kelurahan Gunungparang. Kinerja algoritma klasifikasi dievaluasi dengan beragam metrik seperti Precision, Accuracy, F-Measure, dan Recall. Akurasi diukur melalui contoh yang dikelompokan dengan benar atau salah. Hasil yang diperoleh menunjukkan algoritma klasifikasi RF memiliki nilai precision, recall, f-measure dengan nilai 97%, nilai accuracy sebesar  97,26% dan nilai ROC 0,970, lebih baik dari algoritma klasifikasi lainnya yaitu perbedaan sebesar 5,11% dengan algoritma klasifikasi support vector machine dan 8,87% dengan algoritma klasifikasi naive bayes. Akurasi sangat baik digunakan sebagai acuan kinerja algoritma apabila jumlah False Negative dan False Positive jumlah nya mendekati. Hasil penelitian ini dibuktikan secara akurat dan sistematis menggunakan Receiver Operating Characteristic (ROC). Abstract The problem of poverty is one of the fundamental concerns of every government. The Raskin  program is one of the government's programs. The Raskin scheme has the aim of minimizing the burden on poor households in the form of assistance to improve food security by providing social protection. The purpose of this study is to find the highest accuracy among the predictive classification algorithms proposed by Raskin beneficiaries using python machine learning tools and implemented through a website. Classification is a data mining method that determines categories in data groups to support more accurate predictions and analysis. Therefore, three machine learning classification algorithms such as, support vector machine, naive bayes and random forest, were used in this experiment. to determine recipients of Raskin assistance. The experiment was carried out using the Raskin dataset, Gunungparang Village, Sukabumi City, which was sourced from Gunungparang Village. The performance of the classification algorithm is evaluated by various metrics such as Precision, Accuracy, F-Measure, and Recall. Accuracy is measured by correctly and incorrectly grouped samples. The results obtained show that the random forest classification algorithm has precision, recall, f-measure values with a value of 97%, an accuracy value of 97.26% and an ROC value of 0.970, better than other classification algorithms, namely the difference of 5.11% with the support vector classification algorithm. machine and 8.87% with naive bayes classification algorithm. Very good accuracy is used as a reference for algorithm performance if the number of False Negatives and False Positives is close. These results were proven accurately and systematically using Receiver Operating Characteristics (ROC).
Implementasi Model Rapid Application Development untuk Aplikasi Pelayanan Jasa Maintenance Pada PT. Dwi Tirtamas Tekhnik Karawang Widya Apriliah; Priska Agrelia; Ilham Kurniawan; Abdussomad Abdussomad
PROFITABILITAS Vol 2 No 1 (2022): Juni 2022
Publisher : Sistem Informasi Akuntansi Kampu Kabupaten Karawang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31294/profitabilitas.v2i1.1290

Abstract

Information is one of the important things that affect the development of business activities in the business sector, whether it's a service business or non-service, To realize this, currently in all aspects of the business field, there is no need to apply technology to produce information and support data processing in its business processes. In service, it also requires the support of an information system to facilitate data processing and effectiveness in providing services. At PT. Dwi Tirtamas The current technique requires an information system to be applied to maintenance service business activities to facilitate data processing, report presentation, information delivery and make it easier to provide maintenance services to customers. Therefore, in this research, an information system will be designed and built for maintenance services at PT. Dwi Tirtamas Karawang Technique. The software development model used in this study is the RAD (Rapid Application Development) model and the programming language for building an information system for maintenance services using the Java programming language.