Telematika
Vol 13, No 1: Februari (2020)

Implementasi Data Mining Menggunakan Algoritme Naive Bayes Classifier dan C4.5 untuk Memprediksi Kelulusan Mahasiswa

Endang Etriyanti (Universitas Bina Darma Palembang)
Dedy Syamsuar (Universitas Bina Darma)
Yesi Novaria Kunang (Universitas Bina Darma)



Article Info

Publish Date
28 Feb 2020

Abstract

Abstract: The inability of students to complete their studies on time is faced by most of higher education institution. STMIK Bina Nusantara Jaya Lubuklinggau is one of those which is experienced with this matter. In most cases, the students could complete their studies longer than the expected duration. From 162 students of Sistem Informasi study program in the year 2013 and 2014 there were 117 students completed their studies on time, while 45 students were late. As a result, it could prevent new students to join the instituion since the limited student capacity. This study deploys data mining technique in predicting graduation status of students on time. First, preprocessing is used to obtain a good dataset. Secondly, the data is processed to obtain a set of prediction. In this step, two mining algoritm were applied – Naive bayes classifier and C4.5 algoritm to be knowing the performance of the two methods, the method has a greater accuracy value will be recommended to solving the problem of prediction of students graduation at STMIK Bina Nusantara Jaya Lubuklinggau. Thirdly, the result then was validated using K-Fold Cross Validation technique. Finally, Coffusion Matrix is deployed to ensure the accuration of the prediction. The results indicates that the C4.5 Algorithm method can be used to predict student graduation status with an accuracy rate of 79,08% while the accuracy rate of the Naive Bayes Classifier method is only 78,46%. The dominan factor is IPK-S4 variable.Abstrak: Ketidakmampuan mahasiswa untuk menyelesaikan studi tepat waktu dialami oleh sebagian besar Lembaga Pendidikan Tinggi. STMIK Bina Nusantara Jaya Lubuklinggau adalah salah satu perguruan tinggi yang mengalami hal tersebut. Dalam banyak kasus para mahasiswa menyelesaikan studi mereka lebih lama dari rentang waktu yang diharapkan. Dari 162 mahasiswa program studi Sistem Informasi tahun angkatan 2013 dan 2014 terdapat 117 mahasiswa yang menyelesakan studinya tepat waktu, sedangkan 45 mahasiswa terlambat. Akibatnya hal tersebut dapat menghambat mahasiswa baru untuk bergabung dengan lembaga karena kapasitas mahasiswa yang terbatas. Penelitian ini menggunakan teknik data mining dalam memprediksi status kelulusan mahasiswa tepat waktu. Pertama, preprocessing digunakan untuk mendapatkan dataset yang berkualitas. Kedua, data diproses untuk mendapatkan serangkaian prediksi. Pada langkah ini, dua algoritma data mining diterapkan - Naive Bayes Classifier dan Algoritma C4.5 dengan tujuan untuk mengetahui kinerja dari kedua metode, metode dengan tingkat akurasi yang lebih besar akan direkomendasikan untuk menyelesaikan masalah prediksi kelulusan mahasiswa pada STMIK Bina Nusantara Jaya Lubuklinggau. Ketiga, hasilnya kemudian divalidasi menggunakan teknik K-Fold Cross Validation. Terakhir, Coffusion Matrix digunakan untuk memvalidasi nilai akurasi hasil prediksi. Hasil penelitian menunjukkan bahwa metode Algoritma C4. dapat digunakan untuk memprediksi status kelulusan mahasiswa dengan tingkat akurasi 79,08% sedangkan metode  Naive Bayes Classifier hanya 78,46%. Dengan faktor dominan adalah variabel IPK-S4.

Copyrights © 2020






Journal Info

Abbrev

TELEMATIKA

Publisher

Subject

Education

Description

Jl. Letjend Pol. Soemarto No.126, Watumas, Purwanegara, Kec. Purwokerto Utara, Kabupaten Banyumas, Jawa Tengah ...