Era Big Data saat ini, kumpulan data memiliki struktur yang sangat beragam serta dimensi yang tinggi. Dimensi tinggi ini memiliki independen atribut, dependen atribut, data yang tidak relevan dan tidak berguna yang menjadi sumber masalah dalam mendapatkan akurasi yang terbaik di proses penerapan metode klasifikasi prediksi. Pemilihan fitur pada setiap kasus klasifikasi prediksi sangat penting untuk dilakukan karena merupakan komponen dalam pembelajaran mesin dan alur kerja penelitian. Dalam penelitian ini, pemilihan fitur atribut data menggunakan metode wrapper dan embedded yang dilakukan pada dataset mahasiswa yang telah menyelesaikan sarjana di perguruan tinggi sebanyak 146 data yang memiliki 13 atribut data dan 1 label. Metode pemilihan fitur ini dilakukan untuk mendapatkan atribut data yang sesuai yang nantinya digunakan dalam proses klasifikasi prediksi mahasiswa yang telah lulus tepat waktu atau tidak. Hasil penelitian menunjukkan dengan menggunakan algoritma Random Forest Classification, nilai akurasinya sebesar 73% dan terjadi peningkatan akurasi setelah menggunakan metode pemilihan fitur wrapper dan embedded sebesar 100%.
Copyrights © 2021