Data yang memiliki tipe kategorikal dan numerikal seperti data jadwal kerja memiliki tantangan tersendiri untuk dapat dilakukan prediksi karena data tipe kategorikal perlu perhatian khusus. Decision tree merupakan salah satu algoritma yang dapat digunakan untuk prediksi dan dapat menggunakan data kategorikal maupun data numerikal. Salah satu library yang dapat digunakan untuk menerapkan decision tree adalah scikit-learn, yang berjalan di python. Scikit-learn menerapkan optimasi dari algoritma CART dan meskipun hanya dapat mengolah data numerikal, library ini menyediakan fitur untuk menangani data kategorikal. Penelitian ini membuat model decision tree menggunakan scikit-learn untuk membuat model prediksi jadwal kerja. Data yang digunakan berjumlah 54 data dengan 3 variabel kategorikal dan 1 variabel numerikal. Dari hasil penerapan diperoleh sebuah model decision tree dengan kedalaman pohon adalah 6. Hasil evaluasinya menunjukkan hasil yang baik yaitu nilai akurasi mencapai di atas 0,7 dan presisi mencapai di atas 0,9. Persentase pemisahan data terbaik adalah dengan menggunakan 30% data uji dan 70% data latih. Saat dibandingkan, model decision tree memiliki akurasi yang lebih baik dibandingkan KNN, di mana akurasi decision tree dapat mencapai angka di atas 0,8 sedangkan KNN dibawah itu.
Copyrights © 2019