Software yang tidak ditemukan cacat selama pemeriksaan dan pengujian merupakan software berkualitas tinggi yang mampu membantu proses bisnis perusahaan secara efektif dan efesien. Penurunan kualitas software dan biaya perbaikan yang tinggi dapat diakibatkan kesalahan atau cacat pada software. Saat ini belum ada model prediksi cacat software yang berlaku umum pada saat digunakan. C5.0 merupakan model klasifikasi yang cocok untuk data dengan attribut yang bersifat numerik ataupun attribut yang bernilai nominal yaitu bersifat kategorik dimana tiap nilai tidak bisa dijumlahakan atau dikurangkan, tetapi belum dapat mengklasifikasikan dataset berbasis matrix dengan kinerja terbaik secara umum dan selalu konsisten dalam semua penelitian. Dataset yang besar pada umumnya mengandung ketidakseimbangan kelas (class imbalance), yaitu adanya perbedaan yang signifikan antar jumlah kelas, yang mana kelas negatif lebih besar daripada kelas positif. Untuk menangani masalah ketidakseimbangan kelas pada dataset cacat software pada penelitian ini diusulkan metode resampling yaitu Random Under Sampling (RUS), Random Over Sampling (ROS) dan Synthetic Minority Over-sampling Technique (SMOTE). Penelitian dilakukan untuk membandingkan hasil kinerja C5.0 sebelum dan sesudah diterapkan metode resampling. Hasil penelitian menunjukkan bahwa metode resampling yaitu RUS terbukti mampu dalam menyelesaikan prediksi cacat software dengan algoritma C5.0.
Copyrights © 2023