Software berkualitas tinggi adalah software yang tidak ditemukan cacat (defect) selama proses pemeriksaan atau pengujian. Biaya perbaikan cacat software jauh lebih mahal dibanding biaya saat pengembangan. Prediksi cacat software diusulkan untuk menentukan prioritas modul software yang akan diuji, sehingga mampu meningkatkan kualitas software serta mungurangi biaya. Masalah utama dalam software defect prediction adalah redundant data, korelasi, fitur yang tidak relevan dan missing samples. 62 penelitian dari 208 penelitian dalam pengembangan model prediksi cacat software menggunakan dataset NASA (National Aeronautics and Space Administration) MDP Repository. Penanganan imbalance class dilakukan dengan menggunakan sampling technique Distribution Based Balance dan pendekatan level algoritma dengan teknik ensemble learning menggunakan Bagging. Algoritma klasifikasi yang digunakan dalam penelitian ini yaitu classifier Naïve Bayes. Hasil penelitian menunjukkan bahwa model yang diusulkan mencapai akurasi dan AUC klasifikasi yang lebih tinggi. Pada Model Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes rata-rata nilai akurasi mencapai 98,71%, rata-rata nilai AUC 0.987 dengan nilai rata-rata peningkatan presentase AUC mencapai 0.373. Sedangkan pada model pembanding yaitu Integrasi SMOTE dan Teknik Ensemble Naïve Bayes rata-rata nilai akurasi mencapai 73,30%, rata-rata nilai AUC 0,639 dengan nilai rata-rata peningkatan presentase AUC mencapai 0,025. Dari hasil tersebut dapat disimpulkan bahwa model yang diusulkan yaitu Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes merupakan model terbaik untuk menangani imbalance class.