Menurut WHO, orang yang terinfeksi virus Hepatitis C tercatat sekitar 71 juta orang pada 2019. Hanya 49,7% orang yang menyadari adanya penyakit Hepatitis C. Pencegahan dini penting dilakukan untuk meminimalisir kemungkinan buruk terjadi. Untuk memaksimalkan upaya ahli medis dalam meminimalisir risiko penularan, dibuat program yang mampu mengklasifikasikan penyakit Hepatitis C dengan sistem deteksi otomatis menggunakan model machine learning. Random Forest dipilih karena mampu menangani outlier dan imbalance data sehingga mampu menghasilkan nilai akurasi yang tinggi serta mampu mengidentifikasi fitur-fitur yang penting. Naïve Bayes dipilih karena algoritmanya yang sederhana, namun mampu menghasilkan nilai akurasi tinggi. Setelah dilakukan pengujian pada kedua model, dilakukan perhitungan terhadap hasil prediksi menggunakan formula confusion matrix. Hasil pengujian menunjukkan dengan menerapkan model Random Forest tanpa SMOTE sebesar 93% dan Naïve Bayes tanpa SMOTE sebesar 88%. Sehubungan dengan adanya imbalance data pada dataset, maka dilakukan teknik oversampling menggunakan metode SMOTE. Hasil pengujian yang diperoleh dari menerapkan model Random Forest dengan SMOTE sebesar 98% dan Naïve Bayes dengan SMOTE sebesar 89%.
Copyrights © 2023