Claim Missing Document
Check
Articles

Found 1 Documents
Search
Journal : Jurnal Informatika Polinema (JIP)

Komparasi Metode Mean dan KNN Imputation dalam Mengatasi Missing Value pada Dataset Kecil Fandi Yulian Pamuji; Ahmad Rofiqul Muslikh; Rizza Muhammad Arief; Delviana Muti
Jurnal Informatika Polinema Vol. 10 No. 2 (2024): Vol 10 No 2 (2024)
Publisher : UPT P2M State Polytechnic of Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33795/jip.v10i2.5031

Abstract

Missing value pada dataset yang kecil akan mengakibatkan berkurangnya data yang dapat digunakan untuk pembelajaran sehingga prediksi hasil klasifikasi dari data tersebut akan berkurang. Metode Imputasi sebagai solusi metode yang paling umum digunakan untuk menangani masalah dataset yang tidak lengkap. Metode Imputasi proses di mana beberapa teknik statistik digunakan untuk mengganti data yang hilang dengan nilai pengganti. Tujuan penelitian ini dengan kinerja klasifikasi yang dapat dipertahankan dengan metode imputasi missing value, karena metode ini dapat menghindari berkurangnya jumlah dataset yang digunakan dalam proses klasifikasi pada dataset dan meningkatkan kinerja klasifikasi pada dataset yang tidak ideal terutama untuk jumlah dataset yang kecil. Berdasarkan hasil eksperimen yang telah dilakukan dari penelitian ini yaitu bahwa pengujian metode imputasi Mean dan KNN Imputation dengan metode klasifikasi mampu menangani data kosong dengan jumlah missing value sedikit maupun banyak dengan menghasilkan nilai accuracy mencapai kinerja prediksi yang lebih besar dibandingkan dengan menggunakan missing value nilai 0. Kemudian untuk dataset Hepatitis nilai Accuracy tinggi menggunakan metode imputasi KNN Imputasi dengan nilai 0,79 menggunakan metode Logistic Regression dan dataset Ginjal Kronis nilai Accuracy tinggi menggunakan metode imputasi Mean dengan nilai 0,97 dengan menggunakan metode Naïve Bayes. Hal tersebut menunjukkan bahwa proses metode imputasi terhadap nilai kosong disetiap column dataset kecil pada tahap data preprocessing memberikan pengaruh terhadap nilai Accuracy metode Mean dan KNN Imputation pada metode klasifikasi.