Data preprocessing merupakan salah satu tahapan yang penting dalam proses data mining. Salah satu proses pada tahapan ini adalah seleksi fitur atau disebut juga dengan seleksi variabel. Seleksi fitur adalah proses pemilihan fitur yang paling relevan serta membuang fitur yang tidak relevan, ambigu, redudan dan noisy feature. Proses seleksi fitur sangat menentukan performa metode pada tahapan mining, artinya salah dalam memilih metode pada proses seleksi fitur tidak akan menghasilkan pengetahuan yang benar dan sesuai dengan harapan. Ada banyak metode yang dapat digunakan untuk melakukan seleksi fitur, diantranya Principal Component Analysis (PCA), Informasi Gain dan Gain Ratio, akan tetapi banyak metode dari seleksi fitur yang memiliki kompleksitas dan computation cost yang tinggi.Karena hal tersebut penelitian kali ini menyarankan seleksi fitur dengan pendekatan k-Nnearesst Neighbor (k-NN). Adapun hasil dari penelitian ini terbukti bahwa data yang telah melwati seleksi fitur dengan pendekatan k-NN mampu memberikan hasil akurasi yang lebih baik.
Copyrights © 2022