Data mining merupakan suatu proses mencari pola atau menarik informasi data besar dan terpilih menggunakan teknik atau metode tertentu. Metode K-Means dan Decision Tree merupakan bagian dari teknik Data Mining. Penelitian ini akan mengkombinasikan metode K-Means untuk melakukan clustering data menjadi 3 cluster kemudian hasil dari clustering akan di klasifikasi menggunakan Metode Decision Tree dengan perbandingan kriteria Gain Ratio, Information Gain dan Gini Index. Data yang diolah di bagi (split) menjadi 2 yaitu data training dan data testing dengan prosentase 70:30, 80:20 dan 90:10. Hasil dari penelitian untuk menemukan kriteria mana yang menghasilkan pohon keputusan dan performa terbaik berdasarkan nilai akurasi tertinggi dari masing-masing kelompok data. Data diambil dari Repository UCI dengan jumlah 811 record dan 52 atribut. Dari pengolahan data yang dilakukan diketahui Untuk split data 70:30, nilai akurasi dengan kriteria Gain Ratio, Information Gain dan Gini Index mendapatkan nilai sama yaitu 97,53. Kriteria Gain Ratio dan Gini Index menghasilkan nilai akurasi tertinggi yaitu 98,15% untuk split data 80:20. Sedangkan Information Gain mendapat nilai akurasi tertinggi 98,77% untuk split data 90:10.
Copyrights © 2022