Claim Missing Document
Check
Articles

Found 1 Documents
Search
Journal : JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesia)

Analisis Pengaruh PCA Pada Klasifikasi Kualitas Air Menggunakan Algoritma K-Nearest Neighbor dan Logistic Regression Baiq Nurul Azmi; Arief Hermawan; Donny Avianto
JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesia) Vol 7, No 2 (2022): JUSTINDO
Publisher : Universitas Muhammadiyah Jember

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32528/justindo.v7i2.8190

Abstract

Air bersih merupakan komponen penting untuk mendukung keberlangsungan hidup manusia. Perkembangan industri dan semakin bervariasinya aktivitas manusia berdampak pada penurunan kualitas air di area tersebut. Penurunan tingkat kualitas air dapat menyebabkan air menjadi tidak layak untuk dikonsumsi bahkan berbahaya untuk dikonsumsi. Kemampuan mengklasifikasi kualitas air secara akurat sangat diperlukan untuk menghindari penurunan tingkat kualitas air. Penelitian sebelumnya menunjukkan bahwa jumlah fitur yang digunakan untuk klasifikasi kualitas air sangat banyak. Jumlah fitur yang banyak ini memang dapat membantu metode pengklasifikasi untuk melihat domain permasalahan secara menyeluruh. Namun, belum ada penelitian yang meninjau secara detail apakah jumlah fitur yang banyak benar-benar diperlukan untuk mendapatkan hasil terbaik. Penelitian ini mengkaji penggunaan metode principal component analysis (PCA) untuk menemukan jumlah fitur yang paling optimal dalam konteks klasifikasi kualitas air. Penelitian ini menggunakan data kualitas air di lingkungan perkotaan yang diperoleh dari situs kaggle. Total data yang digunakan adalah 8000 baris data dengan 21 fitur untuk setiap baris data yang ada. Fitur hasil principal component analysis  kemudian dijadikan input untuk dua metode klasfikasi yaitu k-nearest neighbor (kNN) dan logistic regression. Penggunaan dua metode klasifikasi yang berbeda ini bertujuan menemukan tingkat akurasi terbaik untuk data yang digunakan. Hasil eksperimen menunjukkan metode k-nearest neighbor mampu memberikan performa yang lebih baik dibandingkan logistic regression dengan pencapaian nilai akurasi 90.8%, presisi 90.0%, dan recall 91.0%. Hasil ini didapatkan dengan melibatkan seluruh fitur yang ada dan nilai k=9, sehingga dapat disimpulkan bahwa jumlah fitur yang banyak pada konteks klasifikasi kulitas air memang diperlukan untuk mendapatkan nilai akurasi yang tinggi. Kata kunci: kualitas, air, PCA, kNN, logistic, regression