Claim Missing Document
Check
Articles

Found 1 Documents
Search
Journal : Jurnal Sains dan Informatika

Pengaruh Komposisi Split data Terhadap Performa Klasifikasi Penyakit Kanker Payudara Menggunakan Algoritma Machine Learning Rian Oktafiani; Arief Hermawan; Donny Avianto
Jurnal Sains dan Informatika Vol. 9 No. 1 (2023): Jurnal Sains dan Informatika
Publisher : Teknik Informatika, Politeknik Negeri Tanah Laut

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34128/jsi.v9i1.622

Abstract

Hasil klasifikasi kanker payudara yang tidak tepat dan memiliki akurasi rendah berpotensi membahayakan nyawa pasien. Rasio split data training dan testing mempengaruhi akurasi klasifikasi. Pemilihan rasio split data yang tidak tepat dapat menurunkan akurasi model. Penelitian ini bertujuan menemukan komposisi data terbaik untuk hasil klasifikasi kanker payudara yang baik. Metode yang digunakan adalah holdout dan k-fold cross validation. Algoritma klasifikasi yang dibandingkan adalah SVM, Random Forest, dan Naïve Bayes. Hasil penelitian menunjukkan performa akurasi yang berbeda pada ketiga algoritma tergantung pada metode validasi. Skema holdout validation dengan rasio 75%:25% menghasilkan akurasi terbaik untuk SVM, yaitu 98.89%. Algoritma Random Forest mencapai akurasi terbaik pada rasio split data 55%:45%, yaitu 95.85%. Namun, Naïve Bayes memiliki performa akurasi yang lebih baik saat menggunakan k-fold cross validation dengan akurasi 93.85%. Metode holdout dengan rasio 75:25 terbukti menghasilkan akurasi terbaik untuk klasifikasi data kanker payudara menggunakan SVM. Penelitian selanjutnya dapat menggunakan algoritma deep learning dan memperluas penelitian ke jenis kanker lainnya untuk meningkatkan hasil klasifikasi.