J Statistika: Jurnal Ilmiah Teori dan Aplikasi Statistika
Vol 14 No 1 (2021): Jurnal Ilmiah Teori dan Aplikasi Statistika

Membandingkan Seleksi variabel Pada Data Microarray Menggunakan Important Variable Value dan Genetic Algorithm (Studi Kasus Lung Cancer Dataset dan Prostate Cancer Dataset)

Diana Nurlaily (Institut Teknologi Kalimantan)
Farida Nur Hayati (Institut Teknologi Kalimantan)
Elly Pusporani (Unknown)



Article Info

Publish Date
31 Jul 2021

Abstract

Teknologi DNA microarray menarik minat yang luar biasa baik di kalangan komunitas ilmiah maupun kalangan industri. Meskipun data microarray telah diterapkan dalam berbagai bidang, penanganan volume data besar yang dihasilkan bukanlah perkara yang mudah. Ukuran sampel kecil dengan dimensi tinggi adalah tantangan utama analisis menggunakan data microarray. Oleh karena itu perlu dilakukan analisis lebih lanjut untuk mengatasi hal ini. Banyak penelitian yang telah dirancang berkaitan dengan data microarray misalnya untuk menyelidiki mekanisme genetik kanker, dan untuk mengklasifikasikan berbagai jenis kanker atau membedakan antara jaringan kanker dan non-kanker. Semua penelitian ini bertujuan untuk menghasilkan kesimpulan dan interpretasi yang bermanfaat dari kumpulan data yang kompleks. Dalam penelitian ini, data yang digunakan adalah data kanker paru-paru sebanyak 24257 Variabel dan data kanker prostat sebanyak 12626 Variabel. Data tersebut kemudian akan dianalisis dengan beberapa metode feature selection yaitu important variable value dan genetic algorithm untuk memilih dimensi atau variabel data sehingga dapat meningkatkan akurasi klasifikasi data. Berdasarkan hasil analisis feature selection menggunakan data kanker paru-paru, didapatkan jumlah variabel terpilih sebanyak 112 variabel dengan metode feature selection important. Sedangkan metode genetic algorithm didapatkan jumlah variabel terpilihnya sebanyak 12266 variabel. Pada data kanker prostat, didapatkan jumlah variabel terpilih sebanyak 299 variabel dengan metode feature selection important. Sedangkan metode genetic algorithm didapatkan jumlah variabel terpilihnya sebanyak 6359 variabel.

Copyrights © 2021






Journal Info

Abbrev

jstatistika

Publisher

Subject

Decision Sciences, Operations Research & Management Economics, Econometrics & Finance

Description

Merupakan Media Penerbitan Dan Pembahasan Karya Ilmiah Dalam Bidang Ilmu Statistika Beserta Aplikasinya, Baik Berupa Hasil Penelitian, Bahasan Tentang Teori, Metodologi, Komputasi, Maupun Aplikasi Statistika Dalam Bidang ...