Garuda - Garba Rujukan Digital

RESEARCH : Computer, Information System & Technology Management

Vol 1, No 1 (2018)

Moch Ali Mahmudi (STMIK BINA PATRIA)

Publish Date
13 Apr 2018

Tujuan utama penelitian ini adalah untuk mengetahui pengaruh karakteristik set data pada performa algoritma klasifikasi. Pada penelitian ini digunakan tiga set data yang memiliki variasi tipe data, jumlah atribut, dan jumlah instan yang berbeda. Set data dibelajarkan pada algoritma klasifikasi, seperti SMO, Adaboost, CART, C4.5, dan Naïve Bayes. Penelitian ini menggunakan 10 fold cross validation sebagai metode evaluasi. Hasil penelitian menunjukkan bahwa, tipe data, jumlah atribut, dan ukuran set data mempengaruhi performa algoritma klasifikasi. Semakin banyak jumlah atribut, kecenderungan akurasi kelima algoritma uji semakin tinggi. Algoritma klasifikasi yang terbaik digunakan pada tipe data numerik adalah C4.5, sedangkan untuk data nominal adalah SMO. Algoritma klasifikasi yang terbaik digunakan pada small dataset atau set data dengan jumlah instan kecil adalah Naïve Bayes dan SMO, sedangkan yang terbaik digunakan pada big dataset adalah SMO dan C4.5.

Citation Download

EndNote, Reference Manager, ProCite

Latex, Jabref

436.302 KB

Check in Google Scholar

Journal Info

RESEARCH : Computer, Information System & Technology Management

Website

Abbrev

RESEARCH

Publisher

Universitas PGRI Madiun

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management

Description

RESEARCH is a scientific journal that publishes articles in the field of Computer, Information systems & Technology Management. Various topics can be published in this journal is about : 1. Technology Information & Information System. 2. Computing, Internet of Think & Networking. 3. Multimedia ...

Article Info

Abstract

Uji Pengaruh Karakteristik Dataset pada Performa Algoritma Klasifikasi

Article Info

Abstract