Claim Missing Document
Check
Articles

Found 2 Documents
Search
Journal : J Statistika: Jurnal Ilmiah Teori dan Aplikasi Statistika

Perbandingan Metode LightGBM dan XGBoost dalam Menangani Data dengan Kelas Tidak Seimbang Putri Septiana Rizky; Ristu Haiban Hirzi; Umam Hidayaturrohman
J STATISTIKA: Jurnal Imiah Teori dan Aplikasi Statistika Vol 15 No 2 (2022): Jurnal Ilmiah Teori dan Aplikasi Statistika
Publisher : Fakultas Sains dan Teknologi Univ. PGRI Adi Buana Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36456/jstat.vol15.no2.a5548

Abstract

Masalah ketidakseimbangan kelas telah menjadi salah satu tantangan dalam kinerja banyak algoritma klasifikasi. Kelas tidak seimbang merupakan suatu kondisi dimana terdapat dataset yang jumlah kelasnya terdapat perbedaan yang signifikan terhadap masing-masing jumlah kelas. Dalam kumpulan data yang terdiri dari dua kelas, ukuran sampel kategori mayoritas (lebih besar) mendominasi sampel kategori minoritas (lebih kecil) dengan rasio sebesar 1:100, 1:1.000 atau 1:10.000. Dampak ketidakseimbangan ini menyebabkan klasifikasi menjadi buruk dan tidak optimal. Sebagian besar algoritma klasifikasi standar cenderung mengklasifikasikan kelas mayoritas dengan tingkat akurasi tinggi dan kelas minoritas dengan tingkat akurasi rendah, sehingga mengakibatkan terjadinya bias. Dalam banyak aplikasi, lebih penting untuk mengidentifikasi kelas minoritas dari pada kelas mayoritas. Pada penelitian ini diusulkan pendekatan berbasis ensemble dengan pengklasifikasi yang digunakan adalah LightGBM dan XGBoost, kedua metode ini merupakan metode gradien efisien yang beberapa tahun terakhir telah disarankan berdasarkan pohon keputusan sehingga mampu menangani masalah data dengan skala besar. Data yang digunakan diperoleh dari UCI Repository dengan 5 data, 3 diantaranya memiliki tingkat ketidakseimbangan tinggi dan sisanya dengan tingkat ketidakseimbangan rendah. Jumlah kelas yang digunakan pada penelitian adalah dua kelas. Hasil penelitian menunjukkan bahwa kinerja metode XGBoost dalam akurasi dan sensitivitas lebih baik dibandingkan LightGBM di hampir seluruh data. Sedangkan kemampuan dalam menebak kelas minoritas (spesifisitas), metode LightGBM lebih baik dibandingkan XGBoost dengan nilai keseluruhan rata-rata sebesar 80,41% : 74,64%.
Penerapan Clustering Time Series pada Pengelompokan Provinsi di Indonesia (Studi Kasus : Nilai Ekspor Non Migas di Indonesia Tahun 2016-2020) Harista Almiatus Soleha; Wiwit Pura Nurmayanti; Umam Hidayaturrohman; Ristu Haiban Hirzi; Ayu Septiani
J STATISTIKA: Jurnal Imiah Teori dan Aplikasi Statistika Vol 15 No 2 (2022): Jurnal Ilmiah Teori dan Aplikasi Statistika
Publisher : Fakultas Sains dan Teknologi Univ. PGRI Adi Buana Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36456/jstat.vol15.no2.a5550

Abstract

Ekspor non migas merupakan ekspor barang yang bukan berupa minyak dan gas. Tidak semua daerah di Indonesia memiliki potensi yang sama untuk melakukan kegiatan ekspor sehingga setiap daerah memiliki nilai ekspor yang berbeda-beda. Oleh karena itu dilakukan analisis pengelompokkan provinsi di Indonesia berdasarkan nilai ekspor non migas tahun 2016 – 2020 menggunakan cluster time series dengan metode hierarki clustering agglomerative diantaranya complete lingke yaitu pengelompokkan berdasarkan jarak terbesar antar objek dan centroid linkage merupakan nilai tengah observasi pada variabel dalam satu cluster, serta menggunakan pengukuran jarak Euclidean dan Dynamic Time Warping (DTW) dengan tujuan yaitu untuk memperoleh pengukuran jarak terbaik dengan metode yang optimal guna mendapatkan cluster yang representatif. Berdasarkan hasil analisis pengelompokkan Provinsi di Indonesia terhadap nilai ekspor non migas tahun 2016 - 2020 didapatkan pengukuran jarak kemiripin yang paling baik yaitu jarak DTW dan metode yang optimal yaitu centroid linkage berdasarkan pada nilai koefisien cophenetic sebesar 0.92 dengan kategori good cluster berdasarkan nilai koefisien silhouette yaitu 0.60. Sehingga didapatkan tiga cluster yaitu nilai ekspor tinggi, sedang dan rendah, diantaranya 24 Provinsi dengan nilai ekspor rendah, 9 Provinsi dengan nilai ekspor sedang, dan 1 Provinsi dengan nilai ekspor tinggi.