Angelina Sagita Sastrawan
Unknown Affiliation

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Analisis Pengaruh Metode Over Sampling dalam Churn Prediction untuk Perusahaan Telekomunikasi ZK. Abdurahman Baizal; Moch. Arif Bijaksana; Angelina Sagita Sastrawan
Seminar Nasional Aplikasi Teknologi Informasi (SNATI) 2009
Publisher : Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Churn prediction adalah suatu cara untuk memprediksi pelanggan yang berpotensial untuk churn. Datamining, khususnya klasifikasi tampaknya dapat menjadi salah satu alternatif solusi dalam membuat modelchurn prediction yang akurat. Namun hasil klasifikasi menjadi tidak akurat disebabkan karena data churnbersifat imbalance. Kelas data menjadi tidak stabil karena data akan lebih condong ke bagian data yangmemiliki komposisi data yang lebih besar. Salah satu cara untuk menangani permasalahan ini adalah denganmemodifikasi dataset yang digunakan atau yang lebih dikenal dengan metode oversampling. Analisis yangdilakukan pada penelitian ini adalah mengetahui bagaimana pengaruh metode oversampling yang digunakanterhadap akurasi prediksi data churn dengan melakukan penghitungan akurasi model churn prediction yangdinyatakan dalam bentuk lift curve, top decile dan gini coefficient serta f-measure untuk penghitungan akurasiprediksi data sebagai data yang imbalance. Hasil yang didapat dari penelitian menunjukkan bahwa metodeoversampling yang menghasilkan data synthetic belum sesuai diterapkan pada data churn, karena cenderungmasih menghasilkan nilai top decile yang kecil. Tetapi secara umum metode oversampling ini mampumeningkatkan akurasi untuk memprediksi data minor. Dengan penerapan metode oversampling, data churnyang memiliki tingkat imbalance yang besar dapat diklasifikasi tanpa mengorbankan data minor yang menjadifokus penelitian. Metode oversampling yang digunakan juga memiliki hasil evaluasi yang berbeda terhadapdataset sebagai data churn dan sebagai data imbalance.Kata kunci: churn prediction, imbalance, sampling, akurasi, evaluasi.
ANALISIS PENGARUH METODE COMBINE SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI Angelina Sagita Sastrawan; ZK Abdurahman Baizal; Moch. Arif Bijaksana
Seminar Nasional Informatika (SEMNASIF) Vol 1, No 1 (2010): Computatinal
Publisher : Jurusan Teknik Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Churn prediction pada pelanggan telekomunikasi merupakan upaya memprediksi/mengklasifikasi pelanggan jasa telekomunikasi yang berhenti atau berpindah berlangganan dari suatu operator ke operator yang lain. Namun dataset pada kasus churn ini biasanya memiliki kelas yang imbalance dimana jumlah instance suatu kelas (kelas active atau tidak churn atau mayor atau negatif) jauh lebih besar dari jumlah kelas yang lain (kelas churn atau minor atau positif). Akibatnya, kebanyakan classifier cenderung memprediksi kelas mayor dan mengabaikan kelas minor sehingga akurasi kelas minor sangat kecil. Salah satu pendekatan yang dilakukan untuk menangani permasalahan ini adalah dengan memodifikasi distribusi instances dari dataset yang digunakan atau yang lebih dikenal dengan pendekatan sampling-based. Teknik resampling ini meliputi oversampling, under-sampling, dan combine-sampling. Analisis yang dilakukan pada penelitian ini adalah mengetahui bagaimana pengaruh metode combine sampling yang digunakan terhadap akurasi prediksi data churn dengan melakukan penghitungan akurasi model churn prediction yang dinyatakan dalam bentuk lift curve, top decile dan gini coefficient serta f-measure untuk penghitungan akurasi prediksi data sebagai data yang imbalance. Hasil yang didapat dari penelitian menunjukkan bahwa metode combine sampling belum sesuai diterapkan pada data churn, karena cenderung masih menghasilkan nilai top decile yang kecil. Tetapi secara umum metode combine sampling ini mampu meningkatkan akurasi untuk memprediksi data minor. Dengan penerapan metode combine sampling, data churn yang memiliki tingkat imbalance yang besar dapat diklasifikasi tanpa mengorbankan data minor yang menjadi fokus penelitian. Metode combine sampling yang digunakan juga memiliki hasil evaluasi yang berbeda terhadap dataset sebagai data churn dan sebagai dataimbalance.