Amir Mahmud Husein
Universitas Prima Indonesia, Indonesia

Published : 8 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 8 Documents
Search

Penerapan Algoritma C4.5 Dalam Pemilihan Siswa Berprestasi di SMPN 10 Medan Amir Mahmud Husein; Ricki Eko Hasudungan Hutauruk
Digital Transformation Technology Vol. 2 No. 1 (2022): Research Artikel Periode Maret 2022
Publisher : Information Technology and Science(ITScience)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (352.794 KB) | DOI: 10.47709/digitech.v2i1.1768

Abstract

Pada penelitian ini maka dibuat suatu sistem klasifikasi siswa berprestasi menggunakan teknik data mining dengan algoritma C4.5. Analisis dilakukan menggunakan data nilai tahun 2020/2021 untuk membangun model C4.5. Algoritma C4.5 merupakan teknik data mining yang dapat melakukan klasifikasi dan prediksi dengan mengolah beberapa variable. Algoritma C4.5 dengan metode pohon keputusan dapat memberikan informasi rule prediksi untuk menggambarkan proses yang terkait dengan prediksi pemilihan siswa berprestasi. Dalam melakukan penelitian ini dilakukan beberapa metode pengumpulan data. Setelah melakukan pengumpulan data, tahap selanjutnya adalah melakukan perhitungan untuk mengklasifikasikan hasil probabilitas dari sample yang digunakan. Apabila perhitungan probabilitas telah selesai, maka tahap selanjutnya dilakukan pengujian dengan menggunakan tools data mining yaitu RapidMiner untuk mengetahui hasil klasifikasi dan memvalidasi hasil perhitungan sebelumnya. Pengujian data ini berhasil mendapatkan akurasi yang cukup. Dengan akurasi yang didapat adalah 56,17%, precission 55,28% dan recall 31.25%.
Prediksi Penerimaan Calon Karyawan Dengan Menggunakan Algoritma C4.5 Pada Biro Kesejahteraan Rakyat Provinsi Sumatera Utara Amir Mahmud Husein; Mahendra Brutu
Digital Transformation Technology Vol. 2 No. 1 (2022): Research Artikel Periode Maret 2022
Publisher : Information Technology and Science(ITScience)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (324.222 KB) | DOI: 10.47709/digitech.v2i1.1769

Abstract

Untuk menentukan calon karyawan yang memenuhi kriteria maka dibutuhkan rekomendasi yang tepat. Perekomendasian yang tepat membutuhkan jumlah data yang banyak, Algoritma C4.5 merupakan salah satu metode yang dapat menganalisis data dalam jumlah yang banyak atau biasa disebut data mining. Algoritma C4.5 digunakan pada penelitian ini untuk memprediksi proses penerimaan calon karyawan baru dengan cara mengklasifikasikan data calon karyawan berdasarkan kriteria yang ditentukan. Pada penelitian ini dibuat suatu aplikasi yang mengimplementasikan pohon keputusan dengan algoritma C4.5, data yang digunakan dalam penelitian ini adalah data calon pegawai. Algoritma C 4.5 adalah algoritma klasifikasi data dengan teknik pohon keputusan. Adapun alur proses pengerjaan penelitian ini dimulai dari Pengumpulan Data sesuai dengan beberapa metode yang telah dijelaskan sebelumnya. Kemudian setelah dataset terkumpul, dilakukan tahap ­preprocessing untuk proses pengolahan data. Kemudian dilakukan proses perhitungan baik manual maupun menggunakan sistem dari RapidMiner sebagai perbandingan hasil ke akuratan. Hingga pada akhirnya diperoleh hasil akhir. Setelah pengujian dilakukan beberapa kali maka operator yang ditetapkan adalah dengan menggunakan operator split validation dan menggunakan Stratified Sampling dengan training data 90% dan testing data 10% dengan tingkat akurasi sebesar 81,82% dan classification error sebesar 18,18%.
Simulasi Peramalan Dengan Model Regresi Linier Terhadap Orderan Pelanggan Indihome PT. Telekomunikasi Indonesia, Tbk. Amir Mahmud Husein; Putri Suci Rahmadani
Digital Transformation Technology Vol. 2 No. 1 (2022): Research Artikel Periode Maret 2022
Publisher : Information Technology and Science(ITScience)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (290.183 KB) | DOI: 10.47709/digitech.v2i1.1773

Abstract

IndiHome dalam memenuhi permintaan produk dari pelanggan belum dapat meramalkan seberapa banyak pesanan dari pelanggan, karena IndiHome tidak bisa melihat secara pasti kejadian yang akan datang. Peramalan penjualan berfokus pada perkiraan produk, penjadwalan, persediaan, permintaan konsumen, modal, distribusi transportasi dan pemasaran produk. Jumlah pesanan dari pelanggan pada waktu mendatang tidak bisa diperkirakan secara pasti, untuk meminimalkan hal tersebut dapat dilakukan dengan metode peramalan Regresi Linier. Metode ini dapat mengukur seberapa banyak produksi yang harus dilakukan agar tidak terjadi kelebihan atau kekurangan pada produk. beberapa alur tahapan yang akan dilalui pada saat melaksanakan penelitian ini yaitu penentuan tujuan, identifikasi variabel, pengumpulan data, perhitungan x, y dan xy, perhitungan a dan b hingga melakukan peramalan. hasil peramalan pada bulan ke-13 atau bulan januari tahun selanjutnya, yaitu sebanyak 1603,831 peramalan orderan yang akan masuk di Plasa Telkom Iskandar Muda Medan. Dibulan ke-14 yaitu bulan Februari hasil peramalan mencapai 1604,728 orderan. Bulan ke-15 atau bulan Maret peramalan menunjukkan hasil 1605,625 orderan. Bulan ke-16 yaitu April, hasil peramalan yaitu sebanyak 1606,522 orderan. Bulan. ke-17 yaitu Mei, hasil peramalan sebanyak 1607,419 orderan. Bulan ke-18 yaitu Juni, hasil peramalan yaitu sebanyak 1608,316 orderan. Bulan ke-19 yaitu Juli, hasil peramalan yaitu sebanyak 1609,213 orderan. Pada bulan ke-20 yaitu Agustus, hasil peramalan mencapai 1610,11 orderan. Bulan ke-21 yaitu bulan September, hasil peramalan yaitu sebanyak 1611,007 orderan. Bulan berikutnya yaitu bulan ke-22 atau Oktober, hasil peramalan sebanyak 1611,904 orderan. Dibulan ke-23 yaitu November, hasil peramalan yaitu sebanyak 1612,801 orderan. Bulan ke-24 yaitu Desember, hasil peramalan mencapai 1613,698 orderan
Model Prediksi Prestasi Mahasiswa Berdasarkan Evaluasi Pembelajaran Menggunakan Pendekatan Data Science Tommy Tommy; Amir Mahmud Husein
Data Sciences Indonesia (DSI) Vol. 1 No. 1 (2021): Article Research Volume 1 Issue 1, June 2021
Publisher : ITScience (Information Technology and Science)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (906.812 KB) | DOI: 10.47709/dsi.v1i1.1168

Abstract

Perguruan tinggi merupakan satuan penyelenggara pendidikan tinggi sebagai tingkat lanjut jenjang pendidikan menengah di jalur pendidikan formal. Aspek prestasi belajar merupakan salah satu aspek penilaian keberhasilan perguruan tinggi dalam proses belajar. Dalam makalah ini menyajikan hasil analisis hubungan antara pembelajaran dengan prestasi mahasiswa dimana tahapan yang dilakukan menggunakan pendetakan data science. Berdasarkan Analisis data terdapat tiga indikator penting dalam penilaian prestasi belajar yaitu pedagogi, profesional dan kepribadian. Ketiga fitur digunakan sebagai variabel dependen untuk memprediksi prestasi belajar dimana algoritma DecisionTree menghasilkan akurasi lebih baik dari pada model k-nearest neighbors (KNN), Logistic Regression, Support Vector Machine, Naive Bayes dan dengan tingkat akurasi 68%, kemudian KNN dengan akurasi 66% dan lainnya sebesar 55% pada masing-masing algoritma yang diusulkan.
Pendekatan Data Science untuk Menemukan Churn Pelanggan pada Sector Perbankan dengan Machine Learning Amir Mahmud Husein; Mawaddah Harahap; Peter Fernandito
Data Sciences Indonesia (DSI) Vol. 1 No. 1 (2021): Article Research Volume 1 Issue 1, June 2021
Publisher : ITScience (Information Technology and Science)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (626.351 KB) | DOI: 10.47709/dsi.v1i1.1169

Abstract

Peralihan pelanggan merupakan fenomena dimana pelanggan perusahaan berhenti membeli atau berinteraksi sehingga sangat penting bagi perusahaan khususnya perbankan untuk memprediksi kemungkinan churn pelanggan dan hasilnya dapat digunakan untuk membantu retensi pelanggan dan bagian dari strategi perusahaan. Makalah ini menyajikan analisis dan prediksi churn pelanggan dengan menggunakan lima model berbeda yaitu Kneighbors Classifier, Logistic Regression, Linear SVC, Random Tree Classifier dan Random Forest Classifier. Berdasarkan hasil pengujian pendekatan model Random Forest Classifier dan Kneighbors Classifier lebih baik dari pada model lain dengan akurasi sebesar 86% dan 84%. Rekayasa fitur dengan pendekatan Anova dan Chi Square memiliki pengaruh yang signifikan terhadap peningkatan kinerja model prediksi.
Analisis Prediktif untuk Keputusan Bisnis : Peramalan Penjualan Amir Mahmud Husein; Fachrul Rozi Lubis; Muhammad Khoiruddin Harahap
Data Sciences Indonesia (DSI) Vol. 1 No. 1 (2021): Article Research Volume 1 Issue 1, June 2021
Publisher : ITScience (Information Technology and Science)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (921.35 KB) | DOI: 10.47709/dsi.v1i1.1196

Abstract

Peramalan penjualan produk adalah aspek utama dari manajemen pembelian, persediaan yang melebihi permintaan atau kekurangan akan berdampak pada manajemen pelayanan maupun secara ekominis. Makalah ini fokus mencoba menyajikan penerapan analisis prediktif dengan mengadopsi kerangka kerja Data Science (ilmu data) untuk menemukan wawasan yang berguna dalam pengambilan keputusan bisnis khususnya tentang peramalan penjualan produk di masa depan. Kerangka CRISP-DM diusulkan dengan tahapan pemahasan bisnis, pemahaman dan persiapan data, exploratory data analysis (EDA) dan pemodelan. Berdasarkan hasil pengujian data penjualan yang dievaluasi berdasarkan RMSE dan MAE, algoritma XGBoost menghasilkan prediksi berada dalam 1,3% kemudian ARIMA sebesar 1.6%, masih lebih baik dibandingkan LinearRegression, RandomForestdan LSTM dengan tingkat kesalahan sebesar 1.81%, 1.97%, 2.21% pada masing-masing algoritma dari data aktual.
Teknik Data Science di Bidang Kesehatan : Menganalisis Faktor penting Ketidakhadiran Janji Medis Pasien Amir Mahmud Husein; Muhammad Khoiruddin Harahap
Data Sciences Indonesia (DSI) Vol. 1 No. 2 (2021): Article Research Volume 1 Number 2, Desember 2021
Publisher : ITScience (Information Technology and Science)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (735.871 KB) | DOI: 10.47709/dsi.v1i2.1314

Abstract

Ketidakhadiran pasien dan pembatalan janji temu yang terlambat akan berdampak buruk pada kinerja keuangan dan kualitas layanan organisasi perawatan kesehatan, kesinambungan perawatan terganggu, kemanjuran obat tidak dapat dipantau secara teratur, layanan pencegahan dan pemeriksaan tidak dapat diberikan tepat waktu. Makalah ini menyajikan hasil analisis dalam kumpulan data menggunakan pendekatan ilmu data. Kerangka kerja menerapkan konsep CRIS-DM dengan tahapan pemahaman bisnis, pra-pemrosesan data, pembersihan data, rekayasa fitur, pemodelan dan evaluasi. Analisis data statistik deskriptif dan visual digunakan untuk memahami kumpulan data untuk menjawab delapan pertanyaan penting yang berhubungan dengan faktor ketidakhadiran janji temu pasien yang terjadwal, kemudian memprediksi apakah pasien akan datang pada hari janji temu yang dijadwalkan. Berdasarkan hasil evaluasi nilai matriks Accuray, F1-Score dan ROC terhadap Lima model machine learning yang digunakan menghasilkan Light GBM Classifier, Gradient Boosting Classifier dan XGBoost Classifier adalah tiga model terbaik dengan akurasi diatas 78% sekitar 0.79968 (79.9%), 0.79883 (79.8%) dan 0.79806 (79.8%) pada masing-masing model
Menganalisis Data Kesehatan Global : Pendekatan Analisis Data Eksplorasi Visual Muhammad Zulfansyuri Siambaton; Amir Mahmud Husein
Data Sciences Indonesia (DSI) Vol. 1 No. 2 (2021): Article Research Volume 1 Number 2, Desember 2021
Publisher : ITScience (Information Technology and Science)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (661.976 KB) | DOI: 10.47709/dsi.v1i2.1315

Abstract

Peningkatan derajat kesehatan masyarakat merupakan salah satu indikator utama kemajuan masyarakat, dimana analisis statistik untuk pemantauan kesehatan masyarakat sangat relevan untuk sejumlah sektor, seperti penelitian, pembuatan kebijakan, perawatan kesehatan, industri farmasi, asuransi dan lainnya. Makalah ini menyajikan analisis data kesehatan global dengan dengan tujuan menemukan variabel penting yang berpengaruh terhadap harapan hidup. Dari hasil observasi dengan menggunakan beberapa tahapan proses mulai dari pembersihan data, deteksi data nilai yang hilang, mendeteksi outler ditemukan bahwa terdapat tujuh variabel penting yaitu status, Adult Mortality, percentage expenditure, HIV, GDP, schooling, Income composition of resources. Dalam penelitian ini juga disajikan upaya untuk menyusun dan menganalisis semua pertanyaan penting dalam bentuk Analisis Data Eksplorasi visualisasi secara keseluruhan dari kumpulan data.