Claim Missing Document
Check
Articles

Found 26 Documents
Search

Interpretasi dan Visualisasi Hasil Clustering Menggunakan K-Medoid untuk Identifikasi Penyebaran Virus Covid-19 Puspita Nurul Sabrina; Ade Kania Ningsih; Fatan Kasyidi
Jurnal ICT : Information Communication & Technology Vol 21, No 1 (2022): JICT-IKMI, Juli 2022
Publisher : STMIK IKMI Cirebon

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36054/jict-ikmi.v21i1.429

Abstract

Penyebaran virus Covid-19 di Indonesia terus terjadi dengan jumlah yang terus meningkat. Bagaimana pola penyebaran virus perlu diidentifikasi untuk membantu pencegahan penyebaran yang tidak terkendali. Salah satu cara menentukan pola adalah dengan melakukan clustering. Metode clustering dalam penelitian ini menggunakan metode K-Medoid, yang mana metode ini telah digunakan dalam beberapa penelitian tentang analisa penyakit. Hasil Clustering perlu diolah dan dianalisis agar pengetahuan dapat ditangkap lebih mudah. Proses ini disebut interpretasi yang dapat didukung dengan visualisasinya. Proses interpretasi dilakukan di antaranya  dengan melakukan visualisasi perbandingan 2 atribut yang mungkin terkait. Proses lainnya dengan pengolahan data yang masuk klaster-klaster dengan rekapitulasi/penjumlahan menurut provinsi dan atribut lain dengan cara filtering dan seleksi record. Hasil interpretasi diperoleh kesimpulan daerah dengan Kepadatan Penduduk tinggi, Area Wilayah yang lebih kecil, Populasi yang tinggi menunjukkan jumlah kasus dan kasus baru Covid-19 lebih tinggi. Interpretasi untuk setiap klaster penyebaran virus tampak klaster 1 adalah Kota Besar, Klaster 2 adalah Kota Wisata dan Bertetangga dengan negara lain, Klaster 3 adalah Pulau Jawa dan Klaster ke 4 adalah kota-kota lain diluar ketiga klaster lainnya.
Pemetaan Daerah Asal Mahasiswa Unjani Berbasis WebGis Fatan Kasyidi; Seffiera Fauziah; Faiza Renaldi; Irma Santikarama
JUMANJI (Jurnal Masyarakat Informatika Unjani) Vol 5 No 1 (2021): Jurnal Masyarakat Informatika Unjani
Publisher : Jurusan Informatika Universitas Jenderal Achmad Yani

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26874/jumanji.v5i1.90

Abstract

Sistem Informasi Geografis merupakan bidang ilmu yang membahas bidang geografis yang bisa diterapkan dalam berbagai bidang institusi, misalnya di bidang kemiliteran, bidang kedokteran, bidang pendidikan hingga bidang pertanian. Manfaat SIG secara umum memberikan informasi yang mendekati kondisi dunia nyata, memprediksi suatu hasil dan perencanaan strategis. Implementasi SIG dalam pendidikan dapat menjadi dasar pengambilan keputusan. Pemanfaatan SIG dalam pendidikan diantaranya mengatur data dan informasi yang ditampilkan secara geografis sehingga dapat diketahui sebaran dan pola yang terbentuk serta dapat menginventarisasi infrastruktur pendidikan. Pada sistem PMB Universitas Jenderal Achmad Yani belum memiliki pemetaan yang menjadikan pemrosesan data menjadi lebih lama. Sebelumnya unjani melakukan pengecekan daerah asal mahasiswa berupa tabel saja. Dari persoalan ini, GIS dapat memudahkan dalam membaca data dalam bentuk peta. Hal ini bertujuan untuk mengetahui daerah mana yang kurang mahasiswa yang nantinya bagian PMB bisa mengetahui perencanaan promosi unjani di periode berikutnya dari hasil pemetaan tersebut. Oleh karena itu, diperlukan suatu sistem yang memberikan informasi mengenai sebaran mahasiswa tersebut yang berbasis online. Metode yang digunakan untuk pembuatan sistem informasi geografis tersebut adalah metode waterfall. Beberapa pemrograman yang digunakan antara lain PHP dan HTML. Sistem yang dibuat mampu memberi informasi berupa peta sebaran mahasiswa dalam bentuk peta yang berbasis web (WebGIS). Pengujian ini dilakukan dengan User Acceptance test yang memiliki rata-rata kelayakan 76,50%
Peningkatan Kemampuan Pengenalan Emosi Melalui Suara dalam Bahasa Indonesia FATAN KASYIDI; RIDWAN ILYAS; NIDA MUTHI ANNISA
MIND (Multimedia Artificial Intelligent Networking Database) Journal Vol 6, No 2 (2021): MIND Journal
Publisher : Institut Teknologi Nasional, Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26760/mindjournal.v6i2.194-204

Abstract

AbstrakInteraksi manusia dengan komputer merupakan fenomena yang terus berkembang diikuti oleh meningkatnya penggunaan komputer yang sering digunakan dalam ranah sosial manusia. Manusia saling berinteraksi dengan melibatkan emosi untuk memahami seseorang. Emosi manusia seringkali terwakili melalui cara berbicara. Penelitian tentang pengenalan emosi melalui suara telah banyak dilakukan, namun terdapat upaya peningkatan pengenalan emosi melalui suara, terutama masalah korpus yang menjadi salah satu faktor yang menjadikan pengenalan emosi ini belum menghasilkan akurasi pengenalan yang optimal, khususnya berkaitan dengan imbalance data. Penelitian ini dilakukan untuk meningkatkan performa pengenalan emosi untuk mengenali lima kelas emosi yaitu senang, marah, sedih dan kepuasan serta netral menggunakan algoritma boosting. Selain itu, digunakan pula metode seperti CNN dan RNN untuk dapat dilakukan perbandingan serta penerapan SMOTE untuk korpusnya. Setelah eksperimen, dapat dihasilkan akurasi pengenalan mencapai 65% untuk akurasi untuk data tes berdasarkan konfigurasi 22050 Hz sebagai sampling rate, MFCCs dan oversampling SMOTE.Kata kunci: Imbalance data, Algoritma Boosting, CNN, RNN, SMOTEAbstractHuman interaction with computers are a growing phenomenon followed by the increasing use of computers which are often utilized in human social activities. Humans interact with one another by involving emotions. Plenty of research on speech emotion recognition has been established. Nevertheless, there are still efforts to enhance speech emotion recognition, especially the corpus problem which is one of the factors that the model does not in an optimal performance, especially about imbalance data. This study was conducted to enhance the performance of emotion recognition to recognize five class emotions: happiness, angry, sadness, contentment, and neutral. Furthermore, we employed CNN, RNN, and Boosting Algorithms. Lastly, we applied SMOTE to the corpus. After the experiment, the accuracy reached 65% with 22050 Hz configuration as rate, MFCCs, and SMOTE oversampling.Keywords: Data Imbalance, Boosting Algorithms, CNN, RNN, SMOTE
Klasifikasi Kalimat Ilmiah Menggunakan Recurrent Neural Network Muhamad Rizal Firmansyah; Ridwan Ilyas; Fatan Kasyidi
Prosiding Industrial Research Workshop and National Seminar Vol 11 No 1 (2020): Prosiding 11th Industrial Research Workshop and National Seminar (IRWNS)
Publisher : Politeknik Negeri Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1042.373 KB) | DOI: 10.35313/irwns.v11i1.2055

Abstract

Pengklasifikasian hanya berbentuk satu kalimat ilmiah tunggal dan tidak terpengaruh oleh kalimat sebelum dan sesudah tetapi hanya berfokus pada satu kalimat ilmiah saja. Recurrent Neural Network (RNN) adalah arsitektur jaringan saraf tiruan yang telah terbukti berkinerja baik karena pemrosesannya disebut berulang kali untuk memproses input data sekuensial. Penelitian ini telah berhasil membuat model komputasi klasifikasi kalimat menggunakan RNN, dengan fitur yang telah diekstraksi menggunakan fungsi Word2Vec untuk menghasilkan satu set vektor. Dalam melakukan proses klasifikasi penelitian ini menggunakan total 2019 data pelatihan kalimat ilmiah yang telah dilabeli menjadi empat kelas, yaitu Weak, Comparison, Point, dan Neutral. Penelitian ini telah dibandingkan dengan empat optimasi yaitu Adam, SGD Adadelta, dan Adamax untuk menemukan tingkat pembelajaran terbaik dan cocok untuk klasifikasi kalimat. Hasil tingkat pembelajaran terbaik diperoleh dengan pengoptimalan SGD dengan nilai akurasi 77,48% dan Loss 0,71%. SGD tidak menggunakan banyak memoriGradient Descent sehingga konvergen lebih cepat. Selain itu SGD bekerja dengan memilih data sampel acak dari satu atau beberapa bagian dari data pelatihan dalam satu iterasi dengan cara yang iteratif. Data sampel acak ini dikoreksi berdasarkan aturan yang melibatkan gradien pertama untuk mengukur perubahan fungsi bersama dengan perubahan nilai input. Juga, hasil akurasi percobaan ini menunjukkan bahwa skor F-Measure mencapai 39,5%.
Klasifikasi Kalimat Ilmiah Menggunakan 1D Convolutional Neural Networks Yoga Esa Mahendra; Ridwan Ilyas; Fatan Kasyidi
Prosiding Industrial Research Workshop and National Seminar Vol 11 No 1 (2020): Prosiding 11th Industrial Research Workshop and National Seminar (IRWNS)
Publisher : Politeknik Negeri Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (921.231 KB) | DOI: 10.35313/irwns.v11i1.2057

Abstract

Kalimat-kalimat yang tuliskan dalam suatu karya ilmiah memiliki banyak sekali ragamnya yang dipengaruhi dari hasil rujukan yang berbeda. Keberagaman kalimat ilmiah tersebut dapat diklasifikasi berdasarkan kelas yang telah didefinisi. Pada penelitian sebelumnya telah menunjukan bahwa penggunaan arsitektur CNN dapat digunakan untuk klasifikasi kalimat dengan masukan berupa vektor kata. Vektor kata didapatkan melalui hasil praporses dan embedding dengan metode Word2vec. Proses klasifikasi dalam penelitian ini menggunakan 2019 data berupa kalimat tunggal yang diperoleh dari makalah ilmiah komputasi dan telah dilabeli kedalam empat kelas yaitu “Weak”, “Comparison”, “Point”, dan “Neutral”. Penelitian ini telah melakukan simulasi pengujian menggunakan CNNMultichannel dengan model optimasi Adam yang memilki learning-rate 0,001 menghasilkan akurasi 74,51% dengan nilai loss 0,82 sedangkan untuk model CNN-Singlechannel memperoleh akurasi sebesar 70,76% dan nilai loss 1,73. Dari serangkaian pengujian menunjukan bahwa untuk model terbaik dicapai ketika menggunakan model CNNMultichannel dengan skor F-Measure 45,55%.
Pengukuran Kesamaan Semantik Pasangan Kalimat Sitasi Menggunakan Convolutional Neural Network Janjan Nurjaman; Ridwan Ilyas; Fatan Kasyidi
Prosiding Industrial Research Workshop and National Seminar Vol 11 No 1 (2020): Prosiding 11th Industrial Research Workshop and National Seminar (IRWNS)
Publisher : Politeknik Negeri Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (822.417 KB) | DOI: 10.35313/irwns.v11i1.2062

Abstract

Parafrasa merupakan salah satu istilah dalam linguistik yang berisi kalimat atau frasa untuk menyampaikan makna yang sama menggunakan kata-kata yang berbeda. Parafrasa juga digunakan untuk menguraikan suatu teks dalam bentuk atau susunan kata yang lain agar makna yang tersembunyi dalam teks tersebut dapat dijelaskan, namun untuk mengetahui makna suatu kalimat tidaklah mudah. Oleh karena itu, dibutuhkan model komputasi yang dapat mengukur kesamaan semantik pada pasangan kalimat sitasi. Kalimat sitasi diperoleh dari kumpulan sitasi hasil dari paper karya tulis ilmiah yang sudah dikumpulkan dan dilabeli oleh anotator. Pengukuran dilakukan menggunakan Convolutional Neural Network (CNN) dengan representasi vektor menggunakan Word2vec. Representasi kata yang terbentuk dari dua kalimat sebanyak 10.000 vektor menjadi masukan pada arsitektur CNN. Vektor yang terbentuk menjadi masukan untuk proses pelatihan pada MLP. Hasil pengukuran terdiri dari enam jenis kategori kelas hubungan pasangan kalimat sitasi yaitu Equivalent, Similar, Spesific, No Alignment, Related dan Opposite. Hal tersebut dikarenakan setiap pasangan kalimat memiliki kata yang berbeda namun memiliki makna yang sama. Hasil penelitian menunjukan hasil uji semantik pasangan kalimat sitasi dengan 1600 dataset latih menghasilkan akurasi sebesar 91% dan dengan menggunakan 400dataset uji menghasilkan akurasi 79% dengan F1-Score 66%.
Pengelompokan Status Ekonomi Keluarga Desa Tanjungsari menggunakan Metode K-Means Clustering FIQRI FAKHRUL GUNAWAN; FAJRI RAKHMAT UMBARA; FATAN KASYIDI
MIND (Multimedia Artificial Intelligent Networking Database) Journal Vol 7, No 2 (2022): MIND Journal
Publisher : Institut Teknologi Nasional, Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26760/mindjournal.v7i2.204-217

Abstract

ABSTRAKPada tahun 2020 hingga sampai saat ini tahun 2022 telah terjadi fenomena pandemi yang menyebabkan penuruan ekonomi yang cukup signifikan sehingga perubahan ekonomi masyarakat berubah, pengelompokan data harus dilakukan dengan teknik yang baik karena akan berpengaruh terhadap hasil akhir pengelompokan. Sehingga penelitan ini dilakukan untuk menginterpretasi kelompok yang terbentuk dari implementasi k-means clustering menggunakan 3 teknik similarity yaitu Euclidean, Manhattan dan Minkowski Distances yang memiliki nilai kemurnian tinggi berdasarkan nilai dari silhouette coefficient serta nilai cluster yang ditentukan pada penelitian ini menggunakan Teknik elbow method. Penelitian ini menghasilkan 5 claster yang dihasilkan dari elbow method. Dengan menghasilkan nilai silhoutte coeficient dari euclidean 0.059, manhattan 0.0946, dan minkowski 0.059. Kata kunci: status ekonomi, data mining, K-mean Clustering, silhouette coefficient, Euclidean Distance, Manhattan Distance, Minkowski DistanceABSTRACTIn 2020 until now in 2022 there has been a pandemic phenomenon which has caused a significant economic decline so that changes in the community's economy have changed, data grouping must be done with good technique because it will affect the final result of the grouping. So this research was conducted to interpret the groups formed from the implementation of k-means clustering using 3 similarity techniques namely Euclidean, Manhattan and Minkowski Distances which have a high purity value based on the value of the silhouette coefficient and the cluster values determined in this study using the elbow method technique. This study produced 5 clusters resulting from the elbow method. By producing a silhoutte coeficient value of euclidean 0.059, manhattan 0.0946, and minkowski 0.059.Keywords: economic status, data mining, K-mean Clustering, silhouette coefficient, Euclidean Distance, Manhattan Distance, Minkowski Distance
Prediksi Awal Penyakit Stroke Berdasarkan Rekam Medis menggunakan Metode Algoritma CART(Classification and Regression Tree) AGIEL FADILLAH HERMAWAN; FAJRI RAKHMAT UMBARA; FATAN KASYIDI
MIND (Multimedia Artificial Intelligent Networking Database) Journal Vol 7, No 2 (2022): MIND Journal
Publisher : Institut Teknologi Nasional, Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26760/mindjournal.v7i2.151-164

Abstract

ABSTRAKSeiring perkembangan zaman bidang teknologi dapat membantu banyak hal salah satu contoh nya dapat membantu bidang kesehatan, teknologi seperti machine learning dan data mining dapat membantu dalam melakukan prediksi penyakit stroke. Oleh karena itu, penelitian kali ini akan menerapkan salah satu metode data mining klasifikasi untuk memprediksi penyakit stroke dengan tujuan dapat mengetahui model dari algoritma yang akan digunakan yaitu Algoritma Classification and Regression Tree atau CART. Metode ini melakukan perhitungan menggunakan nilai ginigain dan giniindex untuk membuat sebuah pohon keputusan. Dengan menggunakan Stroke Prediction Dataset dan dilakukan beberapa eksperimen didapatkan hasil akurasi terbesar sebesar 89,83% pada split data 80/20. Pohon keputusan dapat dipangkas untuk mengidentifikasi dan membuang cabang pohon yang tidak diperlukan, pada penelitian kali ini dilakukan pemangkasan untuk dilihat seberapa berpengaruh pemangkasan pada akurasi algoritma ini dan didapatkan hasil akurasi terbesar sebesar 74,73% maka pemangkasan dinilai kurang berpengaruh pada akurasi algoritma ini.Kata kunci: Stroke, Prediksi, Klasifikasi, Data Mining, CARTABSTRACTAlong with the times, technology can help many things, one example of which can help the health sector, technology such as machine learning and data mining can help in predicting stroke. Therefore, this study will apply one of the classification data mining methods to predict stroke with the aim of knowing the model of the algorithm to be used, namely the Classification and Regression Tree Algorithm or CART. This method performs calculations using the Ginigain and Ginindex values to create a decision tree. By using the Stroke Prediction Dataset and conducting several experiments, the highest accuracy results were 89.83% in the 80/20 data split. In this study pruning was carried out to see how much pruning had an effect on the accuracy of this algorithm and the highest accuracy result was 74.73%, so pruning was considered to have less effect on the accuracy of this algorithm.Keywords: Stroke, Prediction, Classification, Data Mining, CART
Model Deteksi Botnet Menggunakan Algoritma Decision Tree Dengan Untuk Mengidentifikasi Serangan Click Fraud Rafli Firdaus; Asep Id Hadiana; Fatan Kasyidi
Journal of Informatics and Communication Technology (JICT) Vol 4 No 2 (2022)
Publisher : PPM Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.52661/j_ict.v4i2.122

Abstract

Malicious Software (Malware) merupakan program yang dibuat khusus untuk merugikan orang lain. Salah satunya Botnet, di mana Botnet dapat menginfeksi perangkat komputer serta membuat komputer tersebut sebagai suatu alat yang nantinya akan dikendalikan secara paksa oleh pemilik dari program Malware tersebut. Botnet sendiri dapat melakukan serangan Click Fraud untuk melakukan Fake Clicks terhadap iklan yang bersifat Pay Per Click. Botnet dengan serangan Click Fraud memiliki pola tingkah laku yang dapat diklasifikasikan dengan menggunakan Dataset CTU-13. Sehingga Flow Traffic dari Botnet yang melakukan serangan Click Fraud akan dapat terdeteksi dengan menggunakan algoritma CART dengan menggunakan teknik SMOTE untuk melakukan Oversampling dan teknik Random Undersampling untuk menangati ketidakseimbangan sebaran data untuk setiap kelasnya. Dengan menggunakan rasio Undersampling yaitu 50% dan terdapat 2 skenario untuk penggunaan teknik SMOTE, yaitu sebelum dan setelah data dibagi menjadi data latih dan data uji. Berdasarkan dari hasil penelitian yang telah dilakukan dapat disimpulkan bahwa dengan penggunaan teknik SMOTE dan Random Undersampling dalam kasus untuk pendeteksian Botnet yang melakukan serangan Click Fraud sebelum membagi dataset menjadi data latih dan data uji dapat meningkatkan akurasi ataupun kinerja dari model tersebut dengan mencapai tingkat akurasi sebesar 99.97%. Dan Nilai F-Score dari model yang menggunakan SMOTE dan Random Undersampling adalah 99.96%.
Pembangkitan Kalimat Ilmiah Menggunakan Recurrent Neural Network Reza Dwi Putra; Ridwan Ilyas; Fatan Kasyidi
SisInfo Vol 3 No 1 (2021): SisInfo
Publisher : Universitas Informatika dan Bisnis Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (508.008 KB)

Abstract

Text Generation merupakan pekerjaan dasar Natural Language Processing (NLP), yang memainkan peran penting dalam sistem dialog dan terjemahan cerdas. Text Generation merupakan sistem yang dapat membangkitkan text berupa kalimat secara otomatis dari teks atau dokumen dengan menggunakan metode atau beberapa pola tertentu. Recurrent Neural Network (RNN) merupakan arsitektur jaringan saraf tiruan yang telah terbukti berkinerja baik karena pemrosesannya disebut berulang kali untuk memproses input data sekuensial. Penelitian ini telah berhasil membuat model komputasi pembuatan teks menggunakan RNN, dengan fitur yang telah diekstraksi menggunakan fungsi Word2Vec untuk menghasilkan satu set vektor. Dalam melakukan proses pembuatan teks penelitian ini menggunakan total 1000 data kalimat ilmiah. Penelitian ini melakukan perbandingkan dengan tiga optimasi yaitu Adam, Nadam, dan Adamax untuk menemukan tingkat pembelajaran terbaik dan cocok untuk pembuatan teks. Hasil tingkat pembelajaran terbaik diperoleh dengan pengoptimalan Adamax dengan nilai skor BLEU yang dihasilkan mencapai 28. Hal ini menunjukan bahwa kualitas hasil terjemahan dari sistem cukup baik dalam menghasilkan kalimat yang direkomendasikan.