Claim Missing Document
Check
Articles

Found 18 Documents
Search

Klasifikasi Soal Berdasarkan Kategori Topik Menggunakan Metode Algoritma Naïve Bayes Dan Algoritma C4.5 Luthfi Ahmad Muhaimin; Oktariani Nurul Pratiwi; Riska Yanu Fa’rifah
eProceedings of Engineering Vol 10, No 2 (2023): April 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak-Klasifikasi dilakukan untuk mengelompokkan sekumpulan data ke dalam kelas-kelas yang telah ditentukan terlebih dahulu berdasarkan kesamaan karakteristik yang dimiliki. Klasifikasi soal berdasarkan topik membantu para siswa dan pengajar dalam mengambil keputusan untuk menentukan soal berdasarkan kategori topiknya. Pada penelitian ini, peneliti bermaksud untuk membuat suatu model klasifikasi soal Biologi kelas 11 SMA yang dikelompokkan menjadi sembilan kategori topik yaitu Sel, Jaringan Tumbuhan dan Hewan, Sistem Gerak Manusia, Sistem Peredaran Darah, Sistem Pencernaan, Sistem Pernapasan, Sistem Ekskresi, Sistem Koordinasi, dan Sistem Reproduksi Manusia. Soal-soal dan topik didapatkan dari buku bank soal yang berjudul “Siap Pintar Belajar Mandiri”. Penelitian ini membandingkan nilai akurasi dan evaluasi performansi dari dua algoritma klasifikasi yaitu, Naive Bayes dan C4.5. Untuk evaluasi performansi peneliti menggunakan cross validation dan mencari nilai precision, recall, dan f1-score menggunakan confusion matrix. Dari hasil klasifikasi, diperoleh hasil akurasi algoritma Naive Bayes sebesar 72.72%, dan nilai akurasi evaluasi performansi menggunakan cross validation sebesar 73.09% dan nilai precision sebesar 73%, recall sebesar 73%, dan F1-Score sebesar 70%. Sedangkan algoritma C4.5 mendapat nilai akurasi sebesar 54.54%, dan nilai akurasi evaluasi performansi menggunakan cross validation sebesar 54.09% dan nilai precision sebesar 58%, recall sebesar 56%, dan F1-Score sebesar 55%.Kata kunci— klasifikasi soal, biologi, naive bayes, C4.5, cross validation
Klasifikasi Soal Sejarah Indonesia Tingkat Sma Berdasarkan Level Kognitif Revised Bloom’s Taxonomy Menggunakan Naïve Bayes Rudi Guna Pramudia; Oktariani Nurul Pratiwi; Riska Yanu Fa’rifah
eProceedings of Engineering Vol 10, No 2 (2023): April 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak— Pendidikan adalah proses pengubahan sikap dan tata laku seseorang. Evaluasi yang digunakan oleh guru dinegara kita berupa tes seperti ulangan atau ujian. Penelitian ini mengungkap bagaimana membuat machine learning untuk mengklasifikasikan soal sejarah Indonesia tingkat SMA level kognitif Revised bloom's taxonomy ditingkat kesulitan C1 sampai C3 dengan algoritma Naive bayes. Dalam melakukan pelabelan dilakukan dengan cara manual untuk menentukan soal berdasarkan level kognitif RBT. Untuk mendapatkan hasil akurasi sebuah machine learning pada penelitian ini ada beberapa tahapan yaitu tahapan preprocessing dimana dataset akan disaring menggunakan case folding, tokenizing, filtering, dan stemming selanjutnya dataset akan dilakukan pembobotan dengan TF-IDF. Peneliti menggunakan metode SMOTE over-sampling untuk mengatasi imbalance data kemudian dilakukan pengujian menggunakan K-fold dengan jumlah fold sebanyak 10 dan terakhir model dilakukan evaluasi performansi dengan menggunakan confusion matrix. Hasil klasifikasi diperoleh skor rata-rata K-fold dataset mengalami kenakikan 16% (60% - 76%) setelah dilakukan SMOTE kemudian hasil akurasi evaluasi performansi juga mengalami kenaikan sebanyak 21% (61% - 82%) ketika dilakukan SMOTE. Hasil penelitian yang diperoleh dari implementasi K-Fold Cross Validation dan confusion matrix menunjukan bahwa penggunaan algoritma Naïve bayes menunjukan skor akurasi yang baik, serta penggunaan metode oversampling sangat membantu dalam penelitian ini guna mengatasi imbalance data.Kata kunci— klasifikasi soal pertanyaan, naïve bayes, sejarah indonesia, SMOTE, RBT, oversampling, soal SMA
Klasifikasi Soal Sejarah Tingkat SMA Berdasarkan Level Kognitif Revised Bloom’s Taxonomy Menggunakan Algoritma K-Nearest Neighbour Manhattan Rama Ariandi; Oktariani Nurul Pratiwi; Riska Yanu Fa’rifah
eProceedings of Engineering Vol 10, No 2 (2023): April 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak—Pendidikan merupakan upaya terencana untuk mendorong siswa-siswi agar giat belajar guna mengembangkan bakat dan kecerdasannya melalui pembelajaran dengan melakukan berbagai latihan soal. Naskah soal biasanya berisi contoh soal dengan tingkat kesulitannya dan untuk dilakukan klasifikasi berdasarkan Revised Bloom’s Taxonomy merupakan kasus yang tidak mudah jika dilakukan dengan cara manual. Peneliti ini menggunakan bantuan machine learning untuk mengklasifikasikan pertanyaan secara otomatis berdasarkan tingkat kognitif Revised Bloom’s Taxonomy yang terfokus pada soal Sejarah Indonesia tingkat SMA dan level C1–C3 RBT. Dataset diperoleh dari berbagai latihan bank soal, ulangan harian, dan soal USBN yang terdapat di internet. Algoritma K-Nearest Neighbor (KNN) dengan pendekatan jarak Manhattan adalah metode yang digunakan pada penelitian ini. Selain itu, pembobotan kata sebagai bagian dari proses TF-IDF diterapkan terhadap dataset. Ketidakseimbangan data dari dataset yang diperoleh dalam penelitian ini diatasi dengan penggunaan metode oversampling SMOTE. Dataset tersebut kemudian diproses melalui K-Fold Cross Validation dengan nilai k = 10. Hasil akurasi penelitian yang telah dilakukan dengan algoritma KNN diperoleh nilai yang cukup baik dengan precision 90%, recall 87%, F1-Score 87% dan accuracy 87% dan teruji SMOTE dapat digunakan secara efektif dalam mengatasi imbalance data.Kata kunci—klasifikasi soal, KNN, manhattan, RBT, SMOTE, oversampling
Klasifikasi Soal Sejarah Tingkat SMA Berdasarkan Level Kognitif Revised Bloom’s Taxonomy Menggunakan Metode Stochastic Gradient Descent Amarila Zahratun Nisa; Oktariani Nurul Pratiwi; Riska Yanu Fa’rifah
eProceedings of Engineering Vol 10, No 2 (2023): April 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak— Pendidikan di tingkat formal membutuhkan aspek pengujian untuk memastikan ilmu pengetahuan diserap oleh siswa. Uji kompetensi terdiri dari berbagai macam tipe soal, salah satunya yaitu pilihan ganda. Soal yang dihimpun oleh guru dalam platform e-learning membutuhkan pemilahan sehingga dapat mengukur tingkat intelektual siswa dan mencakup keterampilan berpikir. Evaluasi dalam pemilahan soal didapati banyaknya soal yang belum tersaring sesuai dengan capaian kompetensinya. Pada penelitian ini, proses penyaringan yang melibatkan algoritma Revised Bloom’s Taxonomy diimplementasikan secara otomatis dengan menggunakan metode machine learning yaitu Stochastic Gradient Descent (SGD) pada soal sejarah tingkat SMA. Dikarenakan terdapat imbalance pada dataset, penelitian ini akan membandingkan antara dataset yang menerapkan dan yang tidak menerapkan metode oversampling SMOTE. Hasil klasifikasi dari penelitian ini diperoleh melalui implementasi algoritma SGD dengan tools python. Pada dataset tanpa SMOTE, algoritma SGD memiliki skor rata-rata K-Fold yaitu 62%. Pada dataset dengan SMOTE, algoritma SGD memiliki skor rata-rata 93%. Adapun hasil akurasi dari confusion matrix menunjukkan algoritma SGD pada dataset tanpa SMOTE memiliki performa 62%, sedangkan algoritma SGD pada dataset dengan SMOTE mendapatkan performa 94%. Hasil yang diperoleh melalui proses K-Fold Cross Validation dan confusion matrix tersebut menunjukkan bahwa dataset dengan menggunakan oversampling memiliki hasil yang lebih baik dibanding dengan dataset tanpa menggunakan oversampling.Kata kunci— klasifikasi pertanyaan, RBT, sejarah SMA, SGD, oversampling, SMOTE
Perbandingan Algoritma K-Nearest Neighbor dan Logistic Regression pada Analisis Sentimen terhadap Vaksinasi Covid-19 pada Media Sosial Twitter dengan Pelabelan Vader dan Textblob Fadhilah Fazrin; Oktariani Nurul Pratiwi; Rachmadita Andreswari
eProceedings of Engineering Vol 10, No 2 (2023): April 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak— Pada analisis ini metode yang digunakan yaitu metode klasifikasi K-Nearest Neighbor dan metode klasifikasi Logistic Regression dengan data yang diambil pada aplikasi twitter. Penelitian ini mengkaji tingkat akurasi pada sentimen masyarakat mengenai vaksinasi Covid-19 dengan label positif dan negatif. Nilai AUC pada algoritma KNN dengan pelabelan TextBlob yaitu sebesar 0,765 dengan dan 0,768 untuk pelabelan VaderSentiment keduanya termasuk kedalam kriteria fair classification. Sementara itu, pada algoritma Logistic Regression menghasilkan akurasi sebesar 84,97% dengan perbandingan rasio 90:10 untuk pelabelan TextBlob, sementara untuk pelabelan VaderSentiment dengan perbandingan rasio 90:10 menghasilkan akurasi sebesar 85,22%. Kedua algoritma divalidasi menggunakan K-Fold Cross Validation dengan jumlah fold 10. Hasil perbandingan yang diperoleh saat melakukan evaluasi dengan confusion matrix menunjukkan bahwa algoritma Logistic Regression dengan pelabelan VaderSentiment memiliki nilai akurasi yang paling tinggi dibandingakan dengan algoritma K-Nearest Neighbor dengan pelabelan TextBlob dan VaderSentiment. Kata kunci—vaksinasi covid-19, k-nearest neighbor, logistic regression, analisis sentimen
SENTIMENT ANALYSIS OF PUBLIC OPINIONS TOWARDS TELKOM UNIVERSITY POST PANDEMIC Anindya Prameswari Putri Djakaria; Oktariani Nurul Pratiwi; Hanif Fakhrurroja
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) Vol 10, No 1 (2023): Desember 2023
Publisher : STMIK Royal

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33330/jurteksi.v10i1.2645

Abstract

Abstract: Twitter, as a social media platform, has rapidly grown as a means for people to express their opinions and thoughts on various topics, including education. The number of Twitter users surged to 10.645.000 in 2020, with a significant increase during the pandemic. Telkom University, as a private institution of higher education in Indonesia, has become one of the topics of discussion on Twitter. Users’ opinions about Telkom University vary, ranging from positive to negative. To gain deeper insights into public view, sentiment analysis is essential. The analysis follows the Knowledge Discovery in Databases (KDD) process, utilizing the Naive Bayes classification algorithm. The evaluation results indicate the best accuracy achieved with an 80:20 data split, resulting in an accuracy rate of 82.05%, precision of 82.3%, recall of 82.05%, and F1-Score of 82.08%. The Naïve Bayes model demonstrates good performance for sentiment analysis of public views regarding Telkom University on Twitter.            Keywords: naïve bayes; sentiment analysis; twitter; telkom university.  Abstrak: Media sosial Twitter berkembang pesat sebagai sarana masyarakat berekspresi untuk menuangkan opini dan pikiran mereka mengenai topik apapun, termasuk pendidikan. Pengguna Twitter meningkat tajam hingga 10.645.00 pengguna pada tahun 2020 dan terus meningkat selama pandemi. Telkom University sebagai perguruan tinggi menjadi salah satu topik yang dibicarakan yang berkaitan dengan pendidikan. Pendapat mengenai Telkom University yang diungkapkan oleh pengguna Twitter beragam, baik positif maupun negatif. Analisis sentimen diperlukan untuk memahami pandangan publik lebih mendalam. Digunakan tahapan Knowledge Discovery in Databases dan algoritma klasifikasi Naïve Bayes dalam analisis ini. Hasil evaluasi menunjukkan akurasi paling baik dicapai dengan rasio data 80:20, dengan nilai akurasi sebesar 82.05%, nilai presisi sebesar 82.3%, nilai recall sebesar 82.05%, dan nilai F1-Score sebesar 82.08%. Model klasifikasi Naïve Bayes memiliki performa baik untuk analisis sentimen pandangan publik di Twitter mengenai Telkom University. Kata kunci: analisis sentimen; naïve bayes; twitter; telkom university.
Application of SMOTE Method on Topic Based Question Classification Using Naïve Bayes Algorithm Orvalamarva; Oktariani Nurul Pratiwi; Faqih Hamami
The Indonesian Journal of Computer Science Vol. 13 No. 4 (2024): Indonesian Journal of Computer Science (IJCS)
Publisher : AI Society & STMIK Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33022/ijcs.v13i4.4179

Abstract

In today's digital era, the utilization of technology in education is essential to support the learning process. This research discusses the classification of junior high school mathematics questions using the Naïve Bayes method. The use of an automated system in question classification helps reduce time and effort in grouping questions based on topics. The Naïve Bayes method was chosen because of its simplicity and ability to process data. The results showed that Naïve Bayes with SMOTE and Math symbols achieved 69% accuracy, while without SMOTE, the accuracy was lower. Cross-validation showed that the classification without symbols attained an accuracy of 89.35%, slightly superior to the classification using symbols, which was 88.79%. This result indicates that Naïve Bayes with SMOTE is more effective. Although the difference in accuracy with or without symbols is slight 0.56%, the performance is relatively equivalent, with an accuracy of 89%.
Perbandingan Analisis Sentimen Aplikasi Traveloka dan Tiket.com pada Twitter dengan Metode Support Vector Machine Rukmana, Putri Utami; Pratiwi, Oktariani Nurul; Fakhrurroja, Hanif
Jurnal Sistem Cerdas Vol. 6 No. 3 (2023)
Publisher : APIC

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37396/jsc.v6i3.350

Abstract

The emergence of the COVID-19 pandemic in Indonesia resulted in an economic crisis, including in the world of tourism, which caused a decline in the national economy. With the existence of Online Travel Agencies (OTA) such as Traveloka and Tiket.com, it is hoped that they can help improve the tourism sector for the Indonesian economy. As a popular OTA and to see the opinion of the Indonesian people, it can be seen from public opinion in the form of tweets on the Twitter application. The tweets data will be taken and sentiment analysis will be carried out on the OTA Traveloka and Tiket.com applications which will be classified into certain classes based on opinions and modeling will be carried out using the Support Vector Machine (SVM) algorithm method. This research aims to determine the level of accuracy of the SVM algorithm and find out how sentiment analysis compares between Traveloka and Tiket.com. In the sentiment analysis comparison, in terms of price, Traveloka is superior and in terms of service, Tiket.com is superior. After modeling by comparing splitting data and handling imbalanced data using Synthetic Minority Oversampling Technique (SMOTE), the best SVM accuracy results for the Tiket.com price dataset were 68%, for Traveloka prices it was 97%, for Tiket.com services it was 92%, and for Traveloka services it is 89%.