Claim Missing Document
Check
Articles

Found 16 Documents
Search

ANALISA PERBANDINGAN ALGORITMA K-MEANS, DECISION TREE, DAN NAE BAYES UNTUK SISTEM PENGELOMPOKKAN SISWA OTOMATIS Oktariani Nurul Pratiwi
Jurnal Ilmiah Teknologi Infomasi Terapan Vol. 2 No. 2 (2016)
Publisher : Universitas Widyatama

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (726.124 KB) | DOI: 10.33197/jitter.vol2.iss2.2016.98

Abstract

[INA]Pembelajaran kooperatif adalah proses pembelajaran dengan mengikuti beberapa instruksi yang melibatkan siswa bekerja dalam tim untuk mencapai tujuan bersama dalam kondisi yang mencakup unsur-unsur yang telah ditentukan. Pembelajaran kooperatif mampu membuat siswa lebih percaya diri dan mampu mengungkapkan pendapat sehingga, dapat meningkatkan kemampuan siswa lebih efektif. Salah satu faktor pendukung pembelajaran kooperatif adalah komposisi siswa dalam kelompok. Sebaiknya, penentuan kelompok belajar di sekolah dilakukan berdasarkan pengamatan guru terhadap siswa. Namun hal ini tidak mudah karena membutuhkan waktu lama, dan membuat beban kerja guru bertambah. Sehingga, cara termudah penentuan kelompok belajar adalah ditentukan secara acak. Risikonya, proses pembelajaran kooperatif tidak berjalan dengan efektif. Dibutuhkan sebuah sistem yang mampu menentukan komposisi anggota belajar siswa secara otomatis. Dalam paper ini dipaparkan hasil analisis perbandingan algoritma K-means, Decision Tree, Naive Bayes terhadap data siswa yang dapat digunakan untuk pengelompokkan siswa. Dari hasil uji coba didapatkan Nae Bayes mampu mengelompokkan siswa lebih baik dengan nilai akurasi 70,37%.Kata kunci :Pembelajaran Kooperatif, Pengelompokkan Siswa Otomatis, K-Means, Decision Tree, Nae Bayes.[EN]Cooperative learning is a process of learning that following some instructions involving students work in teams to achieve goal in a condition. Cooperative learning makes students more confident to tell opinions, and improve the ability of students more effectively. Formation of students in a group is important. Preferably, the determination of group learning in school is based on the observation of the student teachers. But, it is not easy because it takes a long time, and increase teacher task. The easiest way of determining groups of students by determined randomly. Hence, cooperative learning become inefficient. This process need a system that capable to determine the formation of the student's learning automatically. In this paper presented the results of a comparative analysis of K-means algorithm, Decision Tree, Nae Bayes. The best result of the experiment by Nae Bayes 70,37% accurately.Keywords : Cooperative Learning, Automatic Grouping of Student, K-means, Decision Tree, Nae Bayes.
PERBANDINGAN ALGORITMA KLASIFIKASI SUPPORT VECTOR MACHINE DAN NAIVE BAYES PADA IMBALANCE DATA Chika Enggar Puspita; Oktariani Nurul Pratiwi; Edi Sutoyo
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) Vol 8, No 1 (2021): Desember 2021
Publisher : STMIK Royal

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33330/jurteksi.v8i1.1185

Abstract

Abstract: Question classification is a computer science system, which aims to analyze questions and can label each question based on existing categories. Questions can be collected from several materials or topics that are many and different. Therefore, the researcher intends to create a classification system for quiz questions Data Warehouse and Business Intelligence which can be grouped into topics Data Warehouse, Business Intelligence, Data Analytics, and Performance Measurement. One way to solve this problem is by approach machine learning. In this study, researchers used a comparison of machine learning algorithms, namely the algorithm NaïveBayes and SupportVectorMachine using SMOTE and methods Cross-Validation The results of this study show the best accuracy results and are very helpful. The results obtained in the method cross-validation before SMOTE resulted in an accuracy rate of 82.02% for the results after going through the SMOTE stage of 94.79% on the algorithm Naïve Bayes, while the algorithm SupportVectorMachine get accuracy of 81.39% in the process before SMOTE for the results after going through SMOTE of 96.52%.  Keywords: Cross-Validation; Machine Learning; Naive Bayes; Support Vector Machine; Question Classification  Abstrak: Klasifikasi pertanyaan merupakan sebuah sistem ilmu komputer, yang bertujuan untuk menganalisis pertanyaan serta dapat memberi label pada setiap pertanyaan berdasarkan kategori yang ada. Pertanyaan soal dapat dikumpulkan dari beberapa materi atau topik yang banyak dan berbeda. Oleh karena itu, bermaksud untuk membuat sistem klasifikasi pertanyaan soal kuis Data Warehouse dan Business Intelligence yang dapat dikelompokkan menjadi topik Data Warehouse, Business Intelligence, Data Analitik, dan Pengukuran Kinerja. Cara  yang dapat dilakukan untuk permasalahan ini dengan menggunakan pendekatan MachineLearning. Pada penelitian kali ini menggunakan perbandingan algoritma MachineLearning yaitu algoritma NaïveBayes dan SupportVectorMachine menggunakan metode SMOTE dan Cross-Validation. Hasil penelitian ini menunjukkan hasil akurasi yang terbaik dan sangat membantu. Hasil yang diperoleh pada metode cross-validation sebelum SMOTE menghasilkan tingkat akurasi sebesar 82.02% untuk hasil sesudah melalui tahap SMOTE sebesar 94.79 %  pada algoritma Naïve Bayes, sedangkan pada algoritma Support Vector Machine menghasilkan akurasi sebesar pada proses sebelum SMOTE 81.39% untuk hasil sesudah melalui SMOTE sebesar 96.52%. Kata kunci: Klasifikasi Pertanyaan; Pembelajaran Mesin; Naive Bayes; Support Vector Machine; Cross-Validation
Analisis Sentimen IMBd Film Review Dataset Menggunakan Support Vector Machine (SVM) dan Seleksi Feature Importance Hilda Nuraliza; Oktariani Nurul Pratiwi; Faqih Hamami
Jurnal Mirai Management Vol 7, No 1 (2022)
Publisher : STIE AMKOP

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37531/mirai.v7i1.2222

Abstract

Perkembangan teknologi internet khususnya dalam bidang perfilman memberikan sarana terbuka bagi masyarakat dalam mengekspresikan pendapat dan emosional. Salah satu pendapat yang seringkali masyarkat keluarkan yaitu berupa penilaian sebuah film pada platform tertentu seperti IMDB. Ulasan yang dikeluarkan tentunya mengandung emosional yang dibawakan oleh masyarakat itu sendiri, baik emosional positif maupun negatif yang dinamakan sentimen. Sentimen atau opini masyarakat ini perlu dianalisis untuk mengklasifikasikan opini sesuai dengan kelasnya sehingga kecenderungannya terhadap suatu objek dapat diketahui. Adapun metode yang digunakan dalam penelitian ini yaitu metode data mining dengan Knowledge Discovery in Database (KDD). Tujuan dari penelitian ini yaitu analisa sentiment IMDB film review oleh masyarakat menggunakan algoritma Support Vector Machine dan seleksi Feature importance untuk memperoleh pola dan hasil yang terbaik. Dengan pengujian validasi akurasi data menggunakan metode split data sederhana dan k-fold cross validation yang menghasilkan akurasi sebesar 91.942% dan 87.699%. Lalu Kemudian dilakukan evaluasi menggunakan confusion matrix dengan penetapan max feature sebesar 10000 untuk memeriksa nilai ketepatan prediksi yang dilakukan oleh model yaitu diperoleh akurasi sebesar 88.033%. Dalam hal ini dapat dibuktikan bahwa kemampuan model dalam melakukan klasifikasi dinilai cukup baik. Keywords: Data Mining, KDD, Feature Importance, SVM, Confusion Matrix
Analisis Sentimen Review Customer Terhadap Laptop Asus Dan Laptop Acer Menggunakan Metode Support Vector Machine Eflin Trinova Limbong; Oktariani Nurul Pratiwi; Hilman Dwi Anggana
eProceedings of Engineering Vol 8, No 5 (2021): Oktober 2021
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pada masa pandemi covid 19 masyarakat bekerja dari rumah, belajar dari rumah, dan ibadah dari rumah. Sehingga banyak aktivitas yang harus dilakukan secara daring (online). Oleh karena itu dibutuhkan teknologi pendukungnya, salah satunya adalah laptop. Penelitian ini memilih melakukan analisis sentimen review konsumen pada laptop Asus dan laptop Acer. Penelitian ini berguna untuk mewangetahui sentimen pelanggan terhadap laptop Asus dan Acer pada media sosial Twitter dan menerapkan algoritma Support Vector Machine. Data diambil melalui API Twitter. Kemudian data akan diberi label sesuai sentimen dan aspeknya. Data akan di preprocessing kemudian data hasil preprocessing diberi bobot agar dapat diklasifikasi menggunakan Support Vector machine. Data akan dibagi menjadi data training dan data testing dan menghasilkan rasio terbaik 70:30 untuk data Asus dan 80:20 untuk data Acer. Percobaan dilakukan dengan kernel linear, kernel radial basis function dan kernel polynomial kemudian dievaluasi dengan confusion matrix dan dilakukan validasi dengan k fold cross validation. Pada data Asus rasio terbaik 70:30 dengan akurasi terbaik kernel radial basis function rata-rata Precision 99%, Recall 99%, dan F1-Score sebesar 99% dan telah dilakukan validasi menghasilkan rata-rata 99.63%. pada data Acer rasio terbaik adalah 80:20 dengan akurasi terbaik kernel polynomial rata-rata Precision 100%, Recall 100%, dan F1-Score sebesar 100% dan telah dilakukan validasi menghasilkan rata-rata 99.6%. Kata Kunci: Acer, Asus, Analisis Sentimen, Confusion Matrix, Support Vector Machine.
Analisis Sentimen Review Customer Terhadap Produk Indihome Dan First Media Menggunakan Algoritma Convolutional Neural Network Saleh Hasan Badjrie; Oktariani Nurul Pratiwi; Hilman Dwi Anggana
eProceedings of Engineering Vol 8, No 5 (2021): Oktober 2021
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pada masa ini media sosial merupakan salah satu media untuk mengetahui dan memberikan informasi secara luas dan cepat. Era digital dimana berkembang pesatnya industri 4.0, sebagian besar informasi yang tersebar dalam media sosial dapat berupa pendapat, opini, masukkan, dan juga saran setiap perorangan atau individu terhadap sebuah produk atau objek tertentu yang disebut sentimen. Terdapat tiga macam sentimen yaitu sentimen positif, sentimen negatif, dan sentimen netral. Tiga sentimen tersebut digunakan di beberapa panggung ternama seperti Twitter. Internet pun mulai berkembang di zaman ini dari setiap provider untuk menggunakan media sosial tersebut seperti IndiHome dan First Media. Dua provider tersebut tidak sedikit dari masyarakat Indonesia mengungkapkan pendapatnya terkait layanan atau produk tersebut dari konektivitas, harga, dan layanan pelanggan. Dari fenomena tersebut analisis sentimen dapat dilakukan untuk mendapatkan nilai dan value dari kedua objek tersebut yang akan dianalisis. Tetapi, dalam penerapan analisis sentimen membutuhkan algoritma yang dapat melakukan sebuah klasifikasi pendapat atau sentimen masyarakat. Dalam hal ini, penelitian yang ada sebelumnya dapat digunakan sebagai referensi yang akan digunakan dalam analisis ini dari segi algoritma, analisis sentimen dan klasifikasi. Algoritma CNN (Convolutional Neural Network) adalah algoritma deep learning yang dapat menggunakan gambar sebagai input, menetapkan kepentingan untuk berbagai aspek dan objek dalam gambar agar dapat membedakan satu dengan yang lain dan memiliki akurasi yang tinggi, sehingga dalam penelitian analisis sentimen review produk IndiHome dan First Media. Penelitian ini bertujuan untuk melakukan penilaian produk terhadap provider menggunakan metode analisis sentimen review customer dari tiap tweets yang pelanggan telah lampirkan dengan algoritma convolutional neural network. Menggunakan aplikasi website open-source yaitu Jupyter Notebook. Hasil akurasi yang didapatkan, memperoleh akurasi tertinggi sebesar 98% untuk provider IndiHome dan 91% untuk provider First Media. Kata Kunci: Twitter, Analisis Sentimen, IndiHome, First Media, CNN.
Analysis of Resilience of Education System in Higher Education Due to Covid-19 Pandemic in Indonesia: A Systematic Literature Review Ida Bagus Ketut Widiartha; Jun-seok Hwang; Hyoen-yeong Yoon; Oktariani Nurul Pratiwi
JOIV : International Journal on Informatics Visualization Vol 7, No 2 (2023)
Publisher : Society of Visual Informatics

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30630/joiv.7.2.1814

Abstract

This study discusses learning strategies resilience that can be used to improve learning outcomes during the current pandemic circumstances, which have limitations in face-to-face learning. Online learning has many limitations compared to offline one. However, it must keep running because one of the strategies against the SAR-Cov2 virus is to inhibit its spread by limiting direct contact with other people. The literature review is carried out with a protocol involving text mining tools to find the most widely used keywords and their relationships, which is then carried out by a snowball literature review to deepen these keywords. There are several findings from this study, namely (1) Three critical components that play a significant role in improving learning outcomes in the distance learning method, namely the role of students, lectures, and technology. (2) A framework must ensure that the other three components perform their functions properly and provide an effective learning environment. (3) Reward and punishment play a vital role in ensuring the framework is implemented as it should be. Integrating an effective learning environment with remuneration programs and teaching grants will encourage improvements in the learning process and increase the number of positive contents on the Internet. This learning environment can also be a model that supports independent learning activities - an independent campus, the Ministry of Education and Culture of the Republic of Indonesia's flagship program, and digital commercialization in the educational sphere.
Analisis Sentimen Review Pengguna Website IMDB Menggunakan Klasifikasi Naïve Bayes Yuni Kardila; Oktariani Nurul Pratiwi; Faqih Hamami
eProceedings of Engineering Vol 10, No 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak-Website IMDB (Internet Movie Database) merupakan suatu web yang digunakan untuk menyediakan atau melihat berbagai informasi tentang jutaan film yang telah tayang, yang digunakan untuk melihat review, rating, pemeran dan kru dari film tersebut. Para pengguna baru biasanya suka melihat review pengguna lainnya sebelum menentukan film apa yang akan mereka tonton, namun semakin banyak dan semakin besar review yang diberikan akan semakin besar dampak penilaian tersebut terhadap keputusan para pengguna baru, sehingga apabila para pengguna baru tidak dapat mengartikan makna dari review yang diberikan, untuk mengatasi hal tersebut dilakukanlah analisis sentimen. Penelitian yang dilakukan kali ini bertujuan untuk menganalisa analisis sentimen terhadap movie review yang diberikan oleh pengguna website IMDB, dengan menggunakan algoritma Naïve Bayes Multinomial. Penelitian ini juga menggunakan text preprocessing, dan TF-IDF untuk meningkatkan nilai akurasi dari model tersebut. Hasil evaluasi menggunakan confusion matrix menunjukan nilai accuracy 88.93%, nilai precision 89.07%, nilai recall sebesar 89.14% dan nilai F1-Score 89.11%, dengan perbandingan data training dan testing 70:30. Hasil klasfikasi yang dilakukan menghasilkan data 7533 berlabel positif dan 7249 berlabel negatif, nilai tersebut menunjukan sebagian besar para pengguna IMDB berkomentar positif terhadap film yang mereka tonton.Kata kunci-Naïve Bayes, IMDb, sentiment analysis, text preprocessing
Klasifikasi Review Customer Di E-Commerce Bukalapak Menggunakan Metode Support Vector Machine (SVM) Ivania Nonita Chrisdiyanti; Riska Yanua Fa'rifah; Oktariani Nurul Pratiwi
eProceedings of Engineering Vol 10, No 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak-Bukalapak menempati urutan ketiga dalam top 10 e-commerce Indonesia, tujuan pemeringkatan tersebut yaitu agar pihak Bukalapak dapat meningkatkan kualitas dan kuantitas layanannya. Mengklasifikasi review dari customer Bukalapak yang terlalu banyak membutuhkan waktu yang lama jika dilakukan dengan cara manual. Dibutuhkan suatu metode yang dapat mengklasifikasikan customer review. Metode yang digunakan untuk mengkasifikasikan review adalah Support Vector Machine. Review akan diklasifikasi menjadi dua jenis yaitu positif dan negatif review. Tahapan untuk melakukan klasifikasi pada penelitian ini adalah preprocessing data, ekstraksi fitur dengan TF-IDF, analisis SVM, dan evaluasi.Terdapat 3 skenario yang digunakan dalam penelitian ini, yaitu perbandingan 60:40, 70:30, dan 80:20. Hasil klasifikasi dengan SVM dan fungsi kernel linier pada data training menunjukkan bahwa ketiga rasio mempunyai akurasi dari model terbaik yang dibentuk oleh SVM adalah rasio 60:40. Evaluasi dari model terbaik dari SVM didapatkan akurasi sebesar 85%, Recall sebesar 79%, Precision 89%, dan F1-Score sebesar 84%. Hasil dari K-Fold Cross Validation dengan 10 Fold menunjukkan hasil yang tidak jauh berbeda dari evaluasi yaitu rata-rata sebesar 84%. Hasil klasifikasi kategori positif dapat dijadikan acuan untuk mempertahankan kualitas layanan dan hasil klasifikasi negatif dapat digunakan sebagai bahan evaluasi dalam meningkatkan layanan di Bukalapak.Kata kunci- customer review klasifikasi, SVM, kernel linear
Klasifikasi Review Customer E-Commerce Menggunakan Metode K-Nearest Neighbor (Studi Kasus: Bukalapak) Shinta Pramuwidya; Riska Yanu Fa'rifah; Oktariani Nurul Pratiwi
eProceedings of Engineering Vol 10, No 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak- Melihat persaingan e-commerce yang semakin ketat saat ini membuat Bukalapak melakukan berbagai upaya agar dapat bertahan serta meningkatkan kualitas layanan terhadap konsumen. Salah satu cara yang dapat dilakukan adalah melakukan evaluasi dari hasil review. Untuk dapat mengambil sebuah keputusan dari hasil review langkah yang perlu diambil salah satunya dengan mengklasifikasikan review dengan bertujuan untuk mengkategorikan data terhadap komentar atau review sehingga dapat membantu pelaku usaha dalam menarik kesimpulan terkait kecenderungan komentar. Dataset yang telah dikumpulkan dilakukan preprocessing sehingga berjumlah sebanyak 87.241 data. Di karenakan data memiliki missing value maka diatasi dengan metode imputasi menggunakan mode(). Setelah mengatasi missing value, dataset dihitung pembobotannya dengan tfidfVectorizer, selanjutnya di resampling dengan SMOTE agar data seimbang. Review dianalisis dengan algoritma K-Nearest Neighbors dengan tiga skenario yaitu 60:40, 70:30, dan 80:20, serta memiliki tiga jenis k_neighbors yaitu k=3, k=5 dan k=7. Jarak yang digunakan pada penelitian ini adalah Euclidean. Hasil analisis menunjukan bahwa KNN terbaik ada pada rasio training dan testing 80:20 dengan k=3. Hasil analisis menunjukan hasil evaluasi sebesar 76,42%. Hasil klasifikasi dengan KNN menunjukan komentar negatif lebih banyak daripada yang positif. Dari hasil penelitian ini diharapkan dapat dijadikan bahan evaluasi bagi Bukalapak untuk meningkatkan kualitas layanan.Kata kunci- klasifikasi, K-Nearest neighbors, euclidean
Automatic Question Generator Menggunakan Metode Template-Based Jody Mardika; Oktariani Nurul Pratiwi; Faqih Hamami
eProceedings of Engineering Vol 10, No 2 (2023): April 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak— Pada penelitian ini akan membahas tentang pengembangan generator soal otomatis untuk materi biologi pada jenjang SMA. Dalam pengembangan generator soal, tentunya telah banyak sekali contoh situs generator soal yang dapat ditemui di internet, akan tetapi hampir keseluruhan generator soal yang dapat ditemui di internet, mengharuskan pengguna untuk menggunakan bahasa inggris dan situs hanya bisa menghasilkan pertanyaan berupa pertanyaan singkat atau factoid, sehingga penelitian ini bertujuan untuk melakukan pengembangan generator soal berbahasa Indonesia dengan tipe pertanyaan non-factoid menggunakan pendekatan template-based. Selain menggunakan pendekatan Template-Based, penelitian ini akan menggunakan algoritma Naïve Bayes untuk proses klasifikasi kalimat dengan bantuan GridsearchCV dan pipeline dari TF-IDF Transformers, String-Match untuk proses eliminasi kalimat, dan Chunking Labelling untuk proses tagging kata. Model generator soal yang dikembangkan pada penelitian ini memiliki rata-rata tingkat akurasi sebesar 90% dengan tingkat persentase jumlah pertanyaan yang layak digunakan sekitar 60%, sehingga model generator yang dikembangkan sudah cukup layak digunakan, akan tetapi memerlukan penelitian lebih lanjut agar model generator soal yang dihasilkan dapat memiliki performa yang lebih baik.Kata kunci— automatic question generator, naïve bayes classifier, chunking labelling, template-based, GridsearchCV, biologi, Soal SMA