Claim Missing Document
Check
Articles

Found 1 Documents
Search
Journal : Sains, Aplikasi, Komputasi dan Teknologi Informasi

Klasifikasi Artikel Ilmiah Dengan Berbagai Skenario Preprocessing Hidayatul Ma'rifah; Aji Prasetya Wibawa; Muhammad Iqbal Akbar
Sains, Aplikasi, Komputasi dan Teknologi Informasi Vol 2, No 2 (2020): Sains, Aplikasi, Komputasi dan Teknologi Informasi
Publisher : Universitas Mulawarman

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30872/jsakti.v2i2.2681

Abstract

Penelitian ini bertujuan untuk menemukan kombinasi dan urutan preprocessing dalam text mining yang paling maksimal untuk klasifikasi bidang jurnal berbahasa Indonesia berdasarkan judul dan abstraknya. Tahap-tahap preprocessing yang akan diterapkan terdiri dari case folding, stemming, stopwords removal, transformasi VSM (Vector Space Model), dan SMOTE. Namun, pengamatan tiap skenario berfokus pada stemming dan dua teknik stopwords removal, yaitu stopwords removal berbasis kamus, dan berbasis document frequency setelah melewati proses transformasi ke dalam bentuk VSM dengan pembobotan TF-IDF (Term Trequency–Inverse Document Frequency). Proses klasifikasi mengadopsi algoritma k-NN (K-Nearest Neighbour), yang menentukan kelas suatu data tes dengan melihat tetangga terdekatnya. Dalam penelitian ini, metrik untuk menemukan jarak tetangga terdekat adalah Cosine Similarity. Pengujian klasifikasi menggunakan 10-Fold Cross Validation untuk menghasilkan confusion matrix sebagai hasil akhir. Kinerja klasifikasi terbaik dicapai dengan persentase accuracy sebesar 72.91% dan precision mencapai 73,36%.