Matrix : Jurnal Manajemen Teknologi dan Informatika
Vol 6 No 3 (2016): MATRIX - Jurnal Manajemen Teknologi dan Informatika

IMPLEMENTASI EKSTRAKSI FITUR PADA PENGOLAHAN DOKUMEN BERBAHASA INDONESIA

Putu Manik Prihatini (Jurusan Teknik Elektro, Politeknik Negeri Bali)



Article Info

Publish Date
22 Feb 2017

Abstract

Ekstraksi fitur merupakan proses untuk mencari nilai-nilai fitur yang terkandung dalam dokumen untuk proses text mining. Ekstraksi fitur menjadi bagian yang sangat penting dalam pengolahan dokumen pada mesin pencari karena sangat menentukan keberhasilan proses text mining. Salah satu metode ekstraksi fitur yang banyak digunakan dan populer adalah TF-IDF. Pada penelitian ini, metode TF-IDF telah diimplementasikan dengan membuat aplikasi menggunakan perangkat lunak Matlab. Dokumen untuk aplikasi diperoleh melalui media digital Detikcom dan disimpan dalam bentuk file teks. Proses pengolahan dokumen melibatkan case folding, tokenization, filtering, stemming dan ekstraksi fitur. Hasil ekstraksi fitur berupa matriks yang berisi urutan kata-kata unik dari seluruh dokumen dan nilai-nilai fitur TF-IDF dari setiap kata pada seluruh dokumen

Copyrights © 2016