Pertanyaan merupakan metode terbaik dan termudah untuk menggali sebuah informasi. Menurut aturan 5W1H, terdapat enam bentuk dasar pertanyaan yang dapat digunakan untuk memperoleh informasi, yaitu: what, where, when, why, who, how. Banyak jurnalis yang menggunakan metode ini, karena dapat diimplementasikan dengan cepat dan mudah untuk membangun sebuah pertanyaan. Untuk membuat sebuah sistem yang dapat memahami sebuah pertanyaan, misalnya seperti pada chatbot, terdapat metode khusus yang harus diterapkan untuk dapat membedakan keenam jenis pertanyaan yang ada. Penelitian ini mencoba untuk melakukan klasifikasi terhadap dokumen pertanyaan berdasarkan aturan 5W1H, dengan menggunakan tokenisasi dan stemming pada tahap pra-pemrosesan, kemudian K-Nearest Neighbors (K-NN) untuk mengklasifikasikan pertanyaan. Berdasarkan hasil pengujian, nilai akurasi tertinggi adalah 70.27% untuk k = 5.
Copyrights © 2021