Sebatik
Vol 22 No 2 (2018): DESEMBER 2018

IMPLEMENTASI JACCARD INDEX DAN N-GRAM PADA REKAYASA APLIKASI KOREKSI KATA BERBAHASA INDONESIA

Aida Indriani (Teknik Informatika, STMIK PPKIA Tarakanita Rahmawati)
Muhammad Muhammad (Sistem Informasi, STMIK PPKIA Tarakanita Rahmawati)
Suprianto Suprianto (Magister Teknik Informatika, Universitas Ahmad Dahlan)
Hadriansa Hadriansa (Teknik Informatika, STMIK PPKIA Tarakanita Rahmawati)



Article Info

Publish Date
04 Dec 2018

Abstract

Banyaknya informasi diberbagai media, membuat pengguna harus jeli dalam mencari informasi yang benar. Informasi yang dikatakan benar bukan hanya dilihat dari sumber terpercaya, tetapi dalam penulisan tidak boleh terjadi kesalahan ejaan kata (typo) yang dapat mengakibatkan kesalahpahaman makna informasi yang dibaca. Untuk meminimalkan kesalahan ejaan kata dibutuhkan peran editor dengan melakukan koreksi kata secara satu per satu. Tujuan dari penelitian ini adalah untuk membuat aplikasi koreksi kata secara otomatis, dengan memanfaatkan teknik text mining yaitu set based similarity measure. Teknik yang digunakan yaitu jaccard index dan menggunakan bantuan fitur N-gram sebanyak 3 yaitu Bi-gram, Tri-gram dan Quad-gram. Selain itu, penelitian ini bertujuan untuk menentukan fitur N-gram yang tepat dalam melakukan koreksi kata. Dengan adanya aplikasi koreksi kata ini diharapkan dapat membantu tim editor dalam melakukan pengecekan kata sebelum dipubikasikan ke umum. Untuk analisa fitur N-gram yang tepat untuk melakukan koreksi kata adalah fitur Bi-gram.

Copyrights © 2018






Journal Info

Abbrev

sebatik

Publisher

Subject

Computer Science & IT

Description

SEBATIK merupakan jurnal kumpulan artikel hasil penelitian, karya ilmiah, maupun program pengabdian masyarakat dari seluruh civitas akademik di Indonesia dalam rangka mengitegrasikan informasi. SEBATIK menyediakan layanan publikasi terbuka untuk semua kalangan umum, baik di semua lingkungan ...