Seminar Nasional Informatika (SEMNASIF)
Vol 1, No 1 (2021): Inovasi Teknologi dan Pengolahan Informasi untuk Mendukung Transformasi Digital

Fuzzy String Matching for Semi-Automatication of Words with Jaro Winkler Distance Algorithm on Microsoft Word Documents

Hasna Nur Hanani (Informatika, Universitas Pembangunan Nasional Veteran Yogyakarta)
Herlina Jayadianti (Informatika, Universitas Pembangunan Nasional Veteran Yogyakarta)
Heru Cahya Rustamaji (Informatika, Universitas Pembangunan Nasional Veteran Yogyakarta)



Article Info

Publish Date
08 Nov 2021

Abstract

Tujuan: mengukur pengaruh keberadaan fuzzy string matching pada pemiringan kata asing secara semi-otomatisasi dengan jaro winkler distance terhadap jumlah kata, waktu dan akurasi.Perancangan/metode/pendekatan: menguji ketepatan dan waktu pemrosesan pemiringan kata asing dengan jaro winkler dan menguji ketepatan dan waktu pemrosesan pemiringan kata asing dengan tambahan fuzzy string matching.Hasil: Akurasi semi-otomatisasi kata pada uji data satu menghasilkan nilai 83,73% untuk pemiringan dengan algoritma jaro winkler distance dan 84,33% untuk pemiringan kata dengan fuzzy string matching sedangkan semi-otomatisasi kata pada uji data dua dengan algoritma jaro winkler adalah 98,77%, sedangkan dengan penambahan fuzzy string matching akurasinya menjadi 99,11%. Pengukuran waktu pemrosesan menunjukkan bahwa dengan penambahan fuzzy string matching cenderung lebih cepat. Jumlah kata yang dimiringkan dengan fuzzy string matching lebih banyak dibanding pemiringan kata dengan jaro winkler distance pada kondisi dimana jumlah kata asing pada database sama.Keaslian/ state of the art: Penelitian ini, bermula dari pendeteksian kata asing pada dokume. Apabila kata aing yang merupakan kata dalam bahasa Inggris ditemukan, maka pada pngujian pertama kata tersebut akan diukur dengan algoritma Jaro Winkler distance. Jaro Winkler digunakan untuk mengukur persamaan kata antara kata asing yang ditemukan pada dokumen dengan kata asing pada database. Jika hasil dari jaro winkler distance adalah 1 maka kata akan dicetak miring. Pada pengujian kedua kata asing yang telah diukur dengan jaro winkler akan memiliki nilai persamaan kata yang akan diolah oleh fuzzy string matching. Fuzzy string matching akan memberikan toleransi nilai kepada hasil nilai persamaan kata. Hasil nilai fuzzy string matching akan menentuka kata asing tersebut akan dicetak miring atau tidak.

Copyrights © 2021