Telematika : Jurnal Informatika dan Teknologi Informasi
Vol 17, No 2 (2020): Edisi Oktober 2020

TEXT MINING UNTUK MENDETEKSI PLAGIASI DOKUMEN DENGAN PENERAPAN STEMMING NAZIEF-ADRIANI DAN ALGORITMA SMITH-WATERMAN

Alvika Meitaningsih (Universitas Pembangunan Nasional Veteran Yogyakarta)
Agus Sasmito Aribowo (Universitas Pembangunan Nasional Veteran Yogyakarta)
Nur Heri Cahyana (Universitas Pembangunan Nasional Veteran Yogyakarta)



Article Info

Publish Date
05 Nov 2020

Abstract

Plagiarisme adalah tindakan menjiplak karya orang lain dan mengakui sebagai hasil karya pribadinya. Saat ini sudah banyak algoritma yang membahas cara mendeteksi plagiarisme dokumen teks seperti Cosine, Smith Waterman. Hasil penelitian sebelumnya menyatakan bahwa algoritma Smith Waterman memiliki keakurasian yang rendah, sehingga pada penelitian ini dilakukan pengembangan dari Algoritma Smith Waterman. Algortima Smith Waterman biasa digunakan didalam bidang bioinformatika untuk menentukan kesamaan DNA, akan tetapi dalam penelitian ini Algoritma Smith Waterman dapat diimplementasikan untuk mendeteksi dokumen. Proses pendeteksian kemiripan dokumen pertama-tama dilakukan proses preprocessing untuk menghilangkan imbuhan guna memudahkan proses pendeteksian dokumen yaitu dengan menggunakan stemming. Stemming yang digunakan dalam penelitian ini adalah Stemming Nazief & Adriani dan untuk mengukur tingkat keakurasian pada proses pendeteksian dokumen dilakukan perhitungan menggunakan algoritma Smith Waterman untuk mendapatkan hasil persentase kemiripan antar dokumen. Dari uji coba yang dilakukan penambahan preprocessing yaitu stemming mempengaruhi waktu proses pengujian karena pada proses preprocessing ini kata yang berimbuhan akan dikembalikan ke kata dasar dan dicocokan dengan data kamus yang ada didalam database.

Copyrights © 2020