Seminar Nasional Informatika (SEMNASIF)
Vol 1, No 1 (2020): Peran Digital Society dalam Pemulihan Pasca Pandemi

IMPLEMENTASI PENGECEKAN PLAGIARISME PROPOSAL TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA UPN VETERAN YOGYAKARTA

Awang Hendrianto Pratomo (Jurusan Teknik Informatika Universitas Pembangunan Nasional Veteran Yogyakarta)
Andiko Putro Suryotomo (Jurusan Teknik Informatika Universitas Pembangunan Nasional Veteran Yogyakarta)



Article Info

Publish Date
15 Dec 2020

Abstract

AbstractThe thesis proposal submission system currently used by the Department of Informatics Engineering at UPN "Veteran" Yogyakarta is still using conventional manual methods, so difficulties are encountered in checking the document's similarity for the student's final project proposal. The Winnowing algorithm can be used to do similarity checking in text-based documents. The Winnowing algorithm works by retrieving text data from the thesis proposal, then carrying out several steps such as preprocessing by finding the smallest hash value of each document used as a comparison to determine the similarity value between documents. The results showed that the smaller n-gram size would get a larger percentage similarity value (76% and 89%). This happens because a smaller n-gram size will result in smaller truncated strings, increasing the probability of finding the same string of characters. The bigger n-gram size will result in more characters than the smaller n-gram size, which causes fewer character strings to be found thus lowering the similarity value (down to 57% and 68%).Keywords: thesis proposal, plagiarism, Winnowing algorithm, hash value, n-gramAbstrakSistem informasi skripsi yang saat ini digunakan oleh program studi Teknik Informatika UPN “Veteran” Yogyakarta masih menggunakan cara konvensional, sehingga ditemui kesulitan dalam proses pemeriksaan kemiripan dokumen yang ada dalam proposal tugas akhir mahasiswa. Pemeriksaan kemiripan dokumen dapat dilakukan dengan menggunakan algoritme Winnowing. Algoritme Winnowing bekerja dengan cara mengembil data teks dari proposal, kemudian dilakukan beberapa tahapan seperti preprocessing kemudian dilakukan dengan mencari nilai hash terkecil dari setiap dokumen yang digunakan sebagai pembanding untuk menentukan nilai kemiripan dokumen tersebut. Hasil penelitian diketahui bahwa pemilihan n-gram yang semakin kecil akan memperoleh nilai persentase kemiripan yang besar (76% dan 89%). Hal ini terjadi karena pada n-gram yang lebih sedikit, string yang dipotong lebih kecil sehingga kemungkinan untuk ditemukannya rangkaian karakter yang sama semakin besar. Semakin besarnya n-gram, maka mengandung karakter yang lebih banyak dibandingkan dengan n-gram yang lebih kecil sehingga menyebabkan rangkaian karakter yang ditemukan semakin berkurang sehingga menurunkan nilai similaritas (hingga 57% dan 68%).Kata kunci: proposal skripsi, plagiarisme, algoritme Winnowing, nilai hash, n-gram

Copyrights © 2020