Etsa, Muhammad Dwi
Program Studi Informatika

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Pengaruh Metode Dictionary Lookup pada Cleaning Korpus Terhadap Akurasi Mesin Penerjemah Statistik Indonesia–Melayu Pontianak Etsa, Muhammad Dwi; Sujaini, Herry; Safriadi, Novi
JEPIN (Jurnal Edukasi dan Penelitian Informatika) Vol 4, No 1 (2018): Volume 4 No 1
Publisher : Program Studi Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (792.841 KB) | DOI: 10.26418/jp.v4i1.24595

Abstract

Bahasa Melayu Pontianak merupakan dialek bahasa Melayu yang dituturkan oleh masyarakat Kota Pontianak dan sekitarnya, meskipun masih jauh dari kepunahan namun perlu dilestarikan sebagai tindakan pencegahan agar tidak punah, salah satu upaya pelestarian bahasa daerah yaitu dengan pembuat mesin penerjemah. Mesin Penerjemah Statistik (MPS) adalah sebuah pendekatan mesin penerjemah dengan hasil terjemahan dihasilkan atas dasar model statistik, namun masih terdapat kelemahan yaitu rendahnya tingkat akurasi terjemahan. Proses cleaning adalah proses pencarian dan perbaikan (penghapusan) kata atau kalimat yang salah ataupun tidak sesuai dalam rangka meningkatkan tingkat akurasi terjemahan, salah satu metode yang dapat digunakan pada proses cleaning adalah metode dictionary lookup. Tujuan dari penelitian ini adalah mengetahui pengaruh penerapan metode dictionary lookup pada proses cleaning korpus terhadap akurasi mesin penerjemah statistik bahasa Indonesia – bahasa Melayu Pontianak. Penelitian menggunakan korpus paralel sebanyak 9157 kalimat. Pengujian dilakukan dengan membandingkan nilai akurasi hasil terjemahan sebelum dan setelah cleaning dengan metode dictionary lookup. Pengujian dilakukan dengan pengujian otomatis menggunakan Bilingual Evaluation Understudy (BLEU). Dari hasil penelitian, penerapan metode dictionary lookup pada proses cleaning dapat mempengaruhi akurasi MPS, ini terlihat dari terjadinya penurunan sebesar 1,5% pada korpus manual dan penurunan sebesar 6,94% dengan korpus orisinal sementara itu terjadi peningkatan sebesar 2,58% pada korpus clean dic. Berdasarkan hal tersebut penerapan metode dictionary lookup pada proses cleaning dapat menurunkan nilai akurasi hasil terjemahan.