JUSTIN (Jurnal Sistem dan Teknologi Informasi)
Vol 7, No 1 (2019)

Peningkatan Mesin Penerjemah Statistik dengan Menambah Kuantitas Korpus Monolingual (Studi Kasus : Bahasa Indonesia - Sunda)

Darwis, Robby (Unknown)
Sujaini, Herry (Unknown)
Nyoto, Rudy Dwi (Unknown)



Article Info

Publish Date
31 Jan 2019

Abstract

Bahasa merupakan alat komunikasi yang dijadikan sarana untuk berinteraksi dengan masyarakat sekitar. Kemampuan akan penguasaan banyak bahasa tentunya akan mempermudah untuk berinteraksi dengan orang lain dari berbagai daerah yang berbeda. Oleh karena itu, diperlukan penerjemah untuk menambah pengetahuan akan berbagai bahasa yang ada. Mesin Penerjemah Statistik (Statistical Machine Translation) merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus paralel. Korpus paralel adalah pasangan korpus yang berisi kalimat-kalimat dalam suatu bahasa dan terjemahannya. Salah satu fitur yang digunakan untuk meningkatkan akurasi hasil terjemahan adalah dengan fitur Menambah Kuantitas Korpus Monolingual.Tujuan yang ingin dicapai dalam penelitian ini adalah melakukan penggunaan fitur Menambah Kuantitas Korpus Monolingual pada mesin penerjemah statistik bahasa Indonesia ke bahasa Sunda untuk meningkatkan nilai akurasi hasil terjemahan. Pengujian dilakukan dengan membandingkan nilai akurasi hasil terjemahan sebelum dan setelah Menambah Kuantitas Korpus Monolingual. Penelitian menggunakan korpus paralel sebanyak 3000 korpus. Pengujian dilakukan dengan dua cara, yaitu pengujian otomatis menggunakan Bilingual Evaluation Understudy (BLEU) dan pengujian oleh ahli bahasa Sunda. Dari hasil penelitian, penggunaan Menambah Kuantitas Korpus Monolingual dapat meningkatkan kualitas terjemahan untuk mesin penerjemah bahasa Indonesia ke bahasa Sunda. Hal itu terlihat dari hasil pengujian dengan menambahkan fitur Menambah Kuantitas Korpus Monolingual terdapat peningkatan nilai BLEU dengan korpus 3400 sebesar 0.32%, 4400 korpus sebesar 0.51%, 5400 korpus sebesar 0,42%, 6400 korpus sebesar 0.51%, 7400 korpus sebesar 0.87%, 8400 korpus sebesar 1.04%, 9400 korpus sebesar 1.79%  pada pengujian otomatis dan 19.13% pada pengujian oleh ahli bahasa. Berdasarkan hal tersebut, mesin penerjemah statistik bahasa Indonesia ke bahasa Sunda dengan penggunaan fitur Menambah Kuantitas Korpus Monolingual dapat meningkatkan nilai akurasi hasil terjemahan

Copyrights © 2019






Journal Info

Abbrev

justin

Publisher

Subject

Computer Science & IT

Description

JUSTIN aims to publish research results and thoughts among academics, researchers, scientists, and practitioners in the field of informatics/computer science so that they are freely available to the public, and support the exchange of knowledge. The scope of JUSTIN is but is not limited to the ...