Rudy Dwi Nyoto
Unknown Affiliation

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Corpus Quality Improvement to Improve the Quality of Statistical Translator Machines (Case Study of Indonesian Language to Java Krama) Muhammad Gerdy Asparilla; Herry Sujaini; Rudy Dwi Nyoto
Jurnal Linguistik Komputasional Vol 1 No 2 (2018): Vol. 1, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1019.163 KB) | DOI: 10.26418/jlk.v1i2.12

Abstract

Language is a communication tool that is used as a means to interact with the surrounding community. The ability to master many languages will certainly make it easier to interact with other people from different regions. Therefore, translators are needed to increase knowledge of various languages. Statistical Machine Translation (Statistical Machine Translation) is a machine translation approach with translation results produced on the basis of statistical models whose parameters are taken from the results of parallel corpus analysis. Parallel body is a pair of corpus containing sentences in a language and translation. One feature that is used to improve the quality of translation results is with corpus optimization. The aim to be achieved in this study is to look at the influence of the quality of the corpus by filtering out pairs of sentences with quality translation. The filter used is the minimum value of each sentence that is tested by the Bilingual Evaluation Understudy (BLEU) method. Testing is done by comparing the accuracy of the results of the translation before and after corpus optimization. From the results of the research, the use of corpus optimization can improve the quality of translation for Indonesian translation machines to Javanese manners. This can be seen from the results of testing by adding corpus optimization to 15 test sentences outside the corpus, there is an average increase in BLEU values of 10.53% and by using 100 test sentences derived from corpus optimization there is an average increase in BLEU values of 11.63% in automated testing and 0.03% on testing by linguists. Based on this, the machine translating Indonesian statistics into Javanese language using the corpus optimization feature can increase the accuracy of the translation results
Prediksi Jeda pada Ucapan Kalimat Bahasa Melayu Pontianak Menggunakan Informasi Parafrasa Arif Bijaksana Putra Negara; Rudy Dwi Nyoto; Wega Marda Fitri
InfoTekJar : Jurnal Nasional Informatika dan Teknologi Jaringan Vol 4, No 1 (2019): InfoTekJar September
Publisher : Universitas Islam Sumatera Utara

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (474.725 KB) | DOI: 10.30743/infotekjar.v4i1.1248

Abstract

Jeda dalam kalimat sangat penting karena jeda yang terjadi dapat memperjelas informasi dari makna suatu teks kalimat, maka dari itu penelitian ini akan melakukan prediksi jeda Bahasa Melayu Pontianak menggunakan informasi parafrasa yang  bertujuan utuk menghasilkan prediksi jeda pada Bahasa Melayu Pontianak untuk mendapatkan nilai akurasi yang tepat sehingga dapat digunakan pada sistem TTS. Rumusan masalah pada penelitian ini adalah bagaimana mengambil  informasi parafrasa dalam suatu teks kalimat yang digunakan untuk memprediksi jeda. Parafrasa yaitu ungkapan kembali maksud atau isi tulisan dengan menggunakan kata-kata sendiri. Informasi parafrasa diambil berdasarkan kata kunci dan tipe PoS. Hasil dai penelitian ini adalah kalimat yang telah terpenggal memberntuk frasa ucapan jeda. Pengujian dilakukan dengan menggunakan precision, recall, dan f-measure terhadap 500 kalimat untuk frasa singkat dan frasa panjang. Hasil dari pengujian frasa singkat tanpa PoS diperoleh nilai precision, recall, dan f-measure adalah  0.59, 0.58 dan  0.59 sedangkan frasa singkat menggunakan PoS bernilai 0.59, 0.58 dan 0.59 serta untuk frasa panjang tanpa PoS diperoleh nilai precision 0.86, recall  0.78, dan f-measure  0.82 sedangkan frasa panjang menggunakan PoS bernilai 0.84, 0,77, dan 0.80. Berdasarkan pengujian yang telah dilakukan, didapatkan hasil bahwa frasa panjang lebih tinggi dikarenakan frasa yang menghasilkan indeks jeda panjang menghasilkan jeda pasti pada setiap ucapan dibandingkan frasa singkat karena frasa yang menghasilkan indeks jeda singkat  akan menghasilkan ucapan yang berbeda pada setiap orang karena jeda singkat merupakan jeda tipis atau pendek.