Luthfia Justisia Loebis
Universitas Tanjungpura

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model Luthfia Justisia Loebis; Arif Bijaksana Putra Negara; Novi Safriadi
InfoTekJar : Jurnal Nasional Informatika dan Teknologi Jaringan Vol 5, No 1 (2020): InfoTekJar September
Publisher : Universitas Islam Sumatera Utara

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30743/infotekjar.v5i1.1986

Abstract

TTS merupakan teknologi yang kerap dimanfaatkan untuk melestarikan eksistensi sebuah bahasa. Salah satu indikator terpenting untuk menghasilkan ucapan TTS yang baik adalah durasi fonem yang tepat. Durasi fonem dapat diprediksi menggunakan HMM. Prediksi dilakukan berdasarkan suku kata untuk memperkecil korpus yang digunakan. Dalam melakukan prediksi durasi fonem berdasarkan suku kata, korpus dikonversi ke dalam bentuk kode suku kata. Selain itu dilakukan reduksi variasi fonem ke dalam pengelompokkan 3 dan 5 state, agar HMM dapat bekerja dengan baik. Korpus bahasa Melayu Pontianak yang digunakan berisi 500 kalimat. Pengujian yang dilakukan adalah pengujian perbandingan durasi fonem dan kalimat, menggunakan dua model n-gram, bigram dan trigram. Pengujian didahului dengan penentuan nilai baseline, kemudian pengujian dengan k-fold cross validation untuk dua jenis pembagian data korpus, yaitu korpus latih berisi 80% korpus bahasa Melayu Pontianak dan korpus latih berisi 20% korpus bahasa Melayu Pontianak. Nilai baseline pada pengujian perbandingan durasi fonem untuk durasi 3 state dengan kedua model n-gram mendapatkan hasil 48%, sedangkan untuk durasi 5 state mendapatkan hasil 48% dan 69%. Nilai baseline pada pengujian perbandingan durasi kalimat untuk durasi 3 state dengan kedua model n-gram, mendapatkan hasil 21% dan 19%, sedangkan untuk durasi 5 state mendapatkan hasil 32% dan 17%. Dari hasil pengujian dengan k-fold cross validation diketahui bahwa dalam penggunaaan korpus latih 80%, hasil yang didapatkan mendekati nilai baseline, sedangkan hasil pada penggunaan korpus latih 20% menjauhi nilai baseline, namun perbedaan yang terjadi cukup tipis. Dari hasil keseluruhan pengujian dapat disimpulkan berdasarkan model perhitungan yang digunakan, trigram mendapatkan hasil yang lebih baik. Sedangkan berdasarkan state durasi yang digunakan, 3 state mendapatkan hasil lebih baik.