Jurnal Edukasi dan Penelitian Informatika (JEPIN)
Vol 9, No 1 (2023): Volume 9 No 1

Pemilihan Kata Benda Bahasa Indonesia Berdasarkan Cakupan Suku Kata Menggunakan Genetic Algoritma untuk Dataset Audio Visual

Eka Rahayu Setyaningsih (Universitas Negeri Malang)
Anik Nur Handayani (Universitas Negeri Malang)
Wahyu Sakti Gunawan Irianto (Universitas Negeri Malang)
Yosi Kristian (Institut Sains dan Teknologi Terpadu Surabaya)



Article Info

Publish Date
29 Apr 2023

Abstract

Dalam pembentukan model Kecerdasan Buatan yang menggunakan pendekatan Deep Learning, dataset memegang peranan yang sangat penting. Memahami dan memilih kumpulan data yang tepat, sangatlah penting untuk memastikan keberhasilan sebuah model Kecerdasan Buatan. Salah satu topik yang cukup baru adalah mempelajari bagaimana pembentukan suara dari hasil pembacaan gerakan bibir manusia, dengan cakupan variasi bunyi dan bentuk bibir yang diharapkan dapat membantu pembelajaran sistem. Mayoritas dataset audio visual, yang biasa digunakan untuk pembangunan model pembentukan suara ataupun pembacaan gerakan bibir tidak memperhatikan keluasan cakupan variasi bunyi yang ada. AVID, salah satu dari dataset audio visual berbahasa Indonesia, mengadopsi susunan kata dalam dataset GRID, yang mengubah setiap kata penyusunnya dari Bahasa Inggris ke bahasa Indonesia. Sedangkan pada Bahasa Indonesia sendiri terdapat banyak ragam bunyi yang dibentuk dari satu atau sederet rangkaian fonem. Penelitian yang dilakukan penulis dengan memanfaatkan Genetic Algorithm untuk mendapatkan susunan kombinasi kata benda guna memperoleh nilai cakupan yang optimal. Dengan cakupan kombinasi suku kata yang lebih baik, maka dapat dihasilkan dataset untuk Deep Learning yang lebih baik lagi. Dalam penelitian ini, kata benda yang diproses, diperoleh dari KBBI edisi 2008, baru kemudian difilter untuk mendapatkan kata benda yang tepat mengandung 3 suku kata, yang bukan nama kota, tokoh maupun lokasi. Dari 39.070 kata benda yang ada, diperoleh 2936 kata benda yang akan digunakan. Ujicoba yang telah dilakukan pada 10.000 hingga 200.000 epoch, diperoleh rata-rata cakupan suku kata 72%-75% dengan batasan 26 variasi kata benda penyusunnya.

Copyrights © 2023






Journal Info

Abbrev

jepin

Publisher

Subject

Computer Science & IT Education

Description

Jurnal Edukasi dan Penelitian Informatika (JEPIN) merupakan peer reviewed journal di bidang informatika. Jurnal ini diterbitkan 3 bulan dalam setahun (April, Agustus, dan Desember) oleh Program Studi Informatika, Fakultas Teknik, Universitas Tanjungpura, ...