Garuda - Garba Rujukan Digital

MIND (Multimedia Artificial Intelligent Networking Database) Journal

Vol 6, No 2 (2021): MIND Journal

FATAN KASYIDI (Program Studi Teknik Informatika, Universitas Jenderal Achmad Yani)
RIDWAN ILYAS (Program Studi Teknik Informatika, Universitas Jenderal Achmad Yani)
NIDA MUTHI ANNISA (Program Studi Psikologi, Universitas Informatika dan Bisnis Indonesia)

Publish Date
12 Dec 2021

AbstrakInteraksi manusia dengan komputer merupakan fenomena yang terus berkembang diikuti oleh meningkatnya penggunaan komputer yang sering digunakan dalam ranah sosial manusia. Manusia saling berinteraksi dengan melibatkan emosi untuk memahami seseorang. Emosi manusia seringkali terwakili melalui cara berbicara. Penelitian tentang pengenalan emosi melalui suara telah banyak dilakukan, namun terdapat upaya peningkatan pengenalan emosi melalui suara, terutama masalah korpus yang menjadi salah satu faktor yang menjadikan pengenalan emosi ini belum menghasilkan akurasi pengenalan yang optimal, khususnya berkaitan dengan imbalance data. Penelitian ini dilakukan untuk meningkatkan performa pengenalan emosi untuk mengenali lima kelas emosi yaitu senang, marah, sedih dan kepuasan serta netral menggunakan algoritma boosting. Selain itu, digunakan pula metode seperti CNN dan RNN untuk dapat dilakukan perbandingan serta penerapan SMOTE untuk korpusnya. Setelah eksperimen, dapat dihasilkan akurasi pengenalan mencapai 65% untuk akurasi untuk data tes berdasarkan konfigurasi 22050 Hz sebagai sampling rate, MFCCs dan oversampling SMOTE.Kata kunci: Imbalance data, Algoritma Boosting, CNN, RNN, SMOTEAbstractHuman interaction with computers are a growing phenomenon followed by the increasing use of computers which are often utilized in human social activities. Humans interact with one another by involving emotions. Plenty of research on speech emotion recognition has been established. Nevertheless, there are still efforts to enhance speech emotion recognition, especially the corpus problem which is one of the factors that the model does not in an optimal performance, especially about imbalance data. This study was conducted to enhance the performance of emotion recognition to recognize five class emotions: happiness, angry, sadness, contentment, and neutral. Furthermore, we employed CNN, RNN, and Boosting Algorithms. Lastly, we applied SMOTE to the corpus. After the experiment, the accuracy reached 65% with 22050 Hz configuration as rate, MFCCs, and SMOTE oversampling.Keywords: Data Imbalance, Boosting Algorithms, CNN, RNN, SMOTE

Citation Download

EndNote, Reference Manager, ProCite

Latex, Jabref

Check in Google Scholar

Journal Info

MIND (Multimedia Artificial Intelligent Networking Database) Journal

Website

Abbrev

Publisher

Institut Teknologi Nasional Bandung

Subject

Computer Science & IT

Description

...

Peningkatan Kemampuan Pengenalan Emosi Melalui Suara dalam Bahasa Indonesia

Article Info

Abstract