JSR : Jaringan Sistem Informasi Robotik
Vol 6, No 2 (2022): JSR : Jaringan Sistem Informasi Robotik

MEMBANGUN SLANG DICTIONARY UNTUK NORMALISASI TEKS MENGGUNAKAN PRE-TRAINED FASTTEXT MODEL

Junita Amalia (Institut Teknologi Del)



Article Info

Publish Date
30 Sep 2022

Abstract

Kata Slang merupakan kata yang kompleks, sulit dan tidak dapat diabaikan. Slang digunakan oleh kalangan tertentu dan terbatas sehingga tidak semua orang mengetahui maksud dari percakapan yang dilakukan oleh anggota kelompok. Berdasarkan penelitian terdahulu yang telah dilakukan yaitu pembuatan slang menggunakan proses manual yang memerlukan cukup banyak waktu untuk mengumpulkan kata slang, sehingga penelitian yang kami lakukan bertujuan untuk mengumpulkan kata slang dengan menerapkan Deep Learning yaitu Natural Language Processing dengan menggunakan metode word embedding FastText untuk mempercepat proses pengumpulan kata slang. Penulis melakukan implementasi teknik dan algoritma yang telah dirancang pada tahapan sebelumnya. Tahapan ini memastikan bahwa proses yang dilakukan dalam penelitian dapat dilaksanakan sesuai dengan teori-teori yang mendukung penelitian. Dari gabungan data antara kata komentar youtube dan kamus Bahasa Indonesia, didapatkan 421 kata yang merupakan kata slang. Kata slang ini didapatkan dengan cara proses mencari kesamaan kata (similarity word) antara kata komentar youtube dan kamus Bahasa Indonesia. Dalam membangun kamus slang dari dataset komentar youtube dengan pre-trained FastText model dilakukan proses preprocessing. Selanjutnya dilakukan tahap membuat list token dan list comprehension untuk mendapatkan word vector setiap kata komentar youtube. Untuk mendapatkan vektor kata untuk setiap kata komentar youtube dan kamus Bahasa Indonesia diperlukan metode pre-trained FastText model.

Copyrights © 2022






Journal Info

Abbrev

js

Publisher

Subject

Computer Science & IT

Description

Jurnal Sistem Informasi Robotik (JSR) diterbitkan oleh LPPM AMIK Mitra Gama. JSR adalah jurnal open akses dengan pelibatan mitra bestari (peer-reviewed). JSR terbit dua kali dalam setahun, Maret dan September. JSR mempublikasikan naskah asli yang memiliki kontribusi kepada state-of-the-art dan ...