Garuda - Garba Rujukan Digital

Jurnal Ilmiah Teknologi dan Komputer (JITTER)

Vol 3 No 2 (2022): Jurnal Jitter Vol. 3, No. 2, August 2022

Sheila Shevira (Udayana University)
I Made Agus Dwi Suarjaya (Unknown)
Putu Wira Buana (Unknown)

Publish Date
12 Jul 2022

Twitter merupakan jaringan microblog online yang dijadikan gaya hidup baru di kalangan masyarakat sebagai wadah pengganti untuk mencari dan menyebarkan informasi, sebagai tempat mencurahkan perasaan, ataupun menjalankan bisnis, dengan cara menuliskan tweet. Permasalahannya adalah tweet yang dituliskan mayoritas oleh remaja berumur 18-24 tahun, sehingga kata-kata yang dituliskan masih banyak mengandung karakter pengganggu, ejaan, kata gaul, atau kata yang bersifat non-baku. Data yang tidak bersih dan akurat akan berdampak buruk bagi hasil analisis. Pre-processing data dalam hal ini berperan penting untuk memperbaiki data agar menjadi lebih bersih dan akurat sebelum diproses. Penelitian ini fokus membahas mengenai beberapa skenario kombinasi pre-processing, serta dengan mengubah urutan proses cleaning, normalisasi, stemming, dan stop-word, untuk mendapatkan akurasi paling baik dan meningkatkan performa dalam klasifikasi. Hasil testing pada tweet menunjukkan akurasi tertinggi ada pada data yang melewati tahapan penuh pre-processing data dengan urutan kombinasi pre-processing adalah menaruh proses normalisasi sebelum melakukan proses stemming, yaitu sebesar 89.2%.

Citation Download

EndNote, Reference Manager, ProCite

Latex, Jabref

183.616 KB

Check in Google Scholar

Journal Info

Jurnal Ilmiah Teknologi dan Komputer (JITTER)

Website

Abbrev

jitter

Publisher

Universitas Udayana

Subject

Computer Science & IT

Description

The journal publishes work from all disciplinary, theoretical and methodological perspectives. It is designed to be read by researchers, scholars, teachers and advanced students in the fields of Information Systems and Information Science, as well as IT developers, consultants, software vendors, and ...

Article Info

Abstract

Pengaruh Kombinasi dan Urutan Pre-Processing pada Tweets Bahasa Indonesia

Article Info

Abstract