Claim Missing Document
Check
Articles

Found 2 Documents
Search
Journal : Seminar Nasional Teknologi Informasi Komunikasi dan Industri

Klasifikasi Kepribadian Big Five Pengguna Twitter dengan Metode Naïve Bayes Yusra Yusra; Muhammad Fikry; Rinaldi Syarfianto; Reski Mai Candra; Elvia Budianita
Seminar Nasional Teknologi Informasi Komunikasi dan Industri 2018: SNTIKI 10
Publisher : UIN Sultan Syarif Kasim Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (258.681 KB)

Abstract

Untuk dapat memahami kepribadian seseorang, postingannya di media sosial dapat digunakan sebagai sumber informasi. Pada penelitian ini, metode Naïve Bayes digunakan untuk mengklasifikasikan kepribadian pengguna Twitter ke dalam salah satu dari lima kelas, yaitu Openness, Conscientiousness, Extraversion, Agreeableness, dan Neuroticism. Tweet diunduh dari 15 akun Twitter dengan menggunakan Twitter API, dengan total keseluruhan sebanyak 1.500 tweet. Setiap akun ditetapkan sifat kepribadian dominannya berdasarkan hasil kuesioner kepribadian yang diinterpretasikan oleh seorang pakar psikologi. Setiap tweet dipraproses menjadi huruf kecil, dibersihkan, ditokenisasi menjadi kata, ditemukan kata dasarnya, kemudian dihilangkan kata-kata yang tidak penting. Setiap kata dibobot berdasarkan frekuensinya. Dataset dibagi menjadi data latih dan uji dengan perbandingan 60:40, 70:30, 80:20 dan 90:10. Setelah dilakukan pengujian, diperoleh akurasi tertinggi pada perbandingan data latih dan uji 70:30 sebesar 86,66%
Stemmer Bahasa Melayu Riau Berdasarkan Aturan Morfologi Muhammad Fikry; Yusra Yusra
Seminar Nasional Teknologi Informasi Komunikasi dan Industri 2021: SNTIKI 13
Publisher : UIN Sultan Syarif Kasim Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Penggunaan Bahasa Melayu Riau semakin terpinggirkan. Hal ini mendorong pemerintah daerah melakukan upaya pelestarian kebudayaan Melayu Riau, termasuk penggunaan bahasa dan huruf Melayu di lingkungan pendidikan, media massa, pasar, dan perkantoran. Namun demikian, belum tersedia sumber daya bahasa Melayu Riau dalam bentuk digital yang dapat digunakan oleh peneliti dan pengembang perangkat lunak di bidang pemrosesan bahasa alami. Sumber daya bahasa yang dimaksud meliputi kumpulan data dan berbagai alat (tool) untuk mengelola dan memproses informasi apa pun yang mendokumentasikan atau menjelaskan bahasa Melayu Riau. Oleh karena itu, penelitian ini berfokus pada tahapan analisis pertama dalam pemrosesan teks, yaitu analisis leksikal. Salah satu tugas pemrosesan bahasa alami (NLP task) pada tahapan tersebut adalah stemming yang mereduksi suatu kata berimbuhan menjadi kata dasarnya. Hasil stemming dapat dimanfaatkan oleh tugas-tugas lain dalam pemrosesan teks. Dalam penelitian ini, telah dilakukan analisa dan perancangan algoritma stemming untuk teks berbahasa Melayu Riau berdasarkan aturan morfologi. Hasil implementasi sumber daya bahasa berupa stemmer bahasa Melayu Riau dalam bentuk PHP Extension. Berdasarkan pengujian, diperoleh tingkat akurasi 100% yang memperlihatkan bahwa stemmer ini dapat digunakan untuk pemrosesan teks berbahasa Melayu Riau.