Penggunaan Bahasa Melayu Riau semakin terpinggirkan. Hal ini mendorong pemerintah daerah melakukan upaya pelestarian kebudayaan Melayu Riau, termasuk penggunaan bahasa dan huruf Melayu di lingkungan pendidikan, media massa, pasar, dan perkantoran. Namun demikian, belum tersedia sumber daya bahasa Melayu Riau dalam bentuk digital yang dapat digunakan oleh peneliti dan pengembang perangkat lunak di bidang pemrosesan bahasa alami. Sumber daya bahasa yang dimaksud meliputi kumpulan data dan berbagai alat (tool) untuk mengelola dan memproses informasi apa pun yang mendokumentasikan atau menjelaskan bahasa Melayu Riau. Oleh karena itu, penelitian ini berfokus pada tahapan analisis pertama dalam pemrosesan teks, yaitu analisis leksikal. Salah satu tugas pemrosesan bahasa alami (NLP task) pada tahapan tersebut adalah stemming yang mereduksi suatu kata berimbuhan menjadi kata dasarnya. Hasil stemming dapat dimanfaatkan oleh tugas-tugas lain dalam pemrosesan teks. Dalam penelitian ini, telah dilakukan analisa dan perancangan algoritma stemming untuk teks berbahasa Melayu Riau berdasarkan aturan morfologi. Hasil implementasi sumber daya bahasa berupa stemmer bahasa Melayu Riau dalam bentuk PHP Extension. Berdasarkan pengujian, diperoleh tingkat akurasi 100% yang memperlihatkan bahwa stemmer ini dapat digunakan untuk pemrosesan teks berbahasa Melayu Riau.
Copyrights © 2021