Jurnal Teknologi Terpadu
Vol. 1 No. 2: Desember, 2015

PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA

ahmad rio adriansyah (STT Terpadu Nurul fikri)



Article Info

Publish Date
22 Dec 2015

Abstract

Korpus dalam bahasa Indonesia dibutuhkan untuk menunjang penelitian dalam bahasa atau sistem temu kembali informasi. Sebelumnya, untuk membuat sebuah korpus dibutuhkan waktu yang lama dan biaya yang mahal. Tapi sejak internet mulai populer dan laman web semakin banyak, informasi yang menggunakan bahasa tertentu jadi lebih mudah diakses sehingga penyusunan korpus pun menjadi lebih cepat dan murah. Dalam penelitian pengolahan bahasa alami juga dibutuhkan korpus yang sama untuk membandingkan dua buah metode yang berbeda. Tapi sayangnya korpus berbahasa Indonesia yang terbuka masih minim. Ada yang menyediakan tetapi hanya bisa diakses melalui website tersebut saja. Karena pertimbangan kecepatan jaringan dan kecepatan proses, terkadang dibutuhkan korpus yang bisa diakses lokal. Penelitian ini menyediakan korpus khusus yang diambil dari beberapa laman web berita, metode pengambilan, beserta statistiknya. Korpus yang dihasilkan dari metode ini dapat digunakan secara terbuka oleh peneliti lain untuk diolah secara lokal.

Copyrights © 2015