cover
Contact Name
-
Contact Email
-
Phone
-
Journal Mail Official
-
Editorial Address
-
Location
Unknown,
Unknown
INDONESIA
Jurnal Linguistik Komputasional
ISSN : -     EISSN : 26219336     DOI : -
Core Subject : Science,
Jurnal Linguistik Komputasional (JLK) menerbitkan makalah orisinil di bidang lingustik komputasional yang mencakup, namun tidak terbatas pada : Phonology, Morphology, Chunking/Shallow Parsing, Parsing/Grammatical Formalisms, Semantic Processing, Lexical Semantics, Ontology, Linguistic Resources, Statistical and Knowledge based methods, POS tagging, Discourse, Paraphrasing/Entailment/Generation, Machine Translation, Information Retrieval, Text Mining, Information Extraction, Summarization, Question Answering, Dialog Systems, Spoken Language Processing, Speech Recognition and Synthesis.
Arjuna Subject : -
Articles 56 Documents
Pencarian Kesamaan Redaksional pada Terjemahan Al-Quran Bahasa Indonesia Menggunakan Metode Rule-based Chunking Alfredo Primadita; Moch Arif Bijaksana; Eko Darwiyanto
Jurnal Linguistik Komputasional Vol 3 No 1 (2020): Vol. 3, No. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1344.604 KB) | DOI: 10.26418/jlk.v3i1.32

Abstract

Al-Quran merupakan kitab suci yang menjadi panutan dan rujukan seluruh umat Muslim di dunia. AlQuran terdiri dari 114 surat, 6236 ayat, dan 77845 kata. Dikarenakan Al-Quran memiliki banyak informasi di dalamnya, salah satu upaya untuk mempermudah pembaca dalam mempelajari dan menyaring informasi dari Al-Quran adalah dengan membuat parafrasa yang singkat dengan mempergunakan sistem Rule-based Chunking. Rule-based Chunking dapat mempersingkat suatu kalimat dengan mengelompokan kata-kata yang dianggap penting berdasarkan aturan tata bahasa. Sistem memiliki input berupa ayat-ayat Al-Quran terjemahan bahasa Indonesia yang sudah dicari Longest Common Substring dan Longest Common Subsequence dengan output berupa himpunan parafrasa. Dari 2341 teks berulang yang didapatkan pada penelitian sebelumnya, telah diperoleh 1261 chunk. Setelah melakukan evaluasi pada sistem, akurasi yang didapatkan adalah 91%, dengan precision 63,5% dan recall 74,4%.
Pengurai Kalimat Bahasa Banjar Dengan Menggunakan Parser PC-PATR Ali Muhammad; Kamariah Kamariah
Jurnal Linguistik Komputasional Vol 3 No 1 (2020): Vol. 3, No. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (374.401 KB) | DOI: 10.26418/jlk.v3i1.30

Abstract

Pengurai (Parse) bahasa Banjar merupakan pohon pola yang merepresentasikan struktur sintaksis kalimat berdasarkan kaidah tata bahasa (grammar) bahasa Banjar. Tujuan dari penelitian ini adalah menghasilkan aplikasi pengurai (parsing) kalimat untuk proses sintaksis kalimat pada dokumen berbahasa Banjar. Tulisan ini menjelaskan langkah-langkah dalam menghasilkan pengurai bahasa Banjar menggunakan parser PC-PATR beserta analisisnya. Permasa-lahan terbesar dari penelitian ini adalah belum adanya korpus kalimat bahasa banjar, korpus file leksikon, treebank, dan file grammar untuk bahasa banjar. File leksikon dan file grammar bahasa banjar digunakan sebagai masukan parser PC-PATR dalam mengahasilkan pohon pola sesuai aturan bahasa Banjar yang berlaku. Hasil penelitian menunjukkan bahwa persentase kealamian kalimat uji paling rendah sebesar 38% dan persentase kesesuaian pohon pengurai sebesar rata-rata sebesar 100%. Hal ini menunjukkan bahwa pengurai kalimat dapat diterima walaupun kalimat uji tidak 100% alami.
Representasi Kata Padat pada Pengurai Dependensi Bahasa Indonesia Arief Rahman; Ayu Purwarianti
Jurnal Linguistik Komputasional Vol 3 No 1 (2020): Vol. 3, No. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (593.788 KB) | DOI: 10.26418/jlk.v3i1.33

Abstract

Available Indonesian dependency parsers can be considered worse than other languages’ parsers that have been researched thoroughly. Currently, Indonesia dependency parsers can’t reliably parse sentences with gerund(s) and/or ellipsis correctly. This is because of the sparse feature representation that causes difficulty in parsing these types of sentences. In this research, dense representation is proposed for Indonesian dependency parser. The use of dense word representation may allow better generalization and gives more information regarding the words to be parsed, which allows a more accurate parsing. The scope of the dependency parsing in this research is limited to well-formed Indonesian sentences, using the local transition-based parsing. Based on our experiments, we found that using word embedding instead of sparse word representation increases parsing accuracy significantly.
Sistem Tanya Jawab Menggunakan Kata Tanya Non-Factoid pada Terjemah Bahasa Indonesia Surat Al Baqarah Dewi Setiarini; Ria Hari Gusmita; Fenty Agustin
Jurnal Linguistik Komputasional Vol 3 No 1 (2020): Vol. 3, No. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (651.404 KB) | DOI: 10.26418/jlk.v3i1.31

Abstract

Sistem tanya jawab memiliki tiga komponen utama yaitu penganalisis pertanyaan, pengambilan dokumen relevan, dan ekstraksi jawaban. penelitian terkait dengan menggunakan kata tanya tipe non-factoid (apa, mengapa, bagaimana). Bagian penting dari sistem tanya jawab non-factoid adalah pola kalimat. Pada penelitian sistem tanya jawab non-factoid yang telah dilakukan yaitu pada dokumen bahasa Indonesia murni, sedangkan terjemahan Al Quran bahasa Indonesia adalah dokumen terjemahan. Hal tersebut memungkinkan karakteristik teks bahasa Indonesia murni dengan teks bahasa Indonesia berbeda, sehingga pada penelitian ini melakukan analisis dokumen terjemahan Al Quran bahasa Indonesia untuk menentukan pola kalimat.Sistem tanya jawab dengan menggunakan pola kalimat dari hasil analisis dokumen terjemahan bahasa Indonesia surat Al Baqarah masih belum mampu menjawab semua pertanyaan dengan benar di mana hanya 73,33% jawaban benar yang dikembalikan. Namun, kinerja sistem lebih baik dari pada sistem tanya jawab yang hanya menggunakan pola kalimat yang telah digunakan pada penelitian sebelumnya yaitu 51,11% jawaban benar yang dikembalikan.
Visualisasi Tematik Al-Qur’an Berbasis Knowledge Graph Lukman Nul Hakim; Winda Monika; Salhazan Nasution; Arbi Haza Nasution
Jurnal Linguistik Komputasional Vol 3 No 1 (2020): Vol. 3, No. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (528.053 KB) | DOI: 10.26418/jlk.v3i1.28

Abstract

Al-Qur`an merupakan firman Allah SWT yang diturunkan kepada nabiyullah baginda Nabi Muhammad SAW yang mana Al-Qur’an terdiri dari berbagai tema yang memiliki kaitan antar satu dengan yang lainnya. Penelitian ini menyajikan desain model manajemen publikasi tematik untuk mengintegrasikan metadata ilmiah berdasarkan knowledge graph. Berdasarkan model ini, platform media visualisasi tematik direalisasikan untuk pengambilan sumber daya ilmiah dan analisis, yang tujuannya adalah untuk meningkatkan efisiensi pencarian ilmiah dan mengurangi kesulitan dalam mempelajari tematik dalam Al-Qu’ran. Pada penelitian ini, hubungan ayat-ayat Al-Qur’an dan tematiknya dirumuskan dalam bentuk knowledge graph dengan menggunakan basis data grafik Neo4j. Data tematik Al-Quran diambil dari Al-Qur’an Amazing (Cordoba) dan data Al-Qur’an diambil dari qurandatabase.org. Aplikasi web visualisasi hubungan ayat-ayat Al-Qur’an dengan tematiknya yang ditampilkan dalam bentuk grafik telah dibangun dengan nilai rata-rata precision 1 dan F-score 0.56 untuk pencarian berdasarkan surat dan ayat dan nilai rata-rata precision 1 dan F-score 1 untuk pencarian berdasarkan tema.
Anotasi Semantik Untuk Pembangunan Korpus Sistem Tanya Jawab Non-Factoid Dyah Anjani Ayuningtyias; Fenty Agustin; Ria Hari Gusmita; Purwatiningtyas Purwatiningtyas
Jurnal Linguistik Komputasional Vol 4 No 1 (2021): Vol. 4, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v4i1.44

Abstract

Pembangunan korpus untuk sistem tanya jawab dengan memberi informasi linguistik memiliki hasil yang lebih baik dari sistem tanya jawab yang tidak diberi informasi linguistik. Informasi linguistik yang digunakan adalah dengan metode anotasi semnatik. Anotasi merupakan metodelogi untuk menambahkan informasi ke dokumen pada tingkat tertentu sedangkan semantik anotasi adalah proses melampirkan tag metadata atau kelas ontologi ke segmen teks, sebagai alat untuk mengambil suatu pengetahuan. Dokumen yang diambil untuk membangun korpus adalah surah terjemahan Al baqarah yang memiliki 286 ayat, dan yang mendukung hanya 14 ayat karena ada beberapa ayat yang tidak mengandung pola yang sesuai sehingga tidak dapat digunakan. Korpus dipecah menjadi 286 file dalam bentuk .txt. Uji coba sistem dilakukan menggunakan bahasa perl dengan membuat sistem tanya jawab sederhana. Sistem tanya jawab merupakan sistem penelusuran informasi yang mengizinkan para user untuk memasukkan pertanyaan dalam bahasa alami
Ringkasan Jumlah Aspek Ulasan Hotel untuk Pembentukan Dataset Sentimen Analisis Berbasis Aspek Maulana - Maulana
Jurnal Linguistik Komputasional Vol 3 No 2 (2020): Vol. 3, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v3i2.26

Abstract

Mempelajari dan memahami opini orang lain menjadi topik yang cukup banyak dibahas dalam bidang Natural Languge Processing (NLP). Tools yang digunakan dalam memahami opini ini adalah Sentimen Analisis, dalam perkembangan untuk memahami opini lebih jauh mengenai apa yang dibahas dalam suatu teks atau kalimat dan serta melihat sentimen nya apakah menyukai atau tidak terhadap apa yang sedang disampaikan, sentiment analisis berbasis aspek menjadi salah satu pengembangan yang cukup baru untuk saat ini. Dari hasil evaluasi dengan cross validation, dataset tersebut memiliki akurasi masing-masing nya untuk setiap aspek adalah sebagai berikut, untuk aspek kamar memiliki akurasi 79,39%, untuk aspek fasilitas memiliki akurasi 60,14%, untuk aspek lokasi memiliki akurasi 89,53% serta untuk aspek Pelayanan/Umum memiliki akurasi sebesar 78,38%. Dari hasil pengujian yang diperoleh nilai akurasi nya normal, tetapi hanya aspek fasilitas yang memiliki akurasi yang paling rendah yaitu 60,14%. Nilai akurasi ini masih belum maksimal dikarenakan adanya perbedaan jumlah data pada data training dari setiap label pada masing-masing aspek nya, sehingga menurunkan kualitas akurasinya.
Ujaran Kebencian Terhadap Jokowi pada Masa Pandemi Covid-19: Studi Kasus Twitter Wahyu Maulana; Mulyadi Mulyadi
Jurnal Linguistik Komputasional Vol 4 No 1 (2021): Vol. 4, NO. 1
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v4i1.42

Abstract

The purpose of this study is to analyze what form of hate speech is aimed at Jokowi during Covid-19 pandemic in Indonesia by using speech act theory. The researcher uses Twitter developer account and Python for collecting data in this study. Through the analyzed data, it’s shown that 5% of the tweets containing “jokowi” is hate speech. The analysis is aimed to get what form of hate speech in the tweets such as: insult, defamation , blasphemy, unpleasant acts, provocation, and hoax. At the end of the study, the researcher finds that the most hate speech aimed at Jokowi is unpleasant acts.
Deep Reinforced Model dan Rules-Based untuk Peringkasan Kalimat Bahasa Indonesia Yuniarti Musa'adah; Yudi Wibisono; Yaya Wihardi
Jurnal Linguistik Komputasional Vol 3 No 2 (2020): Vol. 3, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v3i2.34

Abstract

The development of technology has an impact on increasing the amount of information released the difficulty of getting information efficiently. This was strengthened by the online media Kapanlagi who claimed to make about 500 news articles per day. Therefore, this study is expected to be able to produce more and provide information in a shorter form so that it requires less time to understand information contained. This study is focused on sentences compression using Deep Reinfoced Model and Rules-Based. Deep Reinforced Model implements the Encoder Decoder algorithm and Long Short Term Memory while Rules-Based is a method for solving problems with rules that are based on knowledge. The data used in this study amounted to 1200 sentences with 3300 tokens. The results obtained from this study are sentence compression using Rules-Based method is produce a better summary seen from the value of Rouge, Rouge-1 of 49.71, Rouge-2 of 33.27, and Rouge-L of 54.33 than the summary produced by Deep Reinfoced Model with a value of Rouge-1 of 14.44, Rouge-2 of 2.82, and Rouge-L of 18.23. In addition, this study also produced a sentences compression dataset that can be used for further study.
Pemanfaatan Epistemic Network Analysis sebagai Pendukung Analisis Sentimen dalam Collaborative Learning Roy Parsaoran; Jonathan Bernad; Tifani Astadini; Hapnes Toba; Maresha Caroline Wijanto; Mewati Ayub
Jurnal Linguistik Komputasional Vol 3 No 2 (2020): Vol. 3, No. 2
Publisher : Indonesia Association of Computational Linguistics (INACL)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jlk.v3i2.36

Abstract

A lot of blended learning methods have been applied to modern learning system. One of the most used learning methods is collaborative learning which combines and extends group discussion. The recorded data during a collaborative learning session could be useful to enhanced the interaction among the class members, including the lecturer. Using sentiment analysis, the discussion can be categorized whether the discussion goes well or not, it can also be seen which group members are most active and have a positive impact on the work assigned to the group. In this preliminary research, sentiment analysis approach will be combined with Epistemic Network Analysis (ENA) so that it can see a graphical depiction of each member's contribution in a group discussion. Our experimental results show that ENA displays better insights of the students activities than only using the sentiment analysis.