Moch Arif Bijaksana
Telkom University

Published : 4 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 4 Documents
Search

Named Entity Recognition for an Indonesian Based Language Tweet using Multinomial Naive Bayes Classifier Ramadhyni Rifani; Moch Arif Bijaksana; Ibnu Asror
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.330

Abstract

In Natural Languange Processing (NLP), Named Entity Recognition (NER) is a sub discussion that is widely used for research. the main task of Named Entity Recognition (NER) is to help identify and detect the entity names from a word in a sentence. The data sources we use are a real time Indonesian language tweets that often occur, which the number of letter each tweet is limited to 280 characters. The words contained in that Indonesian language tweets can refer to the name of the entity, location, or organization, so to determine the name of that entity, it must be considered first by looking at the word patterns around it. In Indonesia, an average tweet posted from an account at least is 1-3 tweets per day which contain a formal and non-formal contents that made this a difficult challenge to provide the right entity naming. In this research, we are naming the entities from the Indonesian language tweets by using the Multinomial Naive Bayes Classifier algorithm. The system uses precision, recall,and f-measure as evaluation metrics. Naming this entity is able to classify with a value of f-1 reaching 80%.
Pembangunan Pensejajaran Kata Monolingual (Monolingual Word Alignment) pada Terjemahan Al-Quran Bahasa Indonesia kurnia sari lingga; Moch Arif Bijaksana; Arie Ardiyanti
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.331

Abstract

Paper ini membahas tentang pembangunan pensejajaran kata monolingual pada terjemahan Al-Quran Bahasa Indonesia. Topik ini diambil karena alignment merupakan komponen utama dari beberapa pemrosesan bahasa alami yaitu textual entailment recognition, textual similarity identification, paraphrase detection, question answering dan text summarization. Selain itu terjemahan Al-Quran ini sangat banyak versinya sehingga membutuhkan penafsiran untuk mengartikan terjemahan yang berbeda namun memiliki makna yang sama. Dengan adanya teknik ini beberapa kata terjemahan Al-Quran yang berbeda dapat disejajarkan, sehingga kata-kata tersebut akan terkelompokkan berdasarkan kemiripan semantiknya. Teknik ini juga dapat digunakan lebih lanjut untuk pembangunan synonim set dan WordNet. Inputan dari sistem berupa pasangan terjemahan untuk sebuah ayat yang sama. Evaluasi pada penelitian ini menghasilkan skor korelasi 0.82 dengan nilai toleransi kesalahan pada sistem sebesar 0.18. Korelasi antar ayat yang memiliki kemiripan semantik sejauh penelitian ini sudah dapat dikatakan memadai namun jika ingin ditingkatkan kembali maka diperlukannya fitur dan basis pengetahuan yang lebih lengkap lagi.
Sistem Pencarian Lintas Ayat Al-Qur'an Berdasarkan Kesamaan Fonetis Eki Rifaldi; Moch Arif Bijaksana; Kemas Muslim Lhaksamana
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.342

Abstract

Mencari teks Arab dalam Al-Qur'an tidak mudah bagi pengguna yang tidak memiliki cukup pengetahuan tentang bahasa dan tulisan Arab. Banyaknya ayat dan perbedaan bahasa dalam Al-Qur'an menimbulkan kesulitan tersendiri untuk pencarian ayat oleh masyarakat muslim Indonesia. Dibutuhkan sistem pencarian ayat Al-Qur'an berbasis fonetis yang dapat memudahkan pengguna dalam mencari ayat menggunakan tulisan latin berhuruf alfabet yang merepresentasikan bunyi pengucapan pengguna. Sebagai contoh, jika dilakukan pencarian kata الْحَمْدُ لِلَّـهِ maka sistem akan menampilkan seluruh ayat yang memiliki kemiripan bunyi dengan kata kunci. Untuk saat ini, sudah ada sistem pencarian ayat Al-Qur'an dengan menggunakan phonetic string matching, namun terbatas hanya dapat menemukan ayat berdasarkan query yang tidak lintas ayat. Kemudian jika dilakukan pencarian kata lintas ayat يَوْمِ الدِّينِ (4) إِيَّاكَdengan pencocokan string dalam database, maka sistem tidak dapat memberikan hasil pencarian dua ayat sekaligus. Oleh karena itu, dibangun suatu sistem pencarian ayat Al-Qur'an berdasarkan kemiripan bunyi (fonetis) yang dapat melintasi ayat. Algoritma N-gram berupa trigram digunakan untuk menemukan ayat-ayat yang memiliki kemiripan bunyi (fonetis) karena memiliki MAP yang tinggi untuk kata kunci panjang. Untuk mencari lintas ayat, lima buah trigram ayat selanjutnya ditambahkan ke ujung trigram ayat sebelumnya. Kemudian diperoleh nilai MAP 0,9 dan Recall 0,93.
Implementation of Dependency Parser Using Artificial Neural Network Methods Nurul Izzah; Moch Arif Bijaksana; Arief Fatchul Huda
Indonesia Journal on Computing (Indo-JC) Vol. 5 No. 3 (2020): December, 2020
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2020.5.3.504

Abstract

In recent years, parsing has become very popular within the scope of NLP (Natural Language Processing) with the presence of Dependency Parser. However, almost all existing Dependency Parser do classifications based on millions of sparse indicator features. This feature is not only bad in drawing conclusions, but also significantly limits the speed of parsing so that the resulting parsing is not optimal. To overcome these problems, changing the use of sparse features becomes dense features to reduce sparsity between words. The Artificial Neural Network classification method is used to produce fast and concise parsing in the Transition-Based Dependency Parser by using 2 hyperparameters. The dataset used in this study is Arabic, Chinese, English, and Indonesian. Based on the evaluation that has been done, it shows a higher result using the second hyperparameter. In testing with English test data, the accuracy value of LAS (Labeled Attachment Score) is 80.4% and UAS (Unlabelled Attachment Score) is 83%, Then with dev data obtained an accuracy value of LAS 81.1% and UAS 83.7%, and parsing speed of 98 sentences per second (sent/s).Keywords: Parsing, dependency parser, transition-based dependency parsing.