ILKOMNIKA: Journal of Computer Science and Applied Informatics
Vol 4 No 2 (2022): Volume 4, Nomor 2, Agustus 2022

Pengukuran Kemiripan berbasis Leksikal dan Semantik untuk Perangkingan Dokumen Berbahasa Arab

Syadza Anggraini (Institut Teknologi Sepuluh Nopember)
Diana Purwitasari (Institut Teknologi Sepuluh Nopember)
Agus Zainal Arifin (Institut Teknologi Sepuluh Nopember)



Article Info

Publish Date
15 Aug 2022

Abstract

Hasil pencarian relevan pada sistem temu kembali informasi tergantung pengukuran kemiripan antara query dan dokumen berdasarkan bobot kata query terhadap dokumen yang akan dirangking. Namun, perhitungan kemiripan menggunakan bobot kata dimungkinkan adanya lafal kata yang berbeda tetapi memiliki makna sama. Hasil dokumen pencarian teks berbahasa Arab akan dipengaruhi kemampuan pengguna yang beragam dalam memahami bahasa tersebut. Oleh karena itu diusulkan pengukuran kemiripan secara leksikal untuk mengatasi lafal kata yang beda serta juga menggunakan kemiripan secara semantik untuk mengenali kata dengan makna sama. Penggabungan perhitungan kemiripan leksikal dan semantik dilakukan berdasarkan bobot kata (secara leksikal) yang digabungkan dengan word embedding (secara semantik). Hasil dari uji coba dilakukan pada 2900 kitab berbahasa Arab Maktabah Syamilah menunjukkan keunggulan dengan rata-rata f-measure tertinggi dibandingkan metode lainnya yaitu 66.7% pada keseluruhan query, serta 65.2% dan 69% pada short query dan long query. Short query adalah frekuensi jumlah kata di dalam query yang berjumlah 1-2 kata sedangkan long query adalah frekuensi jumlah kata di dalam query yang berjumlah lebih dari 2 kata. Short query dan long query berpeluang me-retrieve dokumen yang tidak relevan. Hasil retrieve dokumen yang tidak relevan disebabkan karena rendahnya kemiripan antar kata di dalam suatu query akibat pemilihan kata yang kurang tepat. Pemilihan kata-kata query membutuhkan penguasaan pengguna yang tidak hanya mampu mengolah query dalam bahasa Arab, tetapi juga dapat memahami konteks dokumen yang akan dicari.

Copyrights © 2022






Journal Info

Abbrev

ilkomnika

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management

Description

ILKOMNIKA: Journal of Computer and Applied Informatics is is a peer reviewed open-access journal. The journal invites scientists and engineers throughout the world to exchange and disseminate theoretical and practice-oriented topics of computer science and applied informatics which covers five (5) ...