Jurnal Teknologi Informasi dan Komputer
Vol 8, No 4 (2022): Jurnal Teknologi Informasi dan Komputer

ANALISIS PERBANDINGAN METODE VECTOR SPACE MODEL DAN LEVENSHTEIN DISTANCE DALAM SISTEM TEMU KEMBALI INFORMASI PADA PERPUSTAKAAN DIGITAL STMIK PRIMAKARA (PRIMAKARA LIBRARY)

I Nyoman Wiyana (Unknown)
I Nyoman Purnama (Unknown)
Ida Bagus Kresna Sudiatmika (Unknown)



Article Info

Publish Date
10 Oct 2022

Abstract

ABSTRACTDigital Library is an application of Information technology that is used for storage, retrieving, and distributing information of all kinds of knowledge in digital form. STMIK Primakara currently has a Digital Library under the name PRILI (Primakara Library). The number of books in PRILI is still relatively small, but as time goes by, it will definitely continue to grow. The more books there are, search engines will definitely need to make it easier to find the desired book, but the search engine is only able to find the title. To be able to do a search according to user needs, the author will analyze the search engine using the Information Retrieval System. In the Information Retrieval System, a specific method is needed to be applied to the system. The author will analyze two methods, namely the Vector Space Model (VSM) and Levenshtein Distance. The two methods will compare the search results, in the form of relevance values. This value will determine which method the results are most in accordance with the wishes of the user. The test uses data of 298 book titles. The data will then be tested using 10 keywords, where each keyword uses 1-4 terms which are totaled into 40 keywords. In the values of Precision, Recall, accuracy, and F-measure in each term test in the Vector Space Model method, where the fewer terms used, the greater the relevance value, while the time required is faster, while in the Levenshtein Distance method where The more terms used, the greater the relevance value, while for the longer time it takes. The average obtained if all terms are calculated, in the Vector Space Model method with an average relevance of Precision 58.1%, Recall 91.1%, accuracy 94.5%, F-measure 63% and processing time needed 1.43 seconds; while the Levenshtein Distance method has an average relevance of 9.6% Precision, 24.4% Recall, 75.4% accuracy, F-measure 11.1% and the required processing time is 0.87 seconds. The relevance of the Vector Space Model method is superior to the Levenshtein Distance method, but the average time required for the Vector Space Model method is longer than the Levenshtein Distance method.Keywords: Information Retrieval, Vector Space Model, Levenshtein Distance, Library.ABSTRAKPerpustakaan Digital adalah suatu penerapan teknologi Informasi yang digunakan untuk sarana penyimpanan, mengambil, dan mendistribusikan informasi segala jenis ilmu pengetahuan dalam bentuk digital. STMIK Primakara saat ini sudah memiliki Perpustakaan Digital dengan nama PRILI (Primakara Library). Buku yang ada pada PRILI masih terbilang sedikit namun seiring berjalannya waktu pasti akan terus bertambah. Semakin banyaknya buku pasti dibutuhakan mesin pencari untuk mempermudah dalam pencarian buku yang diinginkan namun mesin pencari hanya mampu mencari judulnya saja. Untuk dapat melakukan pencarian sesuai kebutuhan user, penulis akan menganalisis mesin pencari menggunakan Sistem Temu Kembali Informasi (Information Retrieval). Dalam Sistem Temu Kembali Informasi diperlukan sebuah metode untuk diterapkan pada sistem, Penulis akan melakukan analisis pada dua metode yaitu Vektor Space Model (VSM) dan Levenshtein Distance. Dua metode tersebut akan dibandingkan hasil pencariannya, berupa nilai relevansinya. Nilai tersebut akan menentukan metode mana yang hasilnya paling sesuai dengan keinginan user. Pengujian menggunakan data sejumlah 298 judul buku. Data tersebut selanjutnya akan dilakukan pengujian dengan menggunakan 10 kata kunci, diamana tiap kata kuncinya menggunakan 1 – 4 term yang ditotalkan menjadi 40 kata kunci. Pada nilai dari Precision, Recall, accuracy, dan F-measure pada tiap pengujian term-nya dalam metode Vector Space Model, dimana makin sedikit term yang digunakan maka nilai relevansinya makin besar, sementara waktu yang dibutuhkan lebih cepat,sedangkan pada Metode Levenshtein Distance dimana makin banyak term yang digunakan makanilai relevansinya makin besar, sementara untuk waktu yang dibutuhkan lebih lama. Rata-rata yangdidapat jika semua term dihitung, pada metode Vector Space Model dengan relevansi rata-rata padaPrecision 58.1%, Recall 91.1%, accuracy 94.5%, F-measure 63% dan waktu proses yang dibutuhkan1,43 detik; sedangkan metode Levenshtein Distance relevansi rata-rata pada Precision 9.6%, Recall24.4%, accuracy 75.4%, F-measure 11.1% dan waktu proses yang dibutuhkan 0,87 detik. Relevansimetode Vector Space Model lebih unggul dibandingkan dengan metode Levenshtein Distance,namun rata-rata waktu yang dibutuhkan pada metode Vector Space Model lebih lama dari padaLevenshtein Distance.Kata Kunci: Sistem Temu Kembali Informasi, Vektor Space Model, Levenshtein Distance,Perpustakaan.

Copyrights © 2022






Journal Info

Abbrev

jutik

Publisher

Subject

Computer Science & IT Control & Systems Engineering Economics, Econometrics & Finance Education Engineering Social Sciences

Description

Jurnal Teknologi Informasi dan Komputer berisi tulisan yang diangkat dari hasil penelitian di bidang teknologi informasi dan komputer. Jurnal ini merupakan sarana bagi peneliti di bidang ilmu teknologi informasi dan komputer untuk mempublikasikan karya-karya penelitiannya. Redaksi penyunting jurnal ...