eProceedings of Engineering
Vol 6, No 2 (2019): Agustus 2019

Analisis Model Word2vec Dalam Penyelesaian Soal Analogipada Bahasa Indonesia

Abdul Raffi Malikul Mulki (Telkom University)
Moch. Arif Bijaksana (Telkom University)
Arie Ardiayanti Suryani (Telkom University)



Article Info

Publish Date
01 Aug 2019

Abstract

AbstrakSemantik adalah cabang ilmu lingustik dan salah satu komponen dalam suatu bahasa yang mempelajariarti atau makna suatu kata. Semantik kurang diperhatikan orang karena objek kajiannya berupa mak- nayang dianggap sangat sulit ditelusuri dan dianalisis strukturnya terutama untuk analogi suatu kata.Analogi kata merupakan cara untuk menunjukkan dua situasi yang didalamnya terdapat struktur rela-sional. Selain itu analogi kata memerlukan kemampuan kognitif yang lebih sedikit dan dapat digunakandiberbagai bidang. Maka dari itu Word2vec adalah solusi berupa model untuk merepresentasikan suatukata menjadi vektor dengan besar dimensi yang ditentukan, sehingga dengan representasi word2vec dapatdilakukan operasi kesamaan dan keterkaitan antar kata. Word2vec telah banyak direkomendasikan dandigunakan pada penelitian pemerosesan bahasa alami, sehingga model ini menarik untuk dibahas denganperbedaan konfigurasi pada model. Evaluasi yang dilakukan adalah membadingkan jawaban dari sistemdengan jawaban aktual dari persoalan analogi pada data tes. Hasil terbesar didari penelitian ini adalah34% pada arsitektur Skip-gram, dimensi 100 dan windows size 10 serta 12. Hal ini dikarenakan jumlahkorpus yang kecil serta distribusi kata pada koprus yang tidak merata. Kata kunci : analogi, semantik, vector, word2vec AbstractSemantic is a branch of linguistics and one component in a language that learns the meaning of a word. The semantics are less noticed because the object of the study is in the form of meaning which is considered verydifficult to trace and analyzed its structure especially for the analogy of word. Word analogy is a way toshow two condition in which there is a relational structure. In addition, the analogy of words requires fewercognitive abilities and can be used in various fields. Thus Word2vec is a solution in the form of a model torepresent words into vectors with the dimensions specified. Word2vec has been widely recommended andused in natural language processing research, so this model is interesting to discuss with differentconfigurations on the model. Evaluation is done by comparing the answers from the system with the actualanswers to the problem of analogies on the datatest. The best results from this study is 34% on the Skip-gram architecture, dimension 100 and windows size 10 and windows size 12. This is due to the small numberof corpus and the uneven distribution of words on the coprus. Keywords: analogy, semantic, vector, word2vec

Copyrights © 2019






Journal Info

Abbrev

engineering

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Engineering Industrial & Manufacturing Engineering

Description

Merupakan media publikasi karya ilmiah lulusan Universitas Telkom yang berisi tentang kajian teknik. Karya Tulis ilmiah yang diunggah akan melalui prosedur pemeriksaan (reviewer) dan approval pembimbing ...