eProceedings of Engineering
Vol 6, No 2 (2019): Agustus 2019

Klasifikasi Multilabel Pada Hadis Bukhari Terjemahan Bahasa Indonesia Menggunakan Mutual Information Dan Support Vector Machine

Mohamad Irwan Afandi (Telkom University)
Adiwijaya Adiwijaya (Telkom University)
Widi Astuti (Telkom University)



Article Info

Publish Date
01 Aug 2019

Abstract

AbstrakHadis merupakan sumber hukum kedua bagi umat Islam setelah Al-Quran. Banyak sekali hadis yang telahdiriwayatkan, namun Hadis Bukhari memiliki tingkat kesahihan paling tinggi menurut para ulama. Seiringdengan perkembangan teknologi, hadis sangatlah mudah didapatkan melalui dunia digital. Akan tetapi untukmempelajari hadis tidak semudah yang kita bayangkan. Banyaknya hadis yang ada dan juga belumdikategorikan membuat belajar hadis dengan kategori tertentu sangat sulit dilakukan. Oleh sebab itu penulismelakukan penelitian klasifikasi anjuran, larangan dan informasi pada Hadis Sahih Al-Bukhari terjemahanBahasa Indonesia yang diharapkan dapat mempermudah masyarakat dalam mempelajari hadis. Prosesklasifikasi menggunakan model unigram/bigram dengan Mutual Information (MI) sebagai seleksi fitur danSupport Vector Machine (SVM) sebagai metode klasifikasi. Pada penelitian ini dilakukan beberapa skenariopengujian dengan memodifikasi term model, preprocessing, feature selection dan menggunakan beberapametode klasifikasi untuk membuktikan bahwa SVM merupakan salah satu metode klasifikasi teks yang cocokdigunakan. Pengujian dengan menggunakan model unigram, tidak menggunakan stopword/stemming,menggunakan MI dan menggunakan SVM memberikan nilai hamming loss terbaik yaitu 0.0686. Hasilpenelitian yang diperoleh juga menunjukkan bahwa metode SVM dengan menggunakan MI lebih baikdaripada metode klasifikasi teks yang lain.Kata kunci: Hadis Bukhari, Hamming loss, Klasifikasi, Mutual Information, Preprocessing, Support Vector Machine.AbstractHadith is the second source of law and guidance for Muslims after the Qur’an. There are many hadiths thathave been narrated, but Bukhari’s hadith has the highest level of validity according to the Islamic scholar.Along with the development of technology, hadith is very easy to obtain trough the digital world. However,learning hadith is not as easy as we imagine. The number of hadiths that exist and also not have beencategorized make learning hadith with specific categories very difficult to do. Therefore, the author conducteda research about classification of suggestion, prohibition and information on Bukhari’s hadith that wastranslated to the Indonesian language which is expected to facilitate the public in learning hadith easily. Theclassification process uses unigram/bigram model with Mutual Information (MI) as feature selection andSupport Vector Machine (SVM) as classification method. This research used several scenarios of testing bymodifying the term model, preprocessing, selection feature and some kind of classification method to provethat SVM is one of the text classification method that suitable to use. Testing using a unigram model, withoutstopword removal or stemming, using MI and also SVM gives the best hamming loss value, it is 0.0686. The research also indicates that SVM with MI produces higher accuracy than other text classification methods. Keyword: Bukhari’s Hadith, Classification, Hamming loss, Mutual Information, Preprocessing, SupportVector Machine.

Copyrights © 2019






Journal Info

Abbrev

engineering

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Engineering Industrial & Manufacturing Engineering

Description

Merupakan media publikasi karya ilmiah lulusan Universitas Telkom yang berisi tentang kajian teknik. Karya Tulis ilmiah yang diunggah akan melalui prosedur pemeriksaan (reviewer) dan approval pembimbing ...