Claim Missing Document
Check
Articles

Found 16 Documents
Search
Journal : eProceedings of Engineering

KlasifikasiEmosi Pada Twitter Menggunakan Bayesian Network Muhammad Surya Asriadie; Mohamad Syahrul Mubarok; Adiwijaya Adiwijaya
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Ringkasan. Bahasa digunakan tidak hanya untuk mengutarakan fakta, akan tetapi juga emosi. Emosi tersebut juga dapat terlihat mulai dari perilaku hingga tulisan yang ditulis olehnya. Analisis emosi di dalam teks sendiri dapat dilakukan pada berbagai media, salah satunya adalah Twitter. Pendeteksian emosi bisa memiliki berbagai macam pengaplikasian salah satunya adalah sebagai bahan pertimbangan keputusan politik dalam suatu pemerintahan. Pada tugas akhir ini, penulis meneliti klasifikasi emosi pada twitter menggunakan Bayesian Network. Metode tersebut digunakan karena kemampuannya dalam memodelkan ketidakpastian dan relasi antar fitur. Hasil penelitian menunjukan bahwa, metode yang digunakan untuk melatih jaringan Bayesian Network belum cukup efektif untuk menghasilkan model terbaik, dengan nilai F1-Score tertinggi adalah 53.71%. Model alternatif berbasis Bayesian Network juga dipelajari. Hasil percobaan menunjukan hasil yang lebih baik dibandingkan Multinomial Naive Bayes dengan kompleksitas inferensi yang tidak jauh berbeda. Nilai F1-Score untuk model Multinomial Naive Bayes adalah 51.49%, sedangkan model alternatif berbasis Bayesian Network adalah 52.14%.
Implementasi Algoritma Merging Context Seeds Untuk Plagiarism Detection Yusuf Anugrah Putra Aditama; Moch. Arif Bijaksana; Mohamad Syahrul Mubarok
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Plagiat merupakan masalah yang sering ditemukan di masyarakat, bahkan menurut survey 89% responden sering menemukan kasus plagiat pada bidangnya masing-masing. Tindak plagiat ini dapat berupa mengambil tulisan orang lain yang digunakan untuk kepentingan diri sendiri. Adapun salah satu pendekatan yang dapat dilakukan untuk mendeteksi tindak plagiat ini adalah dengan Text Alignment. Sehingga pada penelitian ini diusung salah satu metode yaitu Merging Context Seeds yang bekerja dengan cara menggabungkan ciri yang ada pada suspicious document dan source-document dengan metode ekstraksi ciri n-skip-k-grams. Dengan diimplementasikannya metode Merging Context Seeds. Kata kunci— merging context seeds, seeds, merge.
Peringkasan Review Produk Berbasis Fitur Menggunakan Semantic Similarity Scoring Dan Sentence Clustering Yanuar Ega Ariska; Warih Maharani; Mohamad Syahrul Mubarok
eProceedings of Engineering Vol 3, No 3 (2016): Desember, 2016
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Ulasan produk dari konsumen merupakan salah satu faktor yang penting dalam penjualan suatu produk. Menganalisis klasifikasi sentimen dan peringkasan suatu review produk memiliki tiga tahap yang harus dilakukan. Tahap pertama yaitu ekstraksi fitur menggunakan frequent itemset mining dengan algoritma apriori. Kemudian, dilakukan klasifikasi opini menggunakan SentiWordnet untuk penentuan polaritas kata opini. Tahap terkahir yaitu dilakukan peringkasan menggunakan semantic similarity scoring dan sentence clustering. Hasil dari penelitian ini didapat bahwa filtering kata yang sesuai juga mempengaruhi performansi dari ekstraksi pada penelitian ini. Filtering kata digunakan yaitu Noun, Noun Phrase, irisan serta gabungan keduanya, keempat filtering kata yang digunakan memiliki hasil yang cukup seimbang, gabungan dan irisan yang diharapkan dapat meningkatkan performansi juga masih didapat hasil yang tidak terlalu jauh dengan hanya Noun dan Noun Phrase. Hasil performansi ekstraksi pada penelitian ini adalah sekitar 20-40% pada dataset yang digunakan. Klasifikasi menggunakan SentiWordNet menunjukkan hasil performansi yang cukup baik namun pada beberapa dataset yang memiliki kompleksitas kalimat yang cukup tinggi juga terjadi penurunan walaupun tidak terlalu berbeda jauh dan masih pada sekitaran 40-90%. Peringkasan dokumen dapat dilakukan dengan baik pada dataset yang disediakan karena dataset memiliki jumlah kalimat ulasan produk yang memadai dan peringkasan dengan metode yang digunakan memperlihatkan beberapa representasi kalimat dari clustering dengan baik. Kata kunci: analisis sentimen, ulasan produk, frequent pattern generation, association mining, semantic smimilarity scoring, sentence clustering.
Implementasi Mutual Information Dan Naive Bayes Untuk Klasifikasi Data Microarray Mohamad Syahrul Mubarok; Kurnia C Widiastuti; Adiwijaya Adiwijaya
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstract. Menurut data dari World Health Oeganization (WHO), kanker merupakan salah satu penyakit penyumbang utama kematian didunia. Sekitar 8,2 juta orang meninggal karena kanker. Oleh karena berbahayanya penyakit ini berbagai cara dilakukan untuk melakukan pencegahan maupun pendeteksian secara dini. Namun pendeteksian penyakit kanker sangatlah rentan terjadi berbagai kesalahan yang dilakukan manusia, seperti yang dimuat pada Jurnal kesehatan BMJ, kesalahan medis menyebabkan 251.454 kematian setiap tahunnya di Amerika Serikat. Guna menanggulangi masalah tersebut digunakanlah teknologi gene expression dengan bantuan teknologi microarray. Masalah muncul, kurang memungkinkan pengolahan data microarray karena besarnya dimensi yang dimiliki. Apabila dimensi dikurangi secara tiba-tiba tentu akan merusak informasi yang dimiliki dan akan berakibat data tidak dapat diklasifikasikan. Karenanya dibutuhkan sistem yang mampu mengklasifikasi data microarray tanpa menghilangkan informasi penting. Pada penelitian ini, sistem dibangun dengan menggunakan pendekatan machine learning yaitu dengan Naive Bayes. Untuk mencapai pendekatan ini, dibutuhkan feature selection berupa Mutual Information. Feature tersebut menangani kasus reduksi dimensi, yang mana memisahkan variabel terpenting dari keseluruhan variabel. Untuk mengukur performansi sistem yang dibangun, digunakan F1-score. Sistem yang dibangun mampu mengklasifikasi kanker pada data microarray dengan rata-rata F1-score mencapai 0.89.
Implementasi Dan Analisis Kesamaan Semantik Antar Kata Berbahasa Inggris Dengan Metode Positive Pointwise Mutual Information Cosine KD Krisna Dwipayana; Moch. Arif Bijaksana; Mohamad Syahrul Mubarok
eProceedings of Engineering Vol 3, No 3 (2016): Desember, 2016
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Keterkaitan semantik adalah salah satu jenis pengukuran yang ada pada text mining untuk menggambarkan bagaimana hubungan antara kata. Tujuan dari pengukuran keterkaitan semantik ini adalah untuk memperoleh nilai yang merepresentasikan seberapa besar keterkaitannya. Pointwise Mutual Information (PMI) merupakan salah satu pengukuran secara statistik untuk keterkaitan semantik yang telah banyak digunakan. Penerapan PMI diketahui mengalami bias untuk sepasang kata dengan frekuensi rendah, hal ini menyebabkan adanya pengembangan berupa varian pada pengukuran PMI untuk menghindari keadaan bias tersebut. Positive Pointwise Mutual Information Cosine (PPMIC) merupakan salah satu varian yang digunakan dalam tugas akhir ini untuk menghitung keterkaitan semantik. Perhitungan nilai PPMIC dilakukan pada dataset yang didapat dari brown corpus. Nilai PPMIC yang didapat oleh aplikasi dihitung korelasinya dengan Word- Sim-353 yang merupakan indeks keterkaitan kata berdasarkan sudut pandang manusia. Hasil dari penelitian pada tugas akhir ini merupakan nilai korelasi antara skor yang dihasilkan sistem dengan gold standard SimLex-999, WordSim353 dan Miller and Charles yang akan menghasilkan nilai kolerasi yang akan menunjukan seberapa akurat metode pengukuran PPMIC. Kata Kunci: Keterkaitan Semantik, Pointwise Mutual Information,Positive Pointwise Mutual Information Cossine.
Klasifikasi Multi-Label pada Topik Berita Berbahasa Indonesia menggunakan Artificial Neural Network Muhammad Fauzan; Adiwijaya Adiwijaya; Mohamad Syahrul Mubarok
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Ketidaksesuaian antara judul dan topik yang ada pada suatu berita menjadi masalah tersendiri dalam mencari berita. Hal ini penting dilakukan untuk membantu pembuat berita dalam menentukan topik yang tepat pada berita yang dibuatnya. Pada penelitian ini topik berita berbahasa Indonesia akan diklasifikasikan ke dalam suatu multi-label menggunakan Artificial Neural Network (ANN) sehingga didapatkan klasifikasi label yang tepat berdasarkan topik beritanya. Data berupa teks akan dijadikan masukan dan dilakukan ekstraksi ciri menggunakan weighting TF-IDF untuk mendapatkan data berbentuk vektor. Berdasarkan hasil penelitian didapatkan kombinasi parameter maksimum epoch, learning rate, jumlah neuron, alpha yang paling optimal yaitu 400, 0.02, 20, 0.3 dengan loss sebesar 0.0021. Kata kunci : Topik berita, klasifikasi, multi-label, ANN. Abstract The mismatch between the headline and the topic on a news becomes a separate issue in searching for news. This is important to help newsmakers in determining the right topic on the news that has been made. In this research the topic of Indonesian language news will be classified into a multi-label using Artificial Neural Network (ANN) so as to get the right label classification based on the news topic. Text data will be input and feature extraction using weighting TF-IDF to get vector-shaped data. Based on the result of the research, the maximum combination of epoch parameters, learning rate, number of neurons, alpha at the most optimum are 400, 0.02, 20, 0.3 with loss 0.0021. Keywords: news topic, classification, multi-label, ANN.