Indri Nurandini
UIN Sunan Gunung Djati Bandung

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Klastering Dokumen dengan Menambahkan Metadata Menggunakan Algoritma COATES Indri Nurandini; Arief Fatchul Huda
KUBIK Vol 2, No 2 (2017): KUBIK : Jurnal Publikasi Ilmiah Matematika
Publisher : Jurusan Matematika, Fakultas Sains dan Teknologi, UIN Sunan Gunung Djati Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.15575/kubik.v2i2.1859

Abstract

Text mining adalah proses ekstraksi pola berupa informasi dan pengetahuan yang berguna dari sejumlah besar sumber data tak terstruktur. Salah satu perkembangan text mining adalah ruang lingkup perbaikan dari pemanfaatan sebuah “side information”  yang digunakan untuk membantu proses klastering yang lebih efisien.  “side information”  yang dimiliki data dapat membantu proses text mining jika “side information”  tersebut bersifat informatif. Di dalam “side information” , metadata merupakan bagian dari “side information”  yang dimiliki oleh data. Oleh karena itu, algoritma klastering partisi klasik dan model probabilistik dalam text mining telah dikembangkan untuk memproses data bersama “side information”  dengan menggunakan algoritma Content and Auxiliary attribute Based Text Clustering  (COATES). Adapun proses klastering ini menggunakan inisialisasi klaster dengan algoritma k-means berdasarkan perhitungan jarak euclidean distance.
Klastering Dokumen dengan Menambahkan Metadata Menggunakan Algoritma COATES Indri Nurandini; Arief Fatchul Huda
KUBIK Vol 2, No 2 (2017): KUBIK : Jurnal Publikasi Ilmiah Matematika
Publisher : Jurusan Matematika, Fakultas Sains dan Teknologi, UIN Sunan Gunung Djati Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.15575/kubik.v2i2.1859

Abstract

Text mining adalah proses ekstraksi pola berupa informasi dan pengetahuan yang berguna dari sejumlah besar sumber data tak terstruktur. Salah satu perkembangan text mining adalah ruang lingkup perbaikan dari pemanfaatan sebuah “side information”  yang digunakan untuk membantu proses klastering yang lebih efisien.  “side information”  yang dimiliki data dapat membantu proses text mining jika “side information”  tersebut bersifat informatif. Di dalam “side information” , metadata merupakan bagian dari “side information”  yang dimiliki oleh data. Oleh karena itu, algoritma klastering partisi klasik dan model probabilistik dalam text mining telah dikembangkan untuk memproses data bersama “side information”  dengan menggunakan algoritma Content and Auxiliary attribute Based Text Clustering  (COATES). Adapun proses klastering ini menggunakan inisialisasi klaster dengan algoritma k-means berdasarkan perhitungan jarak euclidean distance.