Jurnal Komputer Terapan
Vol. 3 No. 2 (2017): Jurnal Komputer Terapan November 2017

Ekstraksi Tabel HTML ke Database Management System dengan Pendekatan Service Oriented Architecture

Memen Akbar (Teknik Komputer - Politeknik Caltex Riau)
Ardianto Wibowo (Teknik Informatika - Politeknik Caltex Riau)



Article Info

Publish Date
15 Nov 2017

Abstract

Seiring dengan perkembangan berbagai bisnis proses, keberadaan data yang ada semakin berkembang dalam berbagai bentuk. Salah satu bentuk data adalah tabel di dalam sebuah halaman HTML. Berbeda dengan tabel pada database, tabel HTML memiliki struktur yang beragam. Nama atribut, pada tabel database selalu berada pada baris pertama. Sedangkan, pada tabel HTML, nama atribut dapat berada pada kolom pertama (row wise table) atau pada baris dan kolom pertama (column-row wise table). Sehingga, dalam proses ekstraksi, terlebih dahulu harus dikenali bagian pada tabel yang berperan sebagai nama kolom dan bagian tabel yang berperan sebagai data. Setelah diekstraksi, agar dapat digunakan untuk kebutuhan yang lebih lanjut, tabel HTML tersebut disimpan dalam sebuah database. Proses ini dilakukan dengan pendekatan Service Oriented Architecture sehingga ekstraksi dapat dilakukan secara otomatis. Penelitian ini mengembangkan sebuah model ekstraksi tabel HTML dengan pendekatan semantic tree dan memanfaatkan SOA dalam proses loading data ke database. Model yang dihasilkan berhasil mengekstrak tabel dari halaman web dengan 3 jenis bentuk layout, yaitu column wise, row wise, dan column-row wise dan menyimpannya dalam DBMS.

Copyrights © 2017






Journal Info

Abbrev

jkt

Publisher

Subject

Computer Science & IT

Description

Jurnal Komputer Terapan e- ISSN : 2460-5255 (Online) p- ISSN : 2443-4159 (Print). Jurnal Komputer Terapan is scientific journal with a standard Indonesian-language format that covers Informatics Engineering, Information System, and Computer Engineering. Journal Komputer Terapan is published twice a ...