Claim Missing Document
Check
Articles

Found 8 Documents
Search

Klasifikasi Berita Menggunakan Metode Support Vector Machine Robbi Nanda; Elin Haerani; Siska Kurnia Gusti; Siti Ramadhani
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 5, No 2 (2022): April 2022
Publisher : Program Studi Teknik Informatika, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v5i2.4193

Abstract

Abstrak - Berita adalah sebuah informasi mengenai peristiwa yang terjadi di suatu lokasi yang bisa disajikan dalam bentuk teks maupun visual. Berita bisa ditemukan di berbagai portal berita dan media cetak. Umumnya setiap berita dikelompokan berdasarkan kategori umum seperti ekonomi, politik, olahraga, dll. Permasalahan yang muncul adalah  bagaimana cara untuk melakukan pengelompokan pada data berita yang biasanya berjumlah hingga ribuan karakter kedalam kategori yang lebih spesifik. Permasalah ini dapat diselesaikan dengan cara menerapkan text mining dengan memanfatakan algoritma klasifikasi untuk mendapatkan sebuah model fungsi yang merepresentasikan tiap kategori berita. Salah satu algoritma klasifikasi yang cukup tangguh untuk melakukan proses klasifikasi teks adalah Support Vector Machine. Penelitian ini menggunakan 510 data berita dengan batasan klasifikasi 3 kategori berita. Algoritma SVM mendapatkan hasil akurasi tertinggi di 88% untuk nilai parameter C =1, kernel Linear dengan pembagian data uji dan data latih sebesar 90% dan 10 %.Kata kunci : Berita, Klasifikasi, Support Vector Machine, Text Mining Abstract  - News is information about events that occur in a location that can be presented in text or visual form. News can be found on various news portals and print media.Generally each news is grouped by general categories such as economics, politics, sports, etc. The problem is how to group news data into more specific categories.This problem can be solved by applying text mining using the classification algorithm to obtain a function model that represents each news category. One of the classification algorithms that is strong enough to do the text classification process is the Support Vector Machine. This study uses 510 news sample with a classification limit of 3 news categories. The SVM algorithm gets the highest accuracy at 88% for the parameter value C = 1, and Linear kernel with the distribution of test data and training data is 90% and 10%.Keywords : Classification, News, Support Vector Machine, Text Mining
Klasifikasi Berita Menggunakan Algoritma C4.5 Yayuk Wulandari; Elin Haerani; Siska Kurnia Gusti; Siti Ramadhani
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 5, No 2 (2022): April 2022
Publisher : Program Studi Teknik Informatika, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v5i2.4194

Abstract

Abstrak - Perkembangan zaman mengalami kemajuan yang sangat pesat, saat ini penyebaran berita yang paling populer adalah melalui internet. Berita yang disajikan di situs berita online biasanya hanya dalam kategori umum, sehingga ketika pembaca ingin mendapatkan kategori berita yang lebih spesifik harus dilakukan secara manual yang tentunya menjadi kegiatan yang cukup merepotkan. Hal ini juga dialami oleh Badan Pusat Statistik Provinsi Riau yang kesulitan dalam mencari dan mengklasifikasikan berita tentang Provinsi Riau. Dalam hal ini penerapan klasifikasi otomatis dirasa sangat diperlukan. Penelitian ini menggunakan metode klasifikasi C4.5 dengan 510 data berita yang akan diklasifikasikan menjadi 3 kategori yaitu demokrasi, kemiskinan dan ketenagakerjaan. Proses klasifikasi berita dalam penelitian ini meliputi: pengumpulan data, pelabelan manual, teks preprocessing, pembobotan kata, dan metode klasifikasi C4.5. Berdasarkan penelitian yang dilakukan, hasil uji akurasi adalah 84% dengan menggunakan pembagian data 90%:10%. Dapat disimpulkan bahwa metode C4.5 cocok digunakan dalam klasifikasi berita.Kata kunci: Badan Pusat Statistik, Berita, C4.5, Klasifikasi. Abstract - The development of the times has progressed very rapidly, currently the most popular spread of news is through the internet. The news presented on online news sites is usually only in general categories, so when readers want to get a more specific category of news, it must be done manually, which of course will be a bit of a hassle. This is also experienced by the social sector of the Badan Pusat Statistik of Riau, which has difficulty finding and classifying news about Riau Province. In this case the application of automatic classification is felt to be very necessary. This study uses the C4.5 classification method with 510 news data which will be classified into 3 categories, namely democracy, poverty and employment. The news classification process in this study includes: data collection, manual labeling, preprocessing text, word weighting, and C4.5 classification method. Based on the research conducted, the results of the accuracy test were 84% using 90%:10% data sharing. It can be concluded that the C4.5 method is suitable for use in news classification.Keywords : Badan Pusat Statistik, C4.5, Classification, News.
Klasifikasi Sentimen Masyarakat Terhadap Pemerintah Terkait Penerapan Kebijakan New Normal Menggunakan Metode K-Nearest Neighbor Fuji Astuti; Reski Mai Candra; Surya Agustian; Siti Ramadhani
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 5, No 3 (2022): Juni 2022
Publisher : Program Studi Teknik Informatika, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v5i3.4455

Abstract

Abstrak - Instagram memiliki berbagai macam pengguna tanpa terkecuali pemerintah, akun instagram pemerintah sendiri memiliki fungsi sebagai salah satu media informasi bagi masyarakat untuk mengetahui berita terbaru. Pemerintah telah melakukan berbagai upaya untuk mengurangi dan memutus rantai penyebaran virus covid-19, salah satu langkah yang diambil pemerintah dalam menghadapi covid-19 dengan menerapkan kebijakan New Normal. Tujuan penulis dari penelitian ini adalah untuk menghitung akurasi metode K-Nearest Neighbor pada klasifikasikan sentimen dari opini masyarakat terkait penerapan kebijakan new normal. Penelitian ini dilakukan melalui beberapa tahapan yaitu pengumpulan data dari akun yang dikelola pemerintah. Setelah itudata tersebut dilakukan proses preprocessing. Lalu membuat model dengan menggunakan word embedding FastText. Selanjutnya menggunakan feature engineering dalam melakukan improve untuk menghasilkan fitur terbaik. Dataset dalam penelitian ini berjumlah 4717 data yang terbagi dari 1456 data kelas pro, 1662 data kelas netral,  1599 data kelas kontra. Pengujian yang dilakukan menggunakan confusion matrix dengan cara menguji data latih dan data uji sebanyak 3 kali dengan perbandingan data 90:10 yaitu nilai akurasi sebesar 60,169% dan pada k-40 dengan perbandingan 80:20 yaitu nilai akurasi 60,16%, sedangkan akurasi terendah terdapat pada perbandingan data 70:30 yaitu 58,12%.Kata kunci: New Normal, Instagram, Klasifikasi, Sentimen, K-Nearest Neighbor Abstract - Instagram has various kinds of users without the exception of the government, the government's own Instagram account has a function as a medium of information for the public to find out the latest news. The government has made various efforts to reduce and break the chain of the spread of the COVID-19 virus, one of the steps taken by the government in dealing with COVID-19 by implementing the New Normal policy. The author's aim of this study is to calculate the accuracy of the K-Nearest Neighbor method in classifying sentiments from public opinion regarding the implementation of the new normal policy. This research was conducted through several stages, namely collecting data from accounts managed by the government. After that, the data is preprocessed. Then create a model using word embedding FastText. Then use feature engineering to improve to produce the best features. The dataset in this study amounted to 4717 data which was divided into 1456 pro class data, 1662 neutral class data, 1599 contra class data. The test was carried out using a confusion matrix by testing training data and test data 3 times with a data comparison of 90:10, namely the accuracy value of 60.169% and at k-40 with a ratio of 80:20, namely the accuracy value of 60.16%, while the lowest accuracy there is a comparison of 70:30 data that is 58.12%.Keywords: New Normal, Instagram, Classification, Sentiment, K-Nearest Neighbor 
Peringkasan teks otomatis (automated text summarization) pada artikel berbahasa indonesia menggunakan algoritma lexrank Halimah; Surya Agustian; Siti Ramadhani
Jurnal CoSciTech (Computer Science and Information Technology) Vol 3 No 3 (2022): Jurnal Computer Science and Information Technology (CoSciTech)
Publisher : Universitas Muhammadiyah Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37859/coscitech.v3i3.4300

Abstract

Artikel merupakan kumpulan teks atau kalimat yang panjang dan berisikan gagasan atau pendapat terhadap suatu topik tertentu. Artikel yang sangat panjang akan menghabiskan waktu cukup lama untuk membaca dan memahami poin-poin penting yang disampaikan. Penelitian ini mengusulkan algoritma Lexrank untuk meringkas teks otomatis pada artikel berbahasa indonesia. Penelitian ini menggunakan dataset berupa korpus yang tersusun atas 300 artikel dari berbagai topik. Kalimat yang dipilih menjadi ringkasan untuk gold standard dirata-ratakan dari dua orang annotator. Metode peringkas dokumen dikembangkan untuk menghasilkan ringkasan yang performanya dibandingkan dengan gold standard tersebut menggunakan ROUGE score. Metode bekerja dengan beberapa tahap, mulai dari text preprocessing yang meliputi segmentasi kalimat, case folding, tokenisasi, punctuation removal, stemming dan stopword removal. Kemudian menghitung bobot tf-idf, bobot similarity, pembentukan graf, pemeringkatan kalimat, dan tahap akhir adalah membentuk hasil ringkasan. Untuk pengembangan sistem, 150 dokumen diuji coba dengan variasi pemilihan ranking similarity, dan yang terbaik digunakan sebagai model untuk test document. Hasil pengujian dengan compression rate 50% menghasilkan nilai f-measure rata-rata untuk 150 test document, pada metrik ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 67,53%, 59,10%, dan 67,05%. Sedangkan untuk compression rate 30% menghasilkan rata-rata f-measure pada ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 55,82%, 45,51%, dan 54,76%. Penelitian ini menghasilkan akurasi f-measure yang lebih baik dan kompetitif bila merujuk pada hasil-hasil penelitian sejenis.
Penerapan Triple Exponential Smoothing dan Arima dalam Memprediksi Produksi Crude Palm Oil Anggi Vasella; Siska Kurnia Gusti; Lestari Handayani; Siti Ramadhani
Jurnal Informatika Universitas Pamulang Vol 8, No 2 (2023): JURNAL INFORMATIKA UNIVERSITAS PAMULANG
Publisher : Teknik Informatika Universitas Pamulang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32493/informatika.v8i2.30979

Abstract

Dalam bidang perkebunan sawit, PT.XYZ yang terletak di Provinsi Riau merupakan perusahaan yang menghasilkan salah satunya Crude Palm Oil (CPO). Diketahui bahwa dari 10 tahun terakhir produksi, harga jual yang cenderung tidak stabil berakibat terjadinya penimbunan stok. Maka dari itu, dilakukan peramalan jumlah produksi yang tepat agar masalah penimbunan stok dapat diatasi, sehingga penelitian ini bertujuan untuk melakukan prakiraan stok produksi CPO menggunakan perbandingan dua algoritma yaitu Triple Exponential Smoothing dan ARIMA. Peramalan melibatkan pengambilan data historis serta memprediksikannya untuk periode selanjutnya. Setelah dilakukan proses peramalan maka dilakukan pengujian tingkat kesalahan dalam peramalan memakai metode Mean Absolute Percatage Error (MAPE) untuk menunjukkan kisaran nilai kesalahan dalam perhitungan peramalan berdasarkan kesalahan terkecil. Output setelah dilakukan pengujian dengan metode TES mendapatkan tolak ukur αlpha=0,5, βeta=0,004, dan gamma γ=1,0 tingkat kesalahan diperoleh dengan menggunakan akurasi MAPE 10,1% dan 1,4% untuk model ARIMA. Pada output metode TES mendapatkan kategori MAPE dengan kemampuan peramalan baik dan sedangkan output metode ARIMA termasuk dalam kategori MAPE dengan kemampuan peramalan sangat baik sesuai penilaian rentang MAPE. Peran penelitian ini dibutuhkan agar memberikan informasi kepada perusahaan terkait sebagai referensi tambahan dalam peramalan produksi CPO. Hasil kajian metode terbaik yang dilakukan mendapatkan kesimpulan bahwa metode ARIMA dengan perhitungan kesalahan terkecil dari nilai MAPE.
Klasifikasi Sentimen Masyarakat Terhadap Pemerintah Terkait Penerapan Kebijakan New Normal Menggunakan Metode K-Nearest Neighbor Fuji Astuti; Reski Mai Candra; Surya Agustian; Siti Ramadhani
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 5, No 3 (2022): Juni 2022
Publisher : Program Studi Teknik Komputer, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v5i3.4455

Abstract

Abstrak - Instagram memiliki berbagai macam pengguna tanpa terkecuali pemerintah, akun instagram pemerintah sendiri memiliki fungsi sebagai salah satu media informasi bagi masyarakat untuk mengetahui berita terbaru. Pemerintah telah melakukan berbagai upaya untuk mengurangi dan memutus rantai penyebaran virus covid-19, salah satu langkah yang diambil pemerintah dalam menghadapi covid-19 dengan menerapkan kebijakan New Normal. Tujuan penulis dari penelitian ini adalah untuk menghitung akurasi metode K-Nearest Neighbor pada klasifikasikan sentimen dari opini masyarakat terkait penerapan kebijakan new normal. Penelitian ini dilakukan melalui beberapa tahapan yaitu pengumpulan data dari akun yang dikelola pemerintah. Setelah itudata tersebut dilakukan proses preprocessing. Lalu membuat model dengan menggunakan word embedding FastText. Selanjutnya menggunakan feature engineering dalam melakukan improve untuk menghasilkan fitur terbaik. Dataset dalam penelitian ini berjumlah 4717 data yang terbagi dari 1456 data kelas pro, 1662 data kelas netral,  1599 data kelas kontra. Pengujian yang dilakukan menggunakan confusion matrix dengan cara menguji data latih dan data uji sebanyak 3 kali dengan perbandingan data 90:10 yaitu nilai akurasi sebesar 60,169% dan pada k-40 dengan perbandingan 80:20 yaitu nilai akurasi 60,16%, sedangkan akurasi terendah terdapat pada perbandingan data 70:30 yaitu 58,12%.Kata kunci: New Normal, Instagram, Klasifikasi, Sentimen, K-Nearest Neighbor Abstract - Instagram has various kinds of users without the exception of the government, the government's own Instagram account has a function as a medium of information for the public to find out the latest news. The government has made various efforts to reduce and break the chain of the spread of the COVID-19 virus, one of the steps taken by the government in dealing with COVID-19 by implementing the New Normal policy. The author's aim of this study is to calculate the accuracy of the K-Nearest Neighbor method in classifying sentiments from public opinion regarding the implementation of the new normal policy. This research was conducted through several stages, namely collecting data from accounts managed by the government. After that, the data is preprocessed. Then create a model using word embedding FastText. Then use feature engineering to improve to produce the best features. The dataset in this study amounted to 4717 data which was divided into 1456 pro class data, 1662 neutral class data, 1599 contra class data. The test was carried out using a confusion matrix by testing training data and test data 3 times with a data comparison of 90:10, namely the accuracy value of 60.169% and at k-40 with a ratio of 80:20, namely the accuracy value of 60.16%, while the lowest accuracy there is a comparison of 70:30 data that is 58.12%.Keywords: New Normal, Instagram, Classification, Sentiment, K-Nearest Neighbor 
Klasifikasi Berita Menggunakan Metode Support Vector Machine Robbi Nanda; Elin Haerani; Siska Kurnia Gusti; Siti Ramadhani
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 5, No 2 (2022): April 2022
Publisher : Program Studi Teknik Komputer, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v5i2.4193

Abstract

Abstrak - Berita adalah sebuah informasi mengenai peristiwa yang terjadi di suatu lokasi yang bisa disajikan dalam bentuk teks maupun visual. Berita bisa ditemukan di berbagai portal berita dan media cetak. Umumnya setiap berita dikelompokan berdasarkan kategori umum seperti ekonomi, politik, olahraga, dll. Permasalahan yang muncul adalah  bagaimana cara untuk melakukan pengelompokan pada data berita yang biasanya berjumlah hingga ribuan karakter kedalam kategori yang lebih spesifik. Permasalah ini dapat diselesaikan dengan cara menerapkan text mining dengan memanfatakan algoritma klasifikasi untuk mendapatkan sebuah model fungsi yang merepresentasikan tiap kategori berita. Salah satu algoritma klasifikasi yang cukup tangguh untuk melakukan proses klasifikasi teks adalah Support Vector Machine. Penelitian ini menggunakan 510 data berita dengan batasan klasifikasi 3 kategori berita. Algoritma SVM mendapatkan hasil akurasi tertinggi di 88% untuk nilai parameter C =1, kernel Linear dengan pembagian data uji dan data latih sebesar 90% dan 10 %.Kata kunci : Berita, Klasifikasi, Support Vector Machine, Text Mining Abstract  - News is information about events that occur in a location that can be presented in text or visual form. News can be found on various news portals and print media.Generally each news is grouped by general categories such as economics, politics, sports, etc. The problem is how to group news data into more specific categories.This problem can be solved by applying text mining using the classification algorithm to obtain a function model that represents each news category. One of the classification algorithms that is strong enough to do the text classification process is the Support Vector Machine. This study uses 510 news sample with a classification limit of 3 news categories. The SVM algorithm gets the highest accuracy at 88% for the parameter value C = 1, and Linear kernel with the distribution of test data and training data is 90% and 10%.Keywords : Classification, News, Support Vector Machine, Text Mining
Klasifikasi Berita Menggunakan Algoritma C4.5 Yayuk Wulandari; Elin Haerani; Siska Kurnia Gusti; Siti Ramadhani
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 5, No 2 (2022): April 2022
Publisher : Program Studi Teknik Komputer, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v5i2.4194

Abstract

Abstrak - Perkembangan zaman mengalami kemajuan yang sangat pesat, saat ini penyebaran berita yang paling populer adalah melalui internet. Berita yang disajikan di situs berita online biasanya hanya dalam kategori umum, sehingga ketika pembaca ingin mendapatkan kategori berita yang lebih spesifik harus dilakukan secara manual yang tentunya menjadi kegiatan yang cukup merepotkan. Hal ini juga dialami oleh Badan Pusat Statistik Provinsi Riau yang kesulitan dalam mencari dan mengklasifikasikan berita tentang Provinsi Riau. Dalam hal ini penerapan klasifikasi otomatis dirasa sangat diperlukan. Penelitian ini menggunakan metode klasifikasi C4.5 dengan 510 data berita yang akan diklasifikasikan menjadi 3 kategori yaitu demokrasi, kemiskinan dan ketenagakerjaan. Proses klasifikasi berita dalam penelitian ini meliputi: pengumpulan data, pelabelan manual, teks preprocessing, pembobotan kata, dan metode klasifikasi C4.5. Berdasarkan penelitian yang dilakukan, hasil uji akurasi adalah 84% dengan menggunakan pembagian data 90%:10%. Dapat disimpulkan bahwa metode C4.5 cocok digunakan dalam klasifikasi berita.Kata kunci: Badan Pusat Statistik, Berita, C4.5, Klasifikasi. Abstract - The development of the times has progressed very rapidly, currently the most popular spread of news is through the internet. The news presented on online news sites is usually only in general categories, so when readers want to get a more specific category of news, it must be done manually, which of course will be a bit of a hassle. This is also experienced by the social sector of the Badan Pusat Statistik of Riau, which has difficulty finding and classifying news about Riau Province. In this case the application of automatic classification is felt to be very necessary. This study uses the C4.5 classification method with 510 news data which will be classified into 3 categories, namely democracy, poverty and employment. The news classification process in this study includes: data collection, manual labeling, preprocessing text, word weighting, and C4.5 classification method. Based on the research conducted, the results of the accuracy test were 84% using 90%:10% data sharing. It can be concluded that the C4.5 method is suitable for use in news classification.Keywords : Badan Pusat Statistik, C4.5, Classification, News.