cover
Contact Name
Ulfi Saidata Aesyi
Contact Email
ijds.unjaya@gmail.com
Phone
+6285643086972
Journal Mail Official
ijds.unjaya@gmail.com
Editorial Address
Jl. Siliwangi, Ringroad Barat, Banyuraden, Gamping, Sleman Daerah Istimewa Yogyakarta 55293
Location
Kab. sleman,
Daerah istimewa yogyakarta
INDONESIA
Indonesian Journal on Data Science
ISSN : 29877423     EISSN : 29877423     DOI : 10.30989
Core Subject : Science,
Indonesian Journal of Data Science (IJDS) adalah Jurnal ilmiah yang memuat hasil penelitian pada ranah data science (Ilmu Data). Cangkupan jurnal meliputi: 1. Big Data 2. Machine Learning 3. Data Mining 4. Deep Learning 5. Artificial Intelligence
Articles 10 Documents
Analisis Sentimen Transfer Pemain Klub La Liga Spanyol Pada Bursa Transfer Musim Dingin Eropa Di Twitter Ahmad Adita Shiddiq; Aris Wahyu Murdiyanto; Arif Himawan
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 1 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i1.859

Abstract

Dari beberapa kompetisi Sepak Bola yang ada, Liga Champions UEFA yang paling digemari oleh masyarakat. Pada tahun 2022 bursa transfer pemain Eropa dibuka, bursa transfer yang dilakukan merupakan cara jangka pendek untuk memperbaiki tim dalam mengejar prestasi sepak bola Dengan media sosial sebagai wadah komunitas, para penggemar sepak bola dapat juga menyalurkan opini, informasi dan berita tentang klub kesayangan kepada masyarakat. Opini masyarakat terhadap transfer pemain Liga Spanyol memiliki peranan penting. Dengan dilakukannya analisis sentimen terhadap opini, dapat dijadikan suatu pola prediksi penilaian masyarakat terhadap transfer pemain serta dapat memberikan saran kepada tim sepak bola terkait bursa transfer pemain pada periode musim selanjutnya. Membuat analisis sentiment penggemar sepak bola terhadap transfer pemain Liga Spanyol apakah bersifat positif dan negatif. Metode Naïve Bayes Classifer (NBC) dalam penelitian ini dipilih dikarenakan pada algoritma NBC dapat melakukan proses pengolahan data diskrit dan data kuantitatif dengan menggunakan sampel yang relative sedikit dan juga perhitungan pada algoritma NBC lebih cepat. Pengambilan data berupa topik mengena keyword “Transfer La Liga”, “Transfer Real Madrid”, “Transfer Barcelona”, “Transfer Liga Spanyol” dan “Transfer Copa Del Ray”. Data tweet di ambil dari periode 1 Januari 2020 sampai dengan 31 Mei 2022, dengan jumlah data total 11.282. Pada penelitian telah berhasil mendapatkan akurasi dengan nilai 81,67 % pada data training dan 85 % untuk data testing. Pada penelitian ini berhasil membuat model analisis sentimen berupa file.pickle yang dimana untuk melakukan klasifikasi dan prediksi pada data tweet untuk mendapatkan sebuah hasil sentimen positif dan negative. Penelitian ini telah berhasil mendapatkan akurasi dengan nilai 81,67 % pada data training dan 85 % untuk data testing.Hasil analisis sentimen akhir dalam klasifikasi penelitian ini bernilai “Sentimen Negatif”
Analisis Sentimen Di Media Sosial Twitter Dengan Studi Kasus Vaksinasi Covid-19 Nufia Alfi Rohyana; Aris Wahyu Murdiyanto; Kharisma
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 1 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i1.861

Abstract

With the COVID-19 pandemic, the World Health Organization or WHO conducted research and research trials on the COVID-19 vaccine. The Indonesian government has made several policies, one of which is the "Mass Vaccination Program". However, the COVID-19 vaccination program in the field received mixed responses in the community, there were those who supported the vaccine program and some who rejected the vaccine program. In this study, researchers conducted research on sentiment analysis on the opinion of vaccination programs against anti-vaccine community groups based on Twitter social media data using the Naïve Bayes Classifier algorithm to provide information on opinion assessments that lead to positive and negative sentiments. Objective: The purpose of this study is to find out the public perception of AntiVaccine against the COVID-19 Vaccination Program in Indonesia. This study uses the Naïve Bayes Classification. The use of the Naïve Bayes Classifier (NBC). This research uses tweets obtained from Twitter with the keywords/hashtags “Anti Covid-19 Vaccines” or by collecting data based on accounts related to news about vaccination programs such as @ The Ministry of Health of the Republic of Indonesia. Data collection was carried out in the period August 2021-December 2021, with a total of 889 data. This study has succeeded in obtaining an accuracy of 72 % for testing. The result of the final sentiment analysis in the classification of the Anti-Vaccine group in this study is "Negative Sentimen".
Sentiment Analysis Related National Social Security Agency for Employment in Indonesia: Hybrid Method Using Lexicon Based and Naive Bayes Classifier Approaches Rizky Fauzi Akbar; Muhammad Habibi
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 1 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i1.896

Abstract

The National Social Security Agency (BPJS) for Employment is the Social Security Administering Agency with the goal of ensuring that each participant or member of the family receives adequate necessities. In its implementation, there is information that is spread, particularly on Twitter, regarding the Ministry of Health's decision, namely regarding Old Age Security (JHT), which can only be distributed/taken after the participant turns 56 years old, causing both pros and cons among the public. Based on unanalyzed tweets on Twitter, it is necessary to do extensive research to collect relevant information based on netizens' viewpoints. This research describes sentiment analysis of tweets from Twitter using the terms JHT, BPJSTK, and BPJS, which yield 4154 data tweets. We employ two approaches in this study: Lexicon Based and Nave Bayes Classifier. According to this study, the accuracy of the testing data is 92% for the Lexicon Based and 95% for the Nave Bayes Classifier. This study concluded that the JHT at BPJS Employment received unfavorable attitudes and negative reactions among users who addressed the rejection of new restrictions where JHT, could only be dispensed or taken when participants at BPJS Employment were 56 years old.
K-Nearest Neighbor and Naive Bayes Classifier Methods for Expedition Service Comparison Analysis of User Sentiments Nurul Hikmah; Muhammad Habibi
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 1 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i1.899

Abstract

Depending on the service chosen, expedition is one of the freight forwarding companies that operate in the domestic market. The availability of expedition services can make it easier for traders to transfer items to purchasers who conduct online transactions, as well as encourage shipping businesses to collaborate with online dealers. The JNE, JNT, and Pos Indonesia excursions were utilized in this study. The goal of this project is to develop an analytical model that will make it simpler for online merchants to find collaborators for effectively and securely transporting their goods. Based on user sentiment on the social networking site Twitter, this study uses sentiment analysis. With the keywords "JNT, JNE, and Pos Indonesia," this study compares the accuracy results using the Naive Bayes Classifier (NBC) and K-Nearest Neighbor (KNN) algorithms. According to this study, testing accuracy for the NBC method was 80% and training accuracy was 83%. While the accuracy of the KNN approach is 68%. According to public opinion, the JNE expedition is the best one for distributing products, scoring 68.58% in favor of it and 30.64% against it.
Topic Modeling dan Social Network Analysis digunakan untuk mencari keterkaitan topik pada Tweet Pembahasan Saham Ilham Zulqarnain Muhammad; Puji Winar Cahyo
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 1 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i1.900

Abstract

Pada tahun 2020, jumlah orang yang melakukan trading di Indonesia mengalami peningkatan meskipun terjadi pandemic covid19. Dalam hitungan jumlah investor pada tahun 2020 mencapai 3.5 juta investor sedangkan pada tahun 2021 meningkat menjadi 7.5 investor. Melalui adanya peningkatan ini, maka jumlah posting tentang saham dan tutorial mengenai trading saham di media sosial meningkat cukup drastis. Maka penelitian ini mencoba untuk melakukan analisis keterkaitan topik pembicaraan saham pada sosial media Twitter dengan menggunakan integrasi topic modelling dan Social Network Analysis (SNA). Proses pembagian topik ideal menggunakan coherence measurement menentukan sebanyak 5 topik ideal. Melalui lima topik yang dihasilkan dari topic modelling tersebut kemudian dilakukan analisis menggunakan SNA sehingga menghasilkan nilai degree centrality, betweeness centrality, dan closeness centrality yang sama pada setiap topik. Nilai tersebut diantaranya: 4 untuk nilai degree centrality, 0.4 untuk betweeness centrality dan 1 untuk closeness centrality. Melalui hasil tersebut maka perlunya evaluasi dalam pembentukan SNA dengan menggunakan topic modeling. Evaluasi tersebut salah satunya bisa dilakukan melalui identifikasi pada tweet yang memiliki kesamaan pembahasan meskipun dengan penulisan redaksi yang berbeda, atau dapat dilakukan dengan cara menambah variasi data dengan cara memperlama waktu pengambilan.
Smart System Bagian dari Artifical Intellegence dalam Paradigma Keilmuan Laili Wahyunita
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 2 (2023): Vol 1 No 2 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i2.1185

Abstract

Artikel ini memuat pembahasan terhadap aspek filsafat sains pada domain smart system. Smart system yang merupakan sub dari Artificial Intellegence (AI) terus berkembang dan semakin banyak diterapkan di berbagai aspek kehidupan. Mulai dari aspek kesehatan, social, politik, budaya, pendidikan, bisnis, budaya, serta aspek lainnya. Melalui kajian filsafat sains baik dari pemikiran Thomas S. Kuhn dan Imre Lakatos, smart system termasuk dalam spesifikasi normal sains dan progresif sains yang ditandai dengan masih akan terus berkembangnya riset di bidang ini. Luasnya aspek pengembangan smart system ini menjadikan potensi riset yang mengandung bias penelitian, etis dan moral yang negative, serta pseudosains. Penulisan artikel ini menggunakan metode studi pustaka atau library research dan pendekatan analisis konten atau content analysis. Dari kajian filsafat sains diketahui upaya pencegahan dari pseudosains dapat dilakukan dengan mengedapankan failsifikasi, metode ilmiah, dan pembuatan aturan dan batasan yang jelas. Bias penelitian dapat dihindari dengan pemilihan metodologi riset yang terpantau dan terawasi melalui pengacakan sample. Nilai etika dan moralitas harus diperhatikan baik sebagai ilmuwan maupun individu dengan mengedapankan etika normative dan terapan.
Klasifikasi Penyakit Hiperkolesterol Menggunakan Algoritma Decision Tree C4.5 Aprisarita Liya; Yonal Supit; Andi Muhammad Islah
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 2 (2023): Vol 1 No 2 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i2.1192

Abstract

Hiperkolesterol merupakan faktor risiko penyebab kematian di usia muda. tercatat 4,4 juta kematian akibat hiperkolesterol atau sebesar 7,9% dari jumlah total kematian di usia muda. Hiperkolesterol merupakan salah satu jenis penyakit yang banyak dialami oleh masyarakat Indonesia. Pentingnya mengetahui gejala penyakit stroke sejak dini merupakan pencegahan awal. Maka dari itu, dilakukan penelitian untuk menganalisa data terkait penyebab hiperkolesterol. Adapun atribut yang terlibat dalam penyebab terjadinya hiperkolesterol yakni, usia, jenis kelamin, status merokok, dan index masa tubuh. Diperlukan algoritma tertentu untuk mengklasfikasikan atribut tersebut untuk mengevaluasi kelas suatu objek. Decision tree C4.5 merupakan algoritma yang paling banyak digunakan, dalam kasus ini akurasi dari algoritma Decision tree C4.5 merupakan Algoritma yang paling banyak digunakan, dalam kasus ini akurasi dalam algoritma Decision Tree C4.5 sebesar 80%.
Analisis Prediksi Kematian Pasien Covid-19 di Meksiko Menggunakan Algoritma Random Forest Dennis Fitri Salsabilla Arianti; Latifah Arum Sulistyaningsih; Mohamad Burhanudin
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 2 (2023): Vol 1 No 2 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i2.1196

Abstract

This research aims to analyze and predict the deaths of Covid-19 patients in Mexico using the Random Forest algorithm. The data used in this study is sourced from official sources, including the number of cases, symptoms, risk factors, and Covid-19 patient mortality data. The first stage of this research is data preprocessing, where the acquired data is collected, cleaned, and prepared for analysis. Subsequently, data exploration is conducted to understand the characteristics and patterns within the dataset. Then, the Random Forest model is developed to predict the deaths of Covid-19 patients based on relevant factors. Model evaluation is performed using accuracy, precision, recall, and F1-score metrics. The results of this research indicate that the random forest model can provide good predictions for Covid-19 patient deaths in Mexico. The evaluation results show a high level of accuracy and satisfactory performance for the model. These findings can be used as guidance in decision-making and strategic planning to address the Covid-19 pandemic in Mexico. This research contributes significantly to the field of predictive analysis and provides valuable insights in the efforts to manage the Covid-19 pandemic.
Analisis Kepercayaan Masyarakat Tentang Kepolisian Indonesia di Twitter Menggunakan Latent Dirichlet Allocation (LDA) Bagas Dwi Santosa; Nurul Fatimah; Netania Indi Kusumaningtyas; Ulfi Saidata Aesyi; Herdiesel Santoso
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 2 (2023): Vol 1 No 2 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i2.1198

Abstract

Kepolisian Negara Republik Indonesia merupakan instansi yang bertugas untuk menjaga ketertiban dan keamanan masyarakat, menerapkan hukum, memberikan perlindungan, dukungan dan layanan kepada warga negara guna menjaga stabilitas dalam negeri. Namun, ditengah peran dari kepolisian itu sendiri, justru banyak kasus yang menyeret beberapa anggota polisi. Hal tersebut yang membuat masyarakat ramai membicarakannya di sosial media, salah satunya Twitter. Bahkan tagar-tagar yang berkaitan dengan kasus lingkup kepolisian juga sempat trending di Twitter. Dari hal tersebut, maka perlu dilakukan analisis terhadap topik kepercayaan masyarakat terhadap kepolisian. Analisis yang dilakukan menggunakan Latent Dirichlet Allocation (LDA). Hasil dari analisis yang dilakukan yaitu kepercayaan masyarakat terhadap kepolisian berkurang atas banyaknya kasus yang dilakukan anggota polisi saat ini. Analisis yang dilakukan menggunakan Latent Dirichlet Allocation (LDA) mengungkapkan bahwa kepercayaan publik terhadap kepolisian telah terkikis secara signifikan akibat banyaknya kasus yang melibatkan anggota kepolisian. Kesimpulan ini didukung oleh prevalensi tagar terkait kepolisian dan diskusi di platform media sosial seperti Twitter.
Analisis Perbandingan Pengukuran Jarak Algoritma K-Nearest Neighbor Dengan Menggunakan Data Breast Cancer Dan Data Heart Disease Herdiesel Santoso; Linda Pratiwi
INDONESIAN JOURNAL ON DATA SCIENCE Vol 1 No 2 (2023): Vol 1 No 2 (2023): Indonesian Journal on Data Science
Publisher : Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30989/ijds.v1i2.1200

Abstract

Breast Cancer is a cancerous condition that appears in the breast area. This type of cancer is often experienced by women with a characteristic feature of Breast Cancer, namely the appearance of unusual lumps in the breast area. Heart or Heart Disease is a type of Non-Communicable Disease (PTM): which results in a fairly high mortality rate. Heart Disease is caused by several risk factors including smoking, an unhealthy lifestyle, high cholesterol, hypertension, and diabetes. Based on these facts, an appropriate algorithm is needed to classify Breast Caner and Heart Disease as an effort to prevent an increase in mortality rates due to Breast Cancer and Heart Disease. And the algorithm that will be used is the K-Nearest Neighbor algorithm with 3 distance measurement methods, namely Euclidean distance, Manhattan distance, and Minkowsky distance . From the stages that have been carried out, the final results of the Euclidean distance method obtained an Accuracy value of 80.88% Breast Cancer data at K = 11, and 78.69% heart Disease data at K = 11. The Manhattan distance method obtained an Accuracy value of 89.71% of Breast Cancer data on K=11, and 78.69% of Heart Disease data on K=20.The Minkowsky distance method obtained an Accuracy value of 98.53% of Breast Cancer data on K=11, and 79.41% of Heart Disease data on K=11. This shows that the Minkowsky distance method works more optimally than the Euclidean distance and Manhattan distance methods.

Page 1 of 1 | Total Record : 10