cover
Contact Name
Aceng Komarudin Mutaqin
Contact Email
uptpublikasi@unisba.ac.id
Phone
+6285294008040
Journal Mail Official
jrs@unisba.ac.id
Editorial Address
Gedung Rektorat Lantai 4, Jl. Tamansari No. 20 Bandung 40116
Location
Kota bandung,
Jawa barat
INDONESIA
Jurnal Riset Statistika
ISSN : 28083148     EISSN : 27986578     DOI : https://doi.org/10.29313/jrs.v1i2
Core Subject : Science, Education,
Jurnal Riset Statistika (JRS) adalah jurnal peer review dan dilakukan dengan double blind review yang mempublikasikan kajian teoritik dan hasil riset terhadap isu-isu empirik dalam sub kajian statistika. JRS ini dipublikasikan pertamanya 2021 dengan eISSN 2798-6578 yang diterbitkan oleh UPT Publikasi Imiah, Universitas Islam Bandung. Semua artikel diperiksa plagiasinya dengan perangkat lunak anti plagiarisme. Jurnal ini ter-indeks di Google Schoolar, Garuda, Crossref, dan DOAJ. Terbit setiap Juli dan Desember.
Articles 10 Documents
Search results for , issue "Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)" : 10 Documents clear
SPC (Statistical Process Control) Fase II Diagram Kendali Cusum (Cumulative Sum) Nonparametrik Berdasarkan Statistik Mann-Whitney pada Data Harga Saham PT X Zakiyatis Salmaini
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (623.669 KB) | DOI: 10.29313/jrs.v1i2.404

Abstract

Abstract. Attracting the interest and trust of many investors in a company requires an attraction in the form of quality and stability of the performance of a company. Through stock data, quality measurements can be made using control charts, so that it can be seen whether a company’s performance is stable or not. In the conventional control chart, it is assumed that the data is normally distributed, but in practice it is often found that the data does not meet the normality assumption. In this paper, we will discuss the CUSUM control chart nonparametric based on the Mann-Whitney Statistic on the stock price data of (PT). X. This method is a stage of the stage of the SPC phase II which is used to detect small shifts with no assumptions, and the nominal value of the mean is unknown. From this research it was concluded that in the stock close price data there was a downtrend shift in the average process on the first day of monitoring which indicated that at the 44th point the stock price of (PT). X experienced a downtrend, so that the stock price of (PT). NO was declared in an out-of-control state. Abstrak. Menarik minat dan kepercayaan banyak investor terhadap suatu perusahaan dibutuhkan suatu daya tarik berupa kualitas dan kestabilan kinerja dari suatu perusahaan. Melalui data saham dapat dilakukan pengukuran kualitas dengan menggunakan diagram kendali, sehingga dapat diketahui apakah kinerja suatu perusahaan dalam keadaan stabil atau tidak. Pada jenis diagram kendali konvensional diasumsikan data berdistribusi normal, namun pada praktiknya sering ditemukan data tidak memenuhi asumsi kenormalan. Pada makalah ini akan dibahas mengenai diagram kendali CUSUM (Cumulative Sum) nonparametrik berdasarkan statistik Mann-Whitney pada data harga saham PT X. Metode ini merupakan tahapan dari proses SPC (Statistical Process Control) Fase II yang digunakan untuk mendeteksi pergeseran kecil pada rata-rata proses dengan tidak terdapat asumsi yang harus dipenuhi, serta nilai nominal rata-rata yang digunakan tidak harus diketahui. Dari penelitian yang dilakukan disimpulkan bahwa pada data harga close saham terjadi pergeseran rata-rata proses ke bawah pada pemantauan hari pertama yang mengindikasikan pada titik ke-44 harga saham (PT). X mengalami downtrend (tren menurun), sehingga harga saham (PT). X dinyatakan dalam keadaan tidak terkendali.
Evaluasi Kesalahan Proyeksi Penduduk Tahun 2020 untuk Memproyeksikan Penduduk Tahun 2025 Provinsi Jawa Barat Wildan; Yayat Karyana
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (413.187 KB) | DOI: 10.29313/jrs.v1i2.407

Abstract

Abstract. West Java Province is one of the largest provinces in Indonesia. Naturally, the population factor is one of the supports in terms of development. The confusion of a number of population data from various Ministries and Institutions become one of the causes of the non-optimal implementation of government policies. Therefore, this thesis will discuss the calculation of error evaluation population projections carried out using the projection method and projecting from the results of population projections to improve data accuracy which exists. The method used as a benchmark for calculating projections is mathematical method, component method and mixed method. The three methods this results in population projections for year t from the total population aspect, gender and age grouping. After the population projections are obtained, then see how much error the projection value is. In this problem, MALPE and MAPE are in charge of this projection error evaluation technique. There are 3 aspects that become a reference in the calculation of the projected evaluation, namely: other factors are fertility mortality and mobility. Assumption of fertility is measured from the numerical value birth age group (ASFR) and total fertility (TFR). Assumption of mortality what is seen is a table of 24 death levels, while the assumption of mobility or migration is seen from the ASNMR (Age Specific Net Migration Rate) number. Obtained the smallest error value by the MAPE technique is 5.4 in the component method that carried out by BPS and the projection results for West Java Province are 51,338,337 million souls with the component method. Abstrak. Provinsi Jawa Barat merupakan salah satu provinsi terbesar di Indonesia. Tentunya, dalam faktor penduduk menjadi salah satu penunjang dalam hal pembangunan. Kesimpangsiuran sejumlah data penduduk dari berbagai Kementerian dan Lembaga menjadi salah satu penyebab tidak optimalnya pelaksanaan kebijakan pemerintah. Oleh karena itu, skripsi ini akan dibahas mengenai perhitungan evaluasi kesalahan proyeksi penduduk yang dilakukan menggunakan metode proyeksi serta memproyeksikan dari hasil proyeksi penduduk guna memperbaiki keakuratan data yang ada. Metode yang digunakan sebagai tolak ukur menghitung proyeksi adalah metode matematik, metode komponen dan metode campuran. Ketiga metode tersebut menghasilkan proyeksi penduduk tahun ke t dari aspek total penduduk, jenis kelamin dan pengelompokan umur. Setelah proyeksi penduduk diperoleh, selanjutnya dilihat berapa besar kesalahan nilai proyeksi. Pada permasalahan ini, MALPE dan MAPE yang bertugas dalam teknik evaluasi kesalahan proyeksi ini. Terdapat 3 aspek yang menjadi acuan dalam perhitungan evaluasi proyeksi, antara lain fertilitas, mortalitas dan mobilitas. Asumsi fertalitas diukur dari nilai angka kelahiran kelompok umur (ASFR) dan total fertilitas (TFR). Asumsi mortalitas yang dilihat adalah tabel level kematian 24, sedangkan asumsi mobilitas atau migrasi dilihat dari angka ASNMR (Age Specific Net Migration Rate). Didapatkan nilai kesalahan terkecil oleh teknik MAPE sebesar 5,4 pada metode komponen yang dilakukan BPS dan hasil proyeksi untuk Provinsi Jawa Barat sebanyak 51.338.337 juta jiwa dengan metode komponen.
Pemodelan dan Pemetaan Jumlah Penderita Kusta di Jawa Barat dengan Regresi Binomial Negatif dan Flexibly Shaped Spatial Scan Statistic Luhung Mustika Budiharti
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (487.647 KB) | DOI: 10.29313/jrs.v1i2.409

Abstract

Abstract. Flexibly Shaped Spatial Scan Statistics is a statistical scan method used to detect hotspots in a location in the form of points or aggregates. This method will be more flexible to the shape of the resulting hotspot. The hotspot detection process with this method requires forecast data for each region. The forecast data was obtained with the best modeling between poisson regression and negative binomial regression. In the Poisson regression method there are assumptions that must be met, namely the mean and variance of the response variables must be the same. In fact, in the count data this assumption is often not fulfilled because of overdispersion problems. The negative binomial distribution is an unusual statistical model, this distribution can adjust for the overdispersion problem in the poisson distribution. Therefore, the overdispersion problem in poisson regression modeling can be overcome by negative binomial regression. This study uses secondary data on the number of leprosy sufferers in West Java in 2019. Leprosy is a disease caused by the bacterium Mycobacterium leprae. According to the 2019 Health Service Report, West Java is the second province with the highest number of new cases of leprosy in Indonesia. The results of this study indicate that there were 2 leprosy hotspots in West Java in 2019. Abstrak. Flexibly Shaped Spatial Scan Statistic merupakan salah satu metode scan statistic yang digunakan untuk mendeteksi wilayah kantong (hotspot) di sebuah lokasi yang berupa titik atau agregat. Metode ini akan lebih fleksibel terhadap bentuk hotspot yang dihasilkan. Proses pendeteksian hotspot dengan metode ini membutuhkan data ramalan untuk setiap wilayah. Data ramalan tersebut diperoleh dengan pemodelan terbaik diantara regresi poisson dan regresi binomial negatif. Dalam metode regresi poisson terdapat asumsi yang harus dipenuhi yaitu nilai mean dan variance variabel respon harus sama. Kenyataanya pada data count asumsi ini sering tidak terpenuhi karena terjadi masalah overdispersi. Distribusi binomial negatif merupakan model statistik yang tidak biasa, distribusi ini dapat menyesuaikan adanya masalah overdispersi pada distribusi poisson.Oleh karena itu, masalah overdispersi dalam pemodelan regresi poisson dapat diatasi dengan regresi binomial negatif. Pada penelitian ini digunakan data sekunder Jumlah Penderita Kusta di Jawa Barat Tahun 2019. Kusta merupakan penyakit yang disebabkan oleh bakteri Mycobacterium leprae. Menurut Laporan Dinas Kesehatan tahun 2019, Jawa Barat merupakan provinsi kedua dengan jumlah kasus baru kusta terbanyak di Indonesia. Hasil pada penelitian ini menunjukkan adanya 2 hotspot kusta di Jawa Barat pada tahun 2019.
Prediksi Sisa Umur Bearing Menggunakan Regresi Eksponensial Devila Mustika Prancisca
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1324.455 KB) | DOI: 10.29313/jrs.v1i2.434

Abstract

Abstract. Statistics is widely applied in various disciplines, one of which is in the industrial sector. Industry can be used as an indicator of the development of science and technology. Along with the advancement of industrialization and intense competition, a company is required to be able to survive and win the competition with other companies. The problem that is often faced in the industrial world is the existence of a statement that a system that has been designed and made as sophisticated and complex as any will inevitably experience disturbances, whether mild, moderate, or severe. One of the important elements in the machine is the bearing. If the bearing is not functioning properly then the whole system cannot work properly. Bearing damage must be predicted accurately because it will determine how long the remaining functional life of a machine. Exponential regression is the model used in this study. The data used is vibration data from bearing test experiments downloaded from IEE PHM 2012 provided by the FEMTO-ST Institute. By analyzing the extracted data on the RMS feature, the results show that exponential regression can be used to determine or predict the RUL of the bearing. In addition, obtained R^2 in the analysis of all data and the data-cut off is 76.3% and 79.9%, respectively. So, the results of the R^2 value in the exponential regression equation model using the cut-off data are better than the exponential regression equation model by including all data, because it shows a higher level of accuracy. Abstrak. Statistika banyak diterapkan dalam berbagai disiplin ilmu, salah satunya di bidang industri. Industri dapat dijadikan sebagai indikator terjadinya perkembangan ilmu pengetahuan dan teknologi. Seiring dengan majunya industrialisasi dan ketatnya persaingan, sebuah perusahaan dituntut mampu tetap bertahan dan memenangkan persaingan dengan perusahaan lain. Persoalan yang sering dihadapi dalam dunia industri adalah adanya suatu pernyataan bahwa suatu sistem yang telah dirancang dan dibuat secanggih dan sekompleks apapun pasti akan mengalami gangguan, baik gangguan ringan, sedang, maupun berat. Salah satu elemen penting pada mesin yaitu bearing. Bila bearing tidak berfungsi dengan baik maka seluruh sistem tidak bisa bekerja secara semestinya. Kerusakan bearing harus diprediksi dengan akurat sebab akan menentukan berapa lama sisa umur fungsi dari suatu mesin. Regresi eksponensial adalah model yang digunakan dalam penelitian ini. Data yang digunakan adalah data vibrasi dari eksperimen uji bearing yang diunduh dari Institute of Electrical and Electronic Engineers Prognostics and Health Management 2012 yang disediakan oleh FEMTO-ST Institute. Dengan menganalisis data hasil ekstraksi pada fitur RMS, hasilnya menunjukan bahwa regresi eksponensial bisa digunakan untuk menentukan atau memprediksi RUL pada bearing. Selain itu, didapat R^2 pada analisis seluruh data dan data-cut off 76,3% dan 79,9%. Maka, hasil dari nilai R^2 pada model persamaan regresi eksponensial dengan menggunakan data-cut off lebih bagus daripada model persamaan regresi eksponensial dengan menyertakan seluruh data, karena menunjukan tingkat akurasi yang lebih tinggi.
Penerapan Algoritma Naïve Bayes Classifier dalam Memprediksi Status Keberlanjutan Polis Nasabah Asuransi PT.X Ajeng Mega Pratiwi; Aceng Komarudin Mutaqin
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (289.684 KB) | DOI: 10.29313/jrs.v1i2.435

Abstract

Abstract. This article discusses the classification in predicting the sustainability status of the health insurance customer policy of PT. X uses the Naïve Bayes Classifier Algorithm. In predicting the Naive Bayes Classifier Algorithm, it uses the concepts and theories of data mining in the literature related to insurance by calculating the probability of each class of variables using the Bayes theorem in describing the performance of a model or algorithm specifically using the Confusion Matrix. To be able to predict the decisions of health insurance customers in the policy sustainability status, a method of data analysis of registered insurance customers is needed. The data used is data obtained from the insurance company PT. X. The data contains customer information data in the form of 9 variables (Policy Number, Smoking Status, Gender, Age, Marital Status, Dependents, Monthly Premiums, Current Status / whether or not premium payments and insurance policy renewal status). The results of the application of the Naïve Bayes Classifier Algorithm show that the algorithm is quite good in predicting the status of the policy extension of the insured health insurance PT. X, with an average accuracy of 85.82%, an average precision of 96.10% and an average recall of 93.55. Abstrak. Artikel ini membahas tentang klasifikasi dalam memprediksi status keberlanjutan polis nasabah asuransi kesehatan PT. X menggunakan Algoritma Nave Bayes Classifier. Dalam memprediksi Algoritma Naive Bayes Classifier menggunakan konsep dan teori data mining dalam literatur yang berhubungan dengan asuransi dengan menghitung probabilitas setiap kelas variabel menggunakan teorema Bayes dalam menggambarkan kinerja suatu model atau algoritma secara khusus menggunakan Confusion Matrix . Untuk dapat memprediksi keputusan nasabah asuransi kesehatan dalam status kesinambungan polis, diperlukan suatu metode analisis data nasabah asuransi yang terdaftar. Data yang digunakan adalah data yang diperoleh dari perusahaan asuransi PT. X. Data tersebut berisi data informasi nasabah berupa 9 variabel (Nomor Polis, Status Merokok, Jenis Kelamin, Usia, Status Perkawinan, Tanggungan, Premi Bulanan, Status Lancar/tidaknya pembayaran premi dan status perpanjangan polis asuransi). Hasil penerapan Algoritma Naïve Bayes Classifier menunjukkan bahwa algoritma tersebut cukup baik dalam memprediksi status perpanjangan polis dari tertanggung asuransi kesehatan PT. X, dengan rata-rata akurasi 85,82%, presisi rata-rata 96,10% dan rata-rata recall 93,55.
Penerapan uji Q Cochran terhadap Atribut Produk Laptop Menggunakan Multiple Response Analysis (MRA) Dilla Oktoriandi
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (312.693 KB) | DOI: 10.29313/jrs.v1i2.521

Abstract

Abstract. In Multiple Response Analysis using frequency tables and cross tabulations, in which there are several data sets of specified responses. In MRA data, researchers often have difficulty determining which responses are most important. To deal with this problem, an alternative Cochran Q statistical test is given. MRA is commonly used for research to select important things, one example is the problem of a product that is considered important by consumers. Laptop or notebook products are one of the electronic products that are the center of attention. One of the users is students, because it is used to support the learning process. The brand image of a product becomes important as an advantage in making products. The brand image of a product can be built from product attributes. There are several attributes that are determined to form a brand image on a laptop, namely price, color, design, brand, facilities and specifications. From the earnings, MRA gets the three most attributes, namely Specifications, Price and Design. According to the Cochran Q test, it detects if there is a difference in the estimates of the third attribute with the Q test statistic = 11,404 with p-value = 0.003. In this case a post hoc analysis is required to determine the exact difference in the proportion of pairs. This pair can be detected using McNemar's test paired with Bonferroni Correction resulting in one pair of attributes namely Specification with a value of 0.0011 < 0.017. From the results of the odds ratio, it shows that the tendency to be in the attribute specification is 3.86 times more important than the attribute price. In other words, in this case the specification is the attribute that is considered the most important in shaping the product brand image on a laptop. Abstrak. Dalam penyelesaian Multiple Response Analysis menggunakan tabel frekuensi dan tabulasi silang, yang didalamnya terdapat beberapa data set respon yang sudah ditentukan. Pada data MRA para peneliti sering kali mengalami kesulitan dalam menetapkan tanggapan responden apa saja yang paling penting. Untuk menangani masalah tersebut, diberikan suatu alternatif uji statistik Q Cochran. MRA biasa digunakan untuk penelitian memilih hal yang penting terhadap suatu masalah salah satu contohnya adalah penentuan atribut dari suatu produk yang dianggap penting oleh konsumen. Produk laptop atau notebook merupakan salah satu produk elektronik yang menjadi pusat perhatian. Salah satu penggunanya yaitu mahasiswa, karena digunakan untuk menunjang proses pembelajaran. Citra merek suatu produk menjadi penting sebagai keunggulan dalam membuat produk. Citra merek suatu produk dapat dibangun dari atribut produk. Adapun beberapa atribut yang ditentukan untuk membentuk citra merek pada suatu laptop yaitu harga, warna, desain, merek, fasilitas dan spesifikasi. Dari perholehan MRA mendapatkan tiga atribut terbanyak yaitu Spesifikasi, Harga dan Desain. Menurut pengujian Cochran Q mendeteksi jika terdapat perbedaan proporsi tanggapan dari ketiga atribut dengan Statistik uji Q = 11,404 dengan p-value = 0,003. Dalam kasus ini diperlukan analisis post hoc untuk menentukan perbedaan yang tepat dalam proporsi berpasangan. Perbedaan berpasangan ini dapat dideteksi dengan menggunakan uji McNemar berpasangan dengan Koreksi Bonferroni mengghasilkan satu pasang atribut yaitu Spesifikasi dengan harga dengan hasil 0,0011 < 0,017. Dari hasil perolehan odds ratio menunjukan kecenderungan berada pada atribut spesifikasi lebih penting sebesar 3,86 kali dari atribut harga. Dengan kata lain bahwa dalam kasus ini spesifikasi merupakan atribut yang dianggap paling penting dalam membentuk citra merek produk pada suatu laptop.
Robust Spatial Durbin Model (RSDM) untuk Pemodelan Tingkat Pengangguran Terbuka (TPT) di Provinsi Jawa Barat Hanna Nurul Khofifah
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (609.217 KB) | DOI: 10.29313/jrs.v1i2.522

Abstract

Abstract. Spatial regression is used to determine the relationship between the response variable and predictor variables that have a spatial influence in it. If the response variables and predictor variables have a spatial effect, then the model formed is the Spatial Durbin Model (SDM). Outliers in spatial data are often found when conducting the research. Robust Regression is generally used to overcome outliers. Robust regression used in spatial data is a combination of the SDM methods and Robust regression, thus it form a method called Robust Spatial Durbin Model (RSDM). The estimation method used is the Maximum Likelihood type estimation (M-estimator), with expectation that it could accomodate the existence of outliers in the spatial regression model. In this study the response variable is the Open Unemployment Rate, and the predictor variable is the Human Development Indeks, District/City Minimum Wage, Dependency Ratio. Labor Force Participation Rate, education level, and number of poor population. From the results of the study the value Adjusted R2 0,9850 which means 98,5% TPT is influenced by the variables in the model. It means that RSDM is a good model to explain TPT in West Java Province. Abstrak. Regresi spasial digunakan untuk mengetahui hubungan antara variabel respon dan variabel prediktor yang memiliki pengaruh spasial di dalamnya. Jika dalam variabel respon dan variabel prediktor mempunyai pengaruh spasial, maka model yang dibentuk yaitu Spatial Durbin Model (SDM). Pencilan pada data spasial sering ditemukan ketika melakukan penelitian. Secara umum metode yang dapat digunakan untuk mengatasi pencilan yaitu regresi robust. Regresi robust yang digunakan pada data spasial merupakan kombinasi dari metode SDM dan Regresi robust sehingga membentuk suatu metode yang disebut Robust Spatial Durbin Model (RSDM). Metode estimasi yang digunakan yaitu estimasi Maximum Likelihood type (M-estimator), dengan harapan dapat mengakomodasi keberadaan pencilan dalam model regresi spasial. Pada penelitian ini variabel respon adalah Tingkat Pengangguran Terbuka (TPT) dan variabel prediktor adalah Indeks Pembangunan Manusia (IPM), Upah Minimum Kabupaten/Kota (UMK), Rasio Ketergantungan, Tingkat Partisipasi Angkatan Kerja (TPAK), Tingkat Pendidikan, dan Jumlah Penduduk Miskin. Dari hasil penelitian diperoleh nilai Adjusted R2 sebesar 0,9850 yaitu 98,5% TPT dipengaruhi variabel yang ada didalam model. Hal ini menunjukkan RSDM merupakan model yang baik untuk menjelaskan TPT di Provinsi Jawa Barat.
Regresi Poisson Invers Gaussian (PIG) untuk Pemodelan Jumlah Kasus Pneumonia pada Balita di Provinsi Jawa Tengah Tahun 2019 Mey Damayanti CR; Teti Sofia Yanti
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (488.703 KB) | DOI: 10.29313/jrs.v1i2.523

Abstract

Abstract. Poisson regression is a non-linear regression model used on non-negative count or discrete data. Poisson regression is included in the Generalized Linear Model (GLM). In Poisson regression there is an assumption that must be met, that is equidispersion where the value of the variance in the response variable (Y) must be the same as the average value. If in Poisson regression modeling there is an overdispersion or underdispersion and it is ignored, the test will be less accurate because the standard error value will be underestimated. Poisson Inverse Gaussian Regression Model (PIG) can overcome overdispersion data. The Poisson Inverse Gaussian (PIG) distribution is a mixed Poisson distribution. PIG regression is used to model the count data which has a high slope and skews to the right. Maximum likelihood method was used to estimate the parameters in the PIG regression model. Pneumonia is an acute infection that causes inflammation of the lung tissue. The case of pneumonia in children under five is one form of discrete data. The results of the PIG regression model were compared based on the Akaike Information Criterion (AIC) to obtain the best model. From the results of hypothesis testing, it was concluded that the percentage of children under five who had received measles immunization and the percentage of children under five who had received DPT immunization had a significant effect on the of pneumonia cases in children under five. By using the AIC value, the Poisson Inverse Gaussian (PIG) regression model is obtained, that is: . Abstrak. Regresi poisson merupakan model regresi non-linear yang digunakan pada data cacah atau diskrit non-negatif. Regresi Poisson termasuk kedalam Generalized Linear Model (GLM). Pada regresi Poisson terdapat asumsi yang harus dipenuhi yaitu equidispersi dimana nilai variansi pada variabel respon (Y) harus sama dengan nilai rata-ratanya. Apabila dalam pemodelan regresi Poisson terjadi kasus overdispersi atau underdispersi dan hal tersebut diabaikan maka pengujian akan menjadi kurang akurat karena nilai standard error akan menjadi underestimate. Model Regresi Poisson Invers Gaussian (PIG) dapat mengatasi data overdispersi. Distribusi Poisson Invers Gaussian (PIG) merupakan mixed poisson distribution. Regresi PIG digunakan untuk memodelkan data cacah yang memiliki kemiringan yang tinggi dan menceng ke kanan. Metode maximum likelihood digunakan untuk menaksir parameter pada model regresi PIG.. Pneumonia merupakan infeksi akut yang menyebabkan peradangan pada jaringan paru-paru. Kasus pneumonia pada balita merupakan salah satu bentuk dari data diskrit. Hasil model regresi PIG dibandingkan berdasarkan Akaike Information Criterion (AIC) untuk memperoleh model terbaik. Dari hasil pengujian hipotesis diperoleh kesimpulan bahwa persentase balita yang pernah mendapatkan imunisasi campak dan persentase balita yang pernah mendapatkan imunisasi DPT berpengaruh signifikan terhadap jumlah kasus pneumonia pada balita. Dengan memperhatikan nilai AIC didapatkan model regresi Poisson Invers Gaussian (PIG) yaitu: .
Penerapan Probabilistic Neural Network pada Klasifikasi Berat Bayi Baru Lahir Prily Dwi Inas Azizah
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (547.815 KB) | DOI: 10.29313/jrs.v1i2.524

Abstract

Abstract. Based on the Government Agency Performance Report of the Banjar City Health Office in 2018, there were 32 cases of Infant Mortality Rate (IMR) with the main causes being Low Birth Weight (LBW) of 56%, Asphyxia of 30%, and congenital defects of 14 %. Infant mortality due to LBW has a 4 times greater risk compared to babies born weighing more than 2500 grams. If the possibility of giving birth to LBW can be done early, then the incidence of LBW can be minimized. Probabilistic Neural Network (PNN) is an algorithm that uses a probability function. PNN is often used in classification because it can map each input pattern to the optimal number of classifications, is faster, and more accurate than other neural network models. The data used in this study is the medical record data of patients giving birth in 2020 at the Banjar City Regional General Hospital. The response variable in this study was the classification of birth weight, while the predictor variables in this study were maternal age, systolic blood pressure, diastolic blood pressure, maternal weight, maternal height, maternal hemoglobin, parity and gestational duration. The result of this research is the accuracy of 95% with the proportion of training and testing data distribution is 80:20. The results of the PNN classification on 20 test data, namely there were 17 infants classified into class 1 (normal birth weight) and 3 infants classified into class 2 (low birth weight). Abstrak. Berdasarkan Laporan Kinerja Instansi Pemerintah (LKIP) Dinas Kesehatan Kota Banjar tahun 2018, terdapat sebanyak 32 kasus Angka Kematian Bayi (AKB) dengan penyebab utama yaitu Bayi Berat Lahir Rendah (BBLR) sebesar 56%, Asfiksia sebesar 30%, serta cacat bawaan sebesar 14%. Kematian bayi karena BBLR memiliki risiko 4 kali lebih besar dibandingkan dengan bayi lahir dengan berat lebih dari 2500 gram. Apabila kemungkinan ibu melahirkan BBLR dapat dilakukan lebih awal, maka kejadian BBLR dapat diminimalisir. Probabilistic Neural Network (PNN) adalah salah satu algoritma yang menggunakan fungsi peluang. PNN sering digunakan dalam klasifikasi karena dapat memetakan setiap pola input ke jumlah klasifikasi yang optimal, lebih cepat, dan lebih akurat dibandingkan model jaringan saraf lainnya. Data yang digunakan dalam penelitian ini yaitu data rekam medis pasien ibu melahirkan pada tahun 2020 di Rumah Sakit Umum Daerah Kota Banjar. Variabel respon pada penelitian ini yaitu klasifikasi berat bayi lahir sedangkan variabel prediktor dari penelitian ini yaitu usia ibu, tekanan darah sistol, tekanan darah diastol, berat badan ibu, tinggi badan ibu, hemoglobin ibu, paritas dan lama gestasi. Hasil dari penelitian ini yaitu didapat ketepatan akurasi sebesar 95% dengan proporsi pembagaian data training dan testing sebesar 80:20. Hasil klasifikasi PNN pada 20 data uji yaitu terdapat sebanyak 17 bayi yang diklasifikasikan ke dalam kelas 1 (berat bayi lahir normal) dan diklasifikasikan ke dalam kelas 2 (berat bayi lahir rendah).
Klasifikasi Penipuan Transaksi Kartu Kredit Menggunakan Metode Random Forest Tiara Suci Lestari; Dwi Agustin Nuriani Sirodj
Jurnal Riset Statistika Volume 1, No. 2, Desember 2021, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (498.679 KB) | DOI: 10.29313/jrs.v1i2.525

Abstract

Abstract. In today's technological developments, the use of credit cards is a very easy and practical way for customers to make transactions. However, with the increasing use of credit cards, it will lead to financial fraud, namely fraudulent credit card transactions that can harm customers and the bank or company. One technique that can overcome this problem is data mining techniques, namely the classification used to predict fraudulent actions in credit card transactions. The method used is the random forest method, which is an ensemble method by applying bootstrap aggregating (bagging) and random feature selection, which combines several decision trees to form a forest, then to get the results of the final classification prediction through a voting process. The data used is credit card transaction fraud data for 2019-2020. The purpose of the results of this study is to apply the random forest method to the classification of credit card transaction fraud based on the evaluation of classification accuracy such as confusion matrix, accuracy, sensitivity, precision, f-measure and AUC value. The results of the study showed that the application of the random forest method gave very good classification results in classifying fraudulent credit card transactions. Abstrak. Pada perkembangan teknologi saat ini, penggunaan kartu kredit merupakan cara yang sangat mudah dan praktis digunakan pelanggan dalam melakukan transaksi. Tetapi dengan meningkatnya penggunaaan kartu kredit maka akan menimbulkan kecurangan finansial yaitu penipuan transaksi kartu kredit yang dapat merugikan nasabah maupun pihak bank atau perusahaan. Salah satu teknik yang dapat mengatasi masalah tersebut yaitu teknik data mining yaitu klasifikasi yang digunakan untuk memprediksi tindakan penipuan pada transaksi kartu kredit. Metode yang digunakan yaitu metode random forest yang merupakan metode ensemble dengan menerapkan bootstrap aggregating (bagging) dan random feature selection yaitu menggabungkan beberapa pohon keputusan sehingga membentuk hutan (forest), kemudian untuk mendapatkan hasil dugaan klasifikasi akhir melalui proses voting. Data yang digunakan yaitu data penipuan transaksi kartu kredit tahun 2019-2020. Tujuan hasil dari penelitian ini yaitu menerapkan metode random forest pada klasifikasi penipuan transaksi kartu kredit berdasarkan evaluasi ketepatan klasifikasi seperti seperti confusion matrix, akurasi, sensitivitas, presisi, f-measure dan nilai AUC. Hasil dari penelitian didapatkan bahwa penerapan metode random forest memberikan hasil klasifikasi yang sangat baik dalam mengklasifikasikan penipuan transaksi kartu kredit.

Page 1 of 1 | Total Record : 10