Bandung Conference Series: Statistics (BCSS) menerbitkan artikel penelitian akademik tentang kajian teoritis dan terapan serta berfokus pada Statistika dengan ruang lingkup sebagai berikut: Alternating Least Square, Analisis Konjoin, Autoregressive, Auxiliary Variabel, Baby Birth, Block Maxima, Churn Distribusi Skellam, Cox Regression, Data spasial, DBD Ordinal Logistic Regression, Diagram kendali, Discrete Choice Experiment Method, Discrete Time Logistic, empirical likelihood, Fisher Scoring, Generalized Structured Component Analysis, Geographically Weighted Regression, GEV, GJR GARCH, Infant Mortality Preferensi, Insurance Claim, Kaplan-Meier, Kernel Bi-Square, Gaussian, Logistic Regression, Maternal Mortality, Mixed Geographically Weighted Regression Model GSTAR, MLE, Model ARIMAX, MSE. Multiple linear regression analysis, Nadaraya Watson, Newton Raphson Method, Nonparametrik Spline Confidence Interval, Optimasi Multi-Objek, orde Spasial, Outlier, Pareto Optimal, Partial Proportional Odds Model, Pemodelan Indeks Pembangunan Manusia. Penduga Rasio dan Produk Tipe Eksponensial, Peramalan, Poisson Bivariate Regression, Poisson Regression, Rata-rata Populasi berhingga, Regresi, Return Period Exogenous Variable, RMSE, Structural Equation Modeling, Survival Analysis, Threshold, Vibrasi Bearing, zero-inflated. Prosiding ini diterbitkan oleh UPT Publikasi Ilmiah Unisba. Artikel yang dikirimkan ke prosiding ini akan diproses secara online dan menggunakan double blind review minimal oleh dua orang mitra bebestari.
Pengujian Hipotesis untuk Dua Sampel Saling Bebas dengan Menggunakan Pendekatan Bayesian Fithri Amalia Rahma; Suliadi
Abstract. In this thesis, we will discuss hypothesis testing for two independent samples using the Bayesian approach. One of the alternative bayesian methods for classical hypothesis testing is the Bayesian factor. Wang & Liu (2015) proposed a two-sample testing method with a bayesian approach. Where the Bayes factor used is simple, and free from the Bartlett paradox and the information paradox. The data used for the application of this method is the Human Development Index (IPM) data based on the province of West Java and Central Java in 2020. The results of the two independent sample test using the Bayesian approach are that there is no difference in the average Student Development Index (IPM). between West Java and Central Java provinces in 2020. Abstrak. Dalam skripsi ini akan dibahas pengujian hipotesis untuk dua sampel saling bebas dengan menggunakan pendekatan bayesian. Salah satu metode alternatif bayesian untuk pengujian hipotesis klasik adalah faktor bayes. Wang & Liu (2015) mengajukan metode pengujian dua sampel dengan pendekatan bayesian. Dimana faktor bayes yang digunakan sederhana, serta terbebas dari paradoks Bartlett dan paradoks informasi. Data yang digunakan untuk penerapan metode ini adalah data Indeks Pembangunan Manusia (IPM) berdasarkan provinsi Jawa Barat dengan provinsi Jawa Tengah pada tahun 2020. Hasil dari uji dua sampel saling bebas menggunakan pendekatan bayesian adalah tidak ada perbedaaan rata-rata Indeks Pembangunan Mahasiswa (IPM) antara provinsi Jawa Barat dengan provinsi Jawa Tengah pada tahun 2020.
Kasus Multiproduk dan Multivariabel Toko Kain Avtex Menggunakan Diagram Kontrol Short-Run Vega Rochwani Putri; Siti Sunendiari
Abstract. A method for quality control that can provide an overview of the ongoing process by taking samples for analysis using statistical techniques so that variability in the process can be reduced is called Statistica Process Control (SPC), which has the aim of quickly detecting the presence of the cause of cases of shifting a process. so that improvements can be made to the process before too many processes are not in accordance with running standards. The design and implementation of a production must be observed sequentially from the state of the mass product for this to be effective. In short production run (Short Production Run) usually do not have sufficient data sufficient to carry out SPC using classical diagrams due to different products. To find out whether the process is controlled or not, it is presented in the Short-Run Control Diagram for X and R. In making a short-run control diagram R and X for multi-products that are measured are one item. Then determine the Upper Control Limit (UCL) and Lower Control Limit (LCL). Short-Run R and X Kontrol control diagrams for multiproduct and multivariable are discussed in this thesis. The data used are pieces of cordura and shabet fabrics at the AVTEX Fabric Store. Abstrak. Metode untuk mengendalikan kualitas yang dapat memberikan gambaran tentang proses yang sedang berjalan dengan mengambil sampel untuk dianalisa dengan menggunakan tehnik statistik sehingga variabilitas dalam proses dapat dikurangi disebut Statistica Proses Control (SPC), yang memiliki tujuan untuk mendeteksi secara cepat kehadiran penyebab kasus dari pergeseran suatu proses sehingga dapat dilakukan perbaikan terhadap proses tersebut sebelum terlalu banyak proses yang tidak sesuai dengan standar berjalan. Rancang dan implementasikan suatu produksi harus diamati berurutan dari kondisi produk massal agar hal ini dapat efektif. Pada produksi jangka pendek (ShortProduction Run) biasanya tidak memiliki data yang cukup memadai untuk melaksanakan SPC dengan menggunakan diagram klasik karena produk yang berbeda. Untuk mengetahui proses terkendali atau tidak maka disajikan pada Diagram KontrolShort-Run untuk X ̅ dan R. Dalam membuat diagram kontrol short-run R dan X ̅ untuk multiproduk yang diukur adalah satu item. Kemudian ditentukan Upper Control Limit ( UCL) dan Lower Control Limit ( LCL). Diagram KontrolShort-Run R dan X ̅ untuk multiproduk dan multivariabel dibahas dalam skripsi ini. Data yang digunakan yaitu potongan kain cordura dan shabet di Toko Kain AVTEX.
Analisis Survival pada Tungsten dan Degradasi Bearing Menggunakan Regresi Weibull Gimma Sefira Alamsya; Sutawanir Darwis
Abstract. Many products are needed by humans in various industries that’s why the selection of materials must be in accordance with the needs because it will affect the quality of the machine. Tungsten carbide is one of the working materials used because of its strong. Bearing is one of the results of the manufacture of tungsten carbide material that acts as a support for a shaft so that it always rotates without friction. Survival analysis will be used to determine the resistance of a machine's strength. The Weibull distribution has a small functional sample size for failure accuracy. We will discuss the application of Weibull regression with the Maximum Likelihood Estimation (MLE) as parameter estimates. This study uses data from the University of Durham, by Braiden, Green and Wright (1982) from experimental results of the stress level test of tungsten carbide cobalt alloy which produces data on stress rates and failure stresses. Tests on 5 different stress rates against twelve observations and it is proven that the stress rate has a significant effect on failure stresses. Then the next data is bearing vibration data from Prognostics and Health Management, FEMTO ST-Institute which consists of 17 bearings with horizontal and vertical directions so that in total there are 34 observations. With time to failure data as the dependent variable and speed and load as independent variables. The result is that only variable speed has a significant effect on time to failure. Abstrak. Banyak produk yang dibutuhkan manusia di berbagai industri itulah mengapa pemilihan bahan harus sesuai dengan kebutuhan karena akan mempengaruhi kualitas mesin. Tungsten karbida merupakan salah satu material kerja yang digunakan karena sifatnya yang kuat. Bearing adalah salah satu hasil pembuatan material tungsten karbida yang berperan sebagai tumpuan sebuah poros agar selalu berputar tanpa adanya gesekan. Akan digunakan analisis survival untuk mengetahui ketahanan kekuatan suatu mesin. Distribusi weibull memiliki bentuk fungsional sampel yang kecil untuk keakuratan kegagalan. Akan dibahas penerapan regresi weibull dengan metode Maximum Likelihood Estimation (MLE) sebagai taksiran parameter. Penelitian ini menggunakan data sekunder University of Durham, oleh Braiden, Green and Wright (1982) hasil eksperimen uji tingkat tekanan paduan tungsten karbida kobalt alloy yang menghasilkan data stress rates dan failure stresses. Pengujian pada 5 stress rates berbeda terhadap dua belas observasi dan terbukti bahwa stress rate berpengaruh secara signifikan terhadap failure stresses. Lalu data selanjutnya adalah data vibrasi bearing dari Prognostics and Health Management, FEMTO ST-Institute yang terdiri dari 17 bearing dengan arah horizontal dan vertikal sehingga ditotalkan ada 34 observasi. Dengan data time to failure sebagai variabel dependen serta speed dan load sebagai variabel independent. Dihasilkan bahwa hanya variabel speed berpengaruh seccara signifikan terhadap time to failure.
Regresi Nonparametrik Kernel dalam Pemodelan Jumlah Kelahiran Bayi di Jawa Barat Tahun 2017 Safni Chusnaifah Junianingsih
Abstract. Regression analysis is one of the analytical tools used to determine the effect of multiple predictor variables (X) on response variables (Y). The approach in regression analysis is divided into two, parametric approaches and nonparametric approaches. On nonparametric regression analysis, the shape of the regression curve is unknown, the data arega expected to look for its own estimation form so that it has high flexibility. Estimation of regression functions is performed with the Nadaraya Watson kernel estimator using Gaussian kernel functions. In this method requires bandwidth (h) or finer parameters as a balance controller between the smoothness of the function and the suitability of the function of the data. Optimum bandwidth (h) is obtained by minimizing the Generalized Cross Validation (GCV) value. Based on the analysis, obtained in a simple linear regression model obtained a Mean Square Error (MSE) value of 552976772 and a Standard Error (SE) of 24437,98. While in the kernel nonparametric regression model, the optimum bandwidth (h) is 0,50, Mean Square Error (MSE) is 96832714, and the Standard Error (SE) value is 10226,4. So it can be concluded that the kernel nonparametric regression model is better than a simple linear regression model. Abstrak. Analisis regresi merupakan salah satu alat analisis yang digunakan untuk mengetahui pengaruh dari beberapa variabel prediktor (X) terhadap variabel respon (Y). Pendekatan dalam analisis regresi dibagi menjadi dua, yaitu pendekatan parametrik dan pendekatan nonparametrik. Pada analisis regresi nonparametrik bentuk kurva regresi tidak diketahui, data diharapkan mencari sendiri bentuk estimasinya sehingga memiliki fleksibilitas yang tinggi. Estimasi fungsi regresi dilakukan dengan estimator kernel Nadaraya Watson menggunakan fungsi kernel Gaussian. Metode ini membutuhkan bandwidth (h) atau parameter penghalus sebagai pengontrol keseimbangan antara kemulusan fungsi dan kesesuaian fungsi terhadap data. Bandwidth (h) optimum diperoleh dengan meminimumkan nilai Generalized Cross Validation (GCV). Berdasarkan analisis diperoleh pada model regresi linear sederhana diperoleh nilai Mean Square Error (MSE) sebesar 552976772 dan niai Standard Error (SE) sebesar 24437,98. Sedangkan pada model regresi nonparametrik kernel diperoleh bandwidth (h) optimum sebesar 0,50, Mean Square Error (MSE) sebesar 96832714, dan nilai Standard Error (SE) sebesar 10226,4. Sehingga dapat disimpulkan bahwa model regresi nonparametrik kernel lebih baik daripada model regresi linear sederhana.
Proyeksi Penduduk Indonesia dengan menggunakan Metode Campuran Fadhil Adiwibowo; Yayat Karyana
Abstract. Badan Pusat Statistik (BPS) has several times made projections of the Indonesian population based on data from the 1971, 1980, 1990, 2000, 2010 Population Census, and based on data from the Survei Penduduk Antar Sensus (SUPAS). This was made in order to fulfill the need for the preparation of Medium Term Development Plans and Long Term Development Plans so that population data was needed until 2045. The population projection methods commonly used are the mathematical method, the component method, and the mixed method. Population projections using the mathematical method are usually used to produce only the total population, while projections using the component method produce the total population and age groups. The mathematical method has a weakness, namely it does not pay attention to demographic components, which include birth, death, and migration. The component method also has a weakness, namely that sometimes the results of the projection are not satisfactory, due to the inaccurate estimation of the migration rate, which changes in each projection period. The mixed method is a combination of the component method and the mathematical method, used to overcome the weaknesses of each method. The mixed method includes the total population taken from the results of the projection using the mathematical method, while the distribution of the population by age group is used from the results of the projection using the component method. Projections of the Indonesian population per 5 years from 2025-2045 using basic data from the 2020 population census, obtained a population of 288,716,143 people, 908,496,679 people, 329,632,420 people, 352,216,214 people, 376,347,271 people. Abstrak. Badan Pusat Statistika (BPS) telah beberapa kali membuat proyeksi penduduk Indonesia berdasarkan data hasil Sensus Penduduk 1971, 1980, 1990, 2000, 2010, dan berdasarkan data hasil Survei Penduduk Antar Sensus (SUPAS). Hal teresebut dibuat dalam rangka memenuhi kebutuhan penyusunan Rencana Pembangunan Jangka Menengah dan Rencana Pembangunan jangka Panjang sehingga diperlukan data kependudukan hingga tahun 2045. Metode proyeksi penduduk yang biasa digunakan adalah metode matematik, metode komponen, metode campuran. Proyeksi penduduk dengan metode matematik biasa digunakan untuk menghasilkan total penduduk saja, sedangkan proyeksi dengan metode komponen menghasilkan total penduduk dan kelompok umur. Metode matematik memiliki kelemahan yaitu tidak memperhatikan komponen demografi yang antara lain kelahiran, kematian, dan migrasi. Metode komponen juga mempunyai kelemahan yaitu terkadang hasil dari proyeksinya kurang memuaskan, karena kurang tepatnya estimasi angka migrasi, yang pada tiap periode proyeksi berubah. Metode campuran merupakan penggabungan dari metode komponen dan metode matematik, digunakan untuk mengatasi kelemahan dari masing masing metode. Metode campuran di dalamnya terdapat total penduduk yang diambil dari hasil proyeksi menggunakan metode matematik sedangkan distribusi penduduk menurut kelompok umur digunakan dari hasil proyeksi menggunakan metode komponen. Proyeksi penduduk Indonesia per 5 tahun dari tahun 2025-2045 dengan menggunakan data dasar hasil sensus penduduk 2020, diperoleh penduduk sebesar 288.716.143 orang, 908.496.679 orang, 329.632.420 orang, 352.216.214 orang, 376.347.271 orang.
Model Quasi-likelihood untuk Mengatasi Masalah Overdispersi pada Data yang Berdistribusi Multinomial Uli Silma; Nusar Hajarisman
Abstract. Discrete data is data in the form of numbers (numbers) obtained by counting. As stated by McCullagh and Nelder (1989), overdispersion problems will often be encountered in discrete data analysis, both response variables in the form of binary (dichotomous), counts, and structures of more than two categories (polychotomous) such as in this multinomial distributed model. The number of events with more than two categories can be expressed by following a multinomial distribution. Several basic assumptions must be met when applying a multinomial distributed model to a particular data set, one of which is that the response variable is an independent random variable, and the probability of success of an event is constant. However, in practice, it is not uncommon for assumptions to be violated, in which random variables are independent. The independence between random variables is interpreted as a correlation between the response variables, this is an indication that there is a problem called overdispersion. Data can be said to have overdispersion problems when the Pearson deviance or chi-squared value is more than 1 (McCullagh & Nelder, 1989). The multinomial distribution is one method that can be used to overcome the problem of overdispersion in data that follows a normal distribution. The quasi-likelihood model discussed in this thesis is one model that can be used to overcome the problem of overdispersion in data that follows a multinomial distribution. The data used by the author for the application of the quasi-likelihood model is data on the satisfaction level of PDAM users in Antapani Wetan village in October 2019. Abstrak. Data diskrit adalah data yang berbentuk angka (bilangan) yang diperoleh dengan cara membilang. Sebagaimana yang diungkapkan oleh McCullagh dan Nelder (1989), masalah overdispersi akan sering dijumpai dalam analisis data diskrit, baik variabel respons yang berbentuk biner (dikotomus), cacahan, maupun struktur lebih dari dua kategori (polikotomus) seperti dalam model yang berdistribusi multinomial ini. Banyaknya kejadian dengan lebih dari dua kategorik dapat dinyatakan dengan mengikuti distribusi multinomial. Ada beberapa asumsi dasar yang harus dipenuhi pada saat mengaplikasikan model yang berdistribusi multinomial pada gugus data tertentu, salah satunya adalah bahwa variabel respon merupakan variabel acak yang saling bebas, dan peluang sukses dari suatu kejadian adalah konstan. Namun pada praktiknya tak jarang terjadi pelanggaran asumsi, di mana terdapat ketidakbebasan antar variabel acak. Ketidakbebasan antar variabel acak dimaknai sebagai adanya korelasi diantara variabel respon, hal tersebut merupakan suatu bukti indikasi bahwa terdapat masalah yang disebut overdispersi. Data dapat dinyatakan mengalami masalah overdispersi ketika nilai devians atau chi kuadrat Pearson yang lebih dari 1 (McCullagh & Nelder, 1989). Distribusi multinomial merupakan salah satu metode yang dapat digunakan untuk mengatasi masalah overdispersi pada data yang mengikuti distribusi normal. Model quasi-likelihood yang dibahas dalam skripsi ini merupakan salah satu model yang dapat digunakan untuk mengatasi masalah overdispersi pada data yang mengikuti distribusi multinomial. Data yang digunakan penulis untuk penerapan model quasi-likelihood adalah data tingkat kepuasan pengguna PDAM di kelurahan Antapani Wetan Bulan Oktober Tahun 2019.
Regresi Robust Estimasi-M dengan Pembobot Huber dan Tukey Bisquare pada Data Tingkat Pengangguran di Indonesia Menurut Provinsi Tahun 2020 Ranty Julianti Azizah; Lisnur Wachidah
Abstract. Regression analysis is a method to predict the value of dependent variable (Y) based on independent variable ( ), for that a regression model is needed. Regression model with Ordinary Least Square (OLS) is can’t be used if assumptions is violated. Unfulfilled assumptions can be caused by outliers that affect the regression model, both outliers in the independent variable ( ) and outliers in the dependent variable (Y). Robust regression is used so that the resulting regression model is Robust against outliers. One of the estimates from Robust regression is M-Estimator. The weights in the M-Estimator include of Huber and Tukey Bisquare. In this article, will discuss the M-Estimator Robust regression with Huber and Tukey Bisquare weighting on the unemployment rate data in Indonesia by province in 2020. The data includes the unemployment rate as the dependent variable (Y), the provincial minimum wage as the 1st independent variable. (X1), and the labor force as the 2nd independent variable (X2). Based on the research, it can be concluded that the M-Estimator with Tukey Bisquare weighting produces the best Robust regression model because the Adjusted R-square value of the Tukey Bisquare weighting is greater than the Huber weighting (45.88% > 44.34%) and the Residual Standard Error value (RSE) of the Tukey Bisquare weighting is smaller than the Huber weighting (1,214 < 1,345). Abstrak. Analisis regresi merupakan suatu metode untuk memprediksi nilai variabel tak bebas (Y) berdasarkan variabel bebasnya ( ), untuk itu diperlukan model regresi. Model regresi dengan Metode Kuadrat Terkecil (MKT) kurang tepat apabila terdapat pelanggaran asumsi. Asumsi yang tidak terpenuhi dapat disebabkan oleh adanya pencilan yang mempengaruhi model regresi, baik pencilan dalam variabel bebas ( ) maupun pencilan dalam variabel tak bebas (Y). Regresi Robust digunakan agar model regresi yang dihasilkan kekar (Robust) terhadap adanya pencilan. Salah satu estimasi dari regresi Robust yaitu Estimasi-M. Pembobot dalam Estimasi-M diantaranya pembobot Huber dan Tukey Bisquare. Dalam artikel ilmiah ini akan dibahas mengenai regresi Robust Estimasi-M dengan pembobot Huber dan Tukey Bisquare pada data tingkat pengangguran di Indonesia menurut provinsi tahun 2020. Data meliputi tingkat pengangguran terbuka sebagai variabel tak bebas (Y), upah minimum provinsi sebagai variabel bebas ke-1 (X1), dan angkatan kerja sebagai variabel bebas ke-2 (X2). Berdasarkan penelitian yang dilakukan dapat disimpulkan bahwa Estimasi-M dengan pembobot Tukey Bisquare menghasilkan model regresi Robust terbaik karena nilai Adjusted R-square dari pembobot Tukey Bisquare lebih besar daripada pembobot Huber (45,88% > 44,34%) dan nilai Residual Standard Error (RSE) dari pembobot Tukey Bisquare lebih kecil daripada pembobot Huber (1,214 < 1,345).
Penggunaan Small Area Estimation dengan Fay-Herriot pada Angka Partisipasi Kasar Perguruan Tinggi di Provinsi Jawa Barat Tahun 2019. Putri Alifia Azzahra; Nusar Hajarisman
Abstract. Education is one of the sustainable development goals (SDGs). To find out whether education can be said to be good, it can be calculated using one of the indicators, namely the Gross Enrollment Rate (GER). GER in Higher Education can show that people can take higher education. The Gross Higher Education Enrollment Rate (APK-PT) only reaches 30.28% of the 19-23 year old school-age population (BPS, 2019). If viewed according to province, West Java province has a fairly low value of the Higher Higher Education Gross Enrollment Rate (APK-PT) of 25.15%. In this study, the Small Area Estimation (SAE) method with the Fay Herriot method will be used. The Small Area Estimation method is used because this study only uses a small area. The purpose of this study was to determine the APK-PT equation model using SAE Fay Herriot, to know the comparison of estimates directly or indirectly, and to know the comparison of the coefficient of variation values ​​to evaluate the predicted results. In conducting the research, the data to be used is secondary data obtained from the Central Statistics Agency (BPS). The results of this study indicate that the model of SAE Fay Herriot is Y = 15.659257+0.288636 (Number of Universities in West Java) with the coefficient of variation of the direct estimator being greater than the coefficient of variation of the indirect estimator. Abstrak. Pendidikan merupakan salah satu tujuan pembangunan berkelanjutan atau Suistainable Development Goals (SDGs). Untuk mengetahui apakah pendidikan dapat dikatakan dengan baik, maka dapat dihitung menggunakan salah satu indikator yaitu Angka Partisipasi Kasar (APK). APK pada Perguruan Tinggi dapat menunjukkan bahwa masyarakat dapat menempuh pendidikan tinggi. Angka Partisipasi Kasar Perguruan Tinggi (APK-PT) hanya mencapai 30.28% dari populasi penduduk usia sekolah 19-23 tahun (BPS, 2019). Jika dilihat sesuai provinsi, provinsi Jawa Barat memiliki nilai Angka Partisipasi Kasar Perguruan Tinggi (APK-PT) cukup rendah yaitu 25.15%. Dalam penelitian ini akan menggunakan metode Small Area Estimation (SAE) dengan metode Fay Herriot. Digunakannya metode Small Area Estimation ini karena penelitian ini hanya menggunakan suatu area kecil. Tujuan dari penelitian ini adalah untuk mengetahui model persamaan APK-PT dengan menggunakan SAE Fay Herriot, dapat mengetahui perbandingan pendugaan secara langsung maupun tidak langsung, dan dapat mengetahui perbandingan nilai koefisien variasi untuk mengevaluasi terhadap hasil dugaan. Dalam melakukan penelitian, data yang akan dipakai merupakan data sekunder yang didapat dari Badan Pusat Statistik (BPS). Hasil dari penelitian ini menunjukkan bahwa, model dari SAE Fay Herriot adalah Y ̂= 15.659257+0.288636 (Jumlah Perguruan Tinggi di Jawa Barat) dengan nilai koefisien variasi penduga langsung lebih besar dari koefisien variasi penduga tidak langsung.
Metode Classification And Regression Trees untuk Pengklasifikasian Faktor-Faktor yang Mempengaruhi Pengangguran Terbuka di Provinsi Jawa Barat Tahun 2020 Seruni Purwanti Djuniar; Anneke Iswani Achmad
Abstract. CART (Classification And Regression Trees) is a classification method that uses historical data to build decision trees. The CART method is used to form a classification tree using the gini index value obtained from the probability value of each node candidate. The CART method used aims to look at the factors that influence open unemployment in West Java Province in 2020. In this study, the independent variables that affect open unemployment are gender (X1), age (X2), education (X3), and marital status (X4), while for the status variable in the household (X5) from the classification tree results indicate that this variable is not a differentiating variable. From the results of the classification tree research formed, the results obtained for respondents with low and high levels of education who are male, both married and unmarried are included in the working classification, while for respondents with low and high education levels, If a woman is not married, then she works, while if she is married, she is considered unemployed. And for respondents with secondary education level, both male and female, who are married or not included in the unemployment classification. In this study, the classification of open unemployment resulted in an accuracy of classification on the testing data of 69.79%. Abstrak. CART (Classification And Regression Trees) adalah metode klasifikasi yang menggunakan data historis untuk membangun pohon keputusan. Metode CART digunakan untuk membentuk pohon klasifikasi dengan menggunakan nilai indeks gini yang didapat dari nilai probabilitas setiap calon simpul. Metode CART yang digunakan bertujuan untuk melihat faktor-faktor yang mempengaruhi pengangguran terbuka di Provinsi Jawa Barat tahun 2020. Dalam penelitian ini, variabel bebas yang berpengaruh terhadap pengangguran terbuka yaitu jenis kelamin (X1), usia (X2), pendidikan (X3), dan status pernikahan (X4), sementara untuk variabel status dalam rumah tangga (X5) dari hasil pohon klasifikasi menunjukkan bahwa variabel tersebut bukanlah sebagai variabel pembeda. Dari hasil penelitian pohon klasifikasi yang terbentuk, maka didapatkan hasil untuk responden dengan tingkat pendidikan rendah serta tinggi yang berjenis kelamin laki-laki, baik yang sudah menikah maupun yang belum menikah termasuk ke dalam klasifikasi bekerja, sedangkan untuk responden dengan tingkat pendidikan rendah dan tinggi, yang berjenis kelamin perempuan jika belum menikah maka ia bekerja, sedangkan yang sudah menikah maka ia termasuk pengangguran. Dan untuk responden dengan tingkat pendidikan menengah dengan jenis kelamin laki-laki maupun perempuan, yang sudah menikah maupun belum termasuk ke dalam klasifikasi pengangguran. Dalam penelitian ini pula, pengklasifikasian pengangguran terbuka menghasilkan ketepatan klasifikasi pada data testing sebesar 69,79%.
Fixed Effect Panel Spatial Durbin Error Model pada Indeks Pembangunan Manusia di Jawa Barat Tahun 2017-2020 Tika Amalia; Lisnur Wachidah
Abstract. The statistical method used to determine the causal relationship of the independent variable to the dependent variable that has a dependency relationship between observations or regions is the spatial regression method. One approach in Spatial Regression Analysis is the Spatial Durbin Error Model (SDEM). Spatial Durbin Error Model (SDEM) is a regression model that has a spatial lag on the error variable (ɛ) and also on the independent variable (X). In addition, because the data used consists of cross-sectional units and time series, a panel data model is used with one approach, namely the fixed effect. In this study, the data used is the Human Development Index (HDI) data in West Java Province by Regency/City in 2017-2020. The variable used in this study is the Human Development Index (Y) as the dependent variable. Average Length of School (X1), Poor Population (X2), Life Expectancy (X3), Per capita Expenditure (X4), and Number of Health Facilities (X5) as independent variables. Based on the analysis, the Adjusted R-Square value is 99.99% and the five independent variables directly affect the Human Development Index, while the variables that have a spatial effect are Average Length of School, Number of Poor Population, and Number of Health Facilities. Abstrak. Metode statistika yang digunakan untuk menentukan hubungan sebab-akibat dari peubah bebas terhadap peubah tak bebas yang memiliki hubungan ketergantungan antar pengamatan atau wilayah adalah metode regresi spasial. Salah satu pendekatan dalam Analisis Regresi Spasial yaitu Spatial Durbin Error Model (SDEM). Spatial Durbin Error Model (SDEM) merupakan model regresi yang memiliki spasial lag pada variabel error (ɛ) dan juga pada variabel bebas (X). Selain itu, karena data yang digunakan terdiri dari unit cross-section dan time-series maka digunakan model data panel dengan salah satu pendekatan yaitu fixed effect. Dalam penelitian ini, data yang digunakan adalah data Indeks Pembangunan Manusia (IPM) di Provinsi Jawa Barat menurut Kabupaten/Kota tahun 2017-2020. Variabel yang digunakan pada penelitian ini yaitu Indeks Pembangunan Manusia (Y) sebagai variabel tak bebas. Rata-rata Lama Sekolah (X1), Penduduk Miskin (X2), Angka Harapan Hidup (X3), Pengeluaran Perkapita (X4), dan Jumlah Fasilitas Kesehatan (X5) sebagai variabel bebas. Berdasarkan analisis diperoleh nilai Adjusted R-Square sebesar 99,99% dan kelima variabel bebas tersebut berpengaruh secara langsung terhadap Indeks Pembangunan Manusia, sedangkan variabel yang memiliki spatial effect yaitu Rata-rata Lama Sekolah, Jumlah Penduduk Miskin, dan Jumlah Fasilitas Kesehatan.

