gravatar

muharima_sahara

Muharima Sahara

Recently Published

Keg 8 - Bootstrap pada Regresi dan Missing Value
ada praktikum ini dilakukan analisis bootstrap pada regresi linear dengan data yang memiliki missing value. Data simulasi dibangkitkan sebanyak 120 observasi dengan hubungan linear antara variabel x dan y, kemudian ditambahkan missing value secara acak pada variabel x. Analisis dilakukan menggunakan tiga pendekatan yaitu data lengkap, mean imputation + bootstrap, dan multiple imputation menggunakan metode MICE. Hasil menunjukkan bahwa estimasi slope dari ketiga metode relatif mirip, namun metode MICE memberikan hasil yang lebih baik karena mampu mempertahankan variasi data dibandingkan mean imputation yang cenderung menghasilkan bias.
Keg 7 - Pembangkitan Data Time Series
Pada kegiatan ini dilakukan simulasi pembangkitan data time series menggunakan model ARIMA(1,1,1) dengan parameter yang berbeda dari contoh, yaitu nilai AR = 0,4 dan MA = 0,6. Data simulasi dibangkitkan sebanyak 200 observasi menggunakan software R. Selanjutnya dilakukan tahapan pemodelan time series secara lengkap, dimulai dari identifikasi awal melalui plot ACF dan PACF, pengujian kestasioneran menggunakan Augmented Dickey-Fuller (ADF) test, proses differencing untuk membuat data menjadi stasioner, kemudian identifikasi ulang melalui ACF, PACF, dan EACF untuk menentukan kandidat model. Setelah itu dilakukan estimasi beberapa kandidat model ARIMA dan pemilihan model terbaik berdasarkan nilai AIC terkecil. Hasil model terbaik kemudian dibandingkan dengan model awal hasil pembangkitan untuk mengetahui apakah keduanya sama atau berbeda. Dari analisis diperoleh bahwa model terbaik tidak selalu sama dengan model pembangkitan awal karena dipengaruhi oleh unsur random pada simulasi, ukuran sampel, serta proses estimasi model.
Simulasi Estimasi Parameter Model Regresi Logistik pada Studi Kasus Prediksi Risiko Diabetes
Studi simulasi ini bertujuan mengevaluasi kualitas estimasi parameter model regresi logistik biner menggunakan metode Maximum Likelihood Estimation (MLE) pada kasus prediksi risiko diabetes. Model yang digunakan melibatkan dua prediktor klinis, yaitu kadar gula darah (X1) dan Indeks Massa Tubuh/BMI (X2), dengan parameter sejati yang telah ditetapkan sebagai acuan simulasi. Simulasi dirancang dalam dua skenario utama: (1) variasi ukuran sampel dengan tiga level yaitu n = 50, n = 200, dan n = 1.000 yang merepresentasikan kondisi klinik pratama hingga rumah sakit umum, serta (2) adanya kesalahan pencatatan data sebesar 10% pada nilai kadar gula darah yang mensimulasikan permasalahan rekam medis di lapangan. Setiap skenario dijalankan sebanyak 100 replikasi menggunakan seed yang dapat direplikasi. Kualitas estimasi dievaluasi berdasarkan tiga ukuran, yaitu Bias, Variansi, dan Mean Squared Error (MSE). Hasil simulasi menunjukkan bahwa estimator MLE bersifat konsisten — semakin besar ukuran sampel, semakin kecil bias dan MSE. Temuan penting lainnya adalah bahwa kesalahan pencatatan 10% terbukti lebih merusak kualitas estimasi dibandingkan kondisi sampel yang sangat kecil, menegaskan bahwa kualitas data lebih dominan daripada kuantitas data dalam pemodelan statistika.
Estimasi Distribusi dan Parameter Model
Konsep estimasi distribusi dan parameter model melalui pendekatan simulasi menggunakan R. Topik yang dibahas meliputi Teorema Limit Pusat, ketakbiasan penduga parameter, dan selang kepercayaan. Setiap konsep dijelaskan secara teoritis dan dibuktikan melalui aplikasi langsung di R.
Ketidakpastian Estimasi
Menyajikan simulasi menggunakan R untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), dan pengetahuan tentang standar deviasi populasi terhadap lebar interval kepercayaan 95%. Hasil simulasi menunjukkan bahwa ukuran sampel yang lebih besar menghasilkan interval kepercayaan yang lebih sempit, sedangkan variabilitas data yang lebih tinggi menghasilkan interval yang lebih lebar. Selain itu, penggunaan distribusi t ketika standar deviasi populasi tidak diketahui menghasilkan interval kepercayaan yang sedikit lebih luas dibandingkan distribusi normal.
Simulasi Variabel Random
Dokumen ini berisi simulasi variabel random diskrit dan kontinu menggunakan R. Distribusi yang dibahas meliputi Uniform, Binomial, Normal, Poisson, dan Eksponensial. Setiap distribusi disimulasikan dan divisualisasikan untuk memahami karakteristiknya. Selain itu, disajikan studi kasus simulasi pendapatan dan jumlah pelanggan untuk menghitung rata-rata serta probabilitas kejadian tertentu berdasarkan data simulasi.
Latihan Dasar Software untuk Simulasi - Week 2
Praktikum ini membahas dasar pemrograman R dalam pengolahan data, meliputi operasi aritmetika, pembuatan variabel, serta penggunaan struktur data seperti vektor, faktor, list, dataframe, dan array. Selain itu, dilakukan latihan pembuatan barisan bilangan, manipulasi data dengan seq() dan rep(), simulasi data acak menggunakan sample(), serta pembuatan dataframe studi kasus UMKM dan analisis menggunakan summary().