Recently Published

Plot
Statistics in Data Analysis
This is a presentation that explores the power of statistics in data analytics.
Level Risiko Investasi
Model yang digunakan dalam analisis di atas adalah Random Forest, yang merupakan algoritma pembelajaran mesin berbasis ensemble learning. Model ini menggabungkan beberapa pohon keputusan (decision trees) untuk meningkatkan akurasi prediksi, mengurangi overfitting, dan memberikan hasil yang lebih andal dibandingkan dengan model pohon keputusan tunggal. Dalam syntax tersebut, data awal dianalisis untuk memastikan tidak ada missing values, yang kemudian ditangani dengan metode imputasi MICE. Setelah itu, dataset dipra-proses untuk memastikan variabel numerik dan kategorikal sesuai untuk pelatihan model. Visualisasi seperti heatmap korelasi dan box plot membantu dalam memahami distribusi data dan hubungan antar variabel. Selanjutnya, model Random Forest dilatih menggunakan teknik cross-validation dengan hyperparameter tuning untuk mengoptimalkan kinerjanya. Hasilnya dievaluasi melalui confusion matrix, yang menunjukkan akurasi dan distribusi prediksi terhadap data validasi. Visualisasi matriks kebingungan dan feature importance memperlihatkan kontribusi masing-masing fitur dalam mempengaruhi prediksi risiko investasi. Secara keseluruhan, model ini menunjukkan performa yang baik, dengan akurasi tinggi pada data validasi dan data testing, sehingga dapat digunakan sebagai alat yang efektif untuk klasifikasi risiko investasi.
Assignment 5
Document
Reliability_AoHP_24
Fatal Encounters Analysis
This is a mini assignment for CP8883 Fall 2024 Introduction to Urban Analytics at Georgia Institute of Technology.
MANERR
Progress updates