Recently Published

Tasa Neta de Matrícula (TNM) de 5 años - 2024
Mide la proporción de niñas y niños de 5 años de edad que se encuentran matriculados en el nivel Inicial de la Educación Básica Regular, en relación con la población total de la misma edad.
Nonparametric Reliability Estimation with Simultaneous Confidence Bands: Bootstrap versus Borell-TIS
Reliability analysis studies how long a system or component continues to perform its intended function before failure. When lifetimes are subject to right-censoring, meaning some units have not failed by the end of observation, the Kaplan–Meier (KM) estimator provides a nonparametric estimate of the reliability (or survival) function: R(t) = P(T > t), where T denotes lifetime.
Tasa Total de Matrícula (TTM) de 0 a 2 años - 2024
Tasa Total de Matrícula (TTM) de 0 a 2 años mide la proporción de la población de 0 a 2 años de edad matriculada en el Ciclo I del nivel Inicial de la Educación Básica Regular y de la Educación Básica Especial, en relación con la población total de ese mismo rango de edad.
Setup Instructions
This document provides instructions on how to download and install the software and tools needed for HGEN 611: Data Science I
Tasa Neta de Matrícula (TNM) de 0 a 2 años - 2024
La Tasa Neta de Matrícula (TNM) mide la proporción de la población de 0 a 2 años de edad que se encuentra matriculada en el Ciclo I del nivel Inicial de la Educación Básica Regular, en relación con la población total de ese mismo rango de edad.
"Actuarial Claim Cost Modeling: Comparing Linear Regression, Tweedie GLM, and XGBoost Ensembles"
A practical comparison of four approaches for modeling insurance claim costs – Linear Regression, Two‑Part (Logistic+Gamma), Tweedie GLM, and XGBoost with Tweedie loss. Using simulated car insurance data, this project demonstrates the actuarial edge of the Tweedie distribution for zero‑inflated, skewed claim data. All models perform similarly, with XGBoost achieving a marginal 2.21% RMSE improvement. The real value lies in feature importance – revealing past claims and mileage as the strongest predictors.
Multiple Linear Regression
Document
Obesity
Obesity is a growing global health concern strongly linked to behavioral and lifestyle factors such as diet, physical activity, alcohol consumption, and transportation habits. This project proposes a categorical data analysis approach to uncover direct statistical associations and visualization of how lifestyle behaviors correspond with obesity categories, providing an interpretable and health-relevant perspective.