Recently Published
3. Inventario Nacional Gases Efecto Invernadero
Inventario_Nacional_Gases_Efecto_Invernadero
1. Análisis y Optimización del Inventario Nacional de Emisiones de Gases de Efecto Invernadero (GEI)
Este proyecto presenta un flujo de trabajo integral para la limpieza, estructuración y visualización del Inventario Nacional de Gases de Efecto Invernadero con corte a enero de 2026. El objetivo principal es transformar un dataset crudo de alta complejidad en una herramienta de consulta jerarquizada que permita identificar con precisión las fuentes de emisión más críticas a nivel nacional.
Depuración y Eliminación de Registros Duplicados en los Microdatos del Saber 11 (2010–2022)
Se realizó un proceso de depuración para identificar y eliminar registros duplicados en los microdatos del Saber 11 del periodo 2010–2022.
Division Saber 11 por año (2010 - 2022)
Tras importar el archivo original con millones de registros (DB Saber 11 - 2010-2022 de Datos Abiertos Colombia), se verificó su estructura y calidad mediante funciones de inspección, y se estandarizó la variable PERIODO para extraer el año correspondiente a cada observación. Esta nueva variable, ANIO, facilitó la segmentación cronológica y sentó las bases para el ordenamiento histórico del conjunto de datos.
1_Data Understanding — Saber 11 (2022)
Preparación y diagnóstico de datos del proyecto, antes de aplicar modelado.
Estimación de un dominio: Aplicación
Ejemplo Hogares - Marco Muestral.xls seleccione una muestra por MAS(N,10)
Dominio Hogares.xls estime en Excel el cuadro de salida solicitado por el cliente.
Dominio Hogares.xls asigne arbitrariamente los códigos de hogares seleccionados en el literal 1 y documente la base.
Diseño Muestral para la Evaluación del Programa IRACA en las Comunidades Étnicas en Colombia
El Programa IRACA (Infraestructura Rural en Áreas de Comunidades Étnicas) busca mejorar la calidad de vida de los hogares en las comunidades indígenas y afrodescendientes en Colombia. Por lo que es importante realizar una evaluación para medir los impactos de este programa y garantizar la equidad en las intervenciones.
Creditos al Dr. Giovany Bavativa
PhD en Estadística, MSc en Big Data, MSc en Estadística
Modelos Lineales Generalizados
Los modelos lineales generalizados (GLM, por sus siglas en inglés) son una extensión de los modelos lineales clásicos que permiten manejar una variedad más amplia de distribuciones de respuesta y relaciones entre las variables.
TALLER 3. DISTRIBUCIONES DE PROBABILIDAD
El análisis de problemas probabilísticos y estadísticos es fundamental para entender cómo se comportan ciertos fenómenos y tomar decisiones informadas basadas en datos. Los ejercicios presentados abarcan una variedad de contextos y aplicaciones de diferentes modelos probabilísticos y distribuciones estadísticas. A través de la resolución de estos problemas, se busca ilustrar cómo se aplican conceptos clave de la teoría de probabilidad y estadísticas en situaciones prácticas y reales.
Probabilidad
mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles.
Introduccion a la Probabilidad y Estadistica Parte 1
La estadística es una rama de las matemáticas que se enfoca en el estudio de los métodos para recoger, organizar, analizar e interpretar datos con el objetivo de sacar conclusiones válidas y tomar decisiones fundamentadas. Dentro de este campo, la probabilidad juega un papel crucial al proporcionar un marco teórico para la inferencia estadística. Este trabajo científico explora diversos conceptos fundamentales en estadística, como la organización de datos, tipos de variables, y medidas estadísticas esenciales, utilizando fórmulas y ejemplos prácticos.