Recently Published

Data607_Final_Presentation
Feb Prec Debias
Tps spline, no set lambda, 10% US stations used for training 90% for testing
Document
PRUEBAT
Jan Prec Debias
Tps spline, no set lambda, 10% US stations used for training 90% for testing
Prova_Visualição_Dados
Códigos e visualização do dashboard referente aos exercícios de 1.1 a 1.4 da prova da disciplina Visualização de Dados.
Sentiment Analysis
Document
Routine Checkup as a Predictor of Diabetes (BRFSS 2011 - 2023)
This analysis uses Texas BRFSS data from 2011–2023 to estimate survey-weighted logistic regressions of diagnosed diabetes on routine checkup status, evaluated separately by year. The objective is to assess whether associations between recent healthcare contact and diagnosed diabetes are stable over time or reflect diagnosis and detection dynamics rather than underlying disease risk.
Income as a Predictor of Diabetes (BRFSS 2011 - 2023)
This analysis uses Texas BRFSS data from 2011–2023 to estimate year-by-year survey-weighted logistic regressions of diagnosed diabetes on household income categories. Income is harmonized across years and analyzed one year at a time to evaluate whether its association with diagnosed diabetes is stable or sensitive to survey design and missing-data constraints.
PROVA FINAL – CDBD - Visualização de Dados
Este dashboard constitui a avaliação final da disciplina CDBD – Visualização de Dados, integrante da Especialização em Ciência de Dados e Big Data. O projeto visa demonstrar a aplicação prática dos fundamentos de visualização analítica utilizando a linguagem R e o ecossistema ggplot2. A visualização de dados é aqui tratada como uma ferramenta estratégica de comunicação. O objetivo central é converter estruturas de dados abstratas em representações visuais que permitam a cognição imediata de padrões, tendências e anomalias. Adota-se o princípio da eficiência gráfica, priorizando a clareza e a redução da carga cognitiva em detrimento de elementos puramente decorativos. O trabalho estrutura-se em exercícios práticos que abordam: 1.Análise de Correlação: Uso de gráficos de dispersão para variáveis contínuas. 2.Análise de Frequência: Uso de gráficos de barras ordenados para variáveis categóricas. 3.Análise de Distribuição: Uso de boxplots para medidas de posição e dispersão. 4.Fundamentos Teóricos: Discussão sobre Overplotting e a Gramática dos Gráficos. Os exemplos utilizam os datasets clássicos mtcars e diamonds.
Health Insurance Coverage as a Predictor of Diabetes (BRFSS 2011 - 2023)
This analysis uses Texas BRFSS data from 2011–2023 to estimate year-by-year survey-weighted logistic regressions of diagnosed diabetes on health insurance coverage. Insurance is coded consistently across years and evaluated one year at a time to assess whether its association with diagnosed diabetes is stable or varies over time.