Recently Published
NBA_Analytics
El dataset recoge métricas de más de 28.000 partidos y el trabajo se divide en dos grandes bloques:
Regresión — predicción de los puntos anotados en la zona restringida, comparando regresión lineal simple y múltiple, árbol de regresión y Random Forest.
Clasificación — predicción del ganador del partido usando regresión logística, Random Forest, Boosting (GBM) y árbol de decisión. El mejor modelo alcanza un 63.7% de accuracy prediciendo con solo estadísticas de juego, un 13% por encima del azar.
Todo el análisis está hecho en R (tidyverse, caret, randomForest, gbm) con visualizaciones personalizadas y validación cruzada en todos los modelos.
Agata Station Temperature Comparisons
A study of warming in Siberia and the Arctic Circle.
Titanic Analysis - EDA
In this analysis, we will be evaluating the Titanic dataset. The data
dictionary is as follows:
- Passengerid: Passenger ID
- Age: Age in years
- Fare: Passenger fare
- Sex: Sex (female, male)
- Sibsp: \# of siblings/spouses aboard the Titanic (Sibling = brother,
sister, stepbrother, stepsister ; Spouse = husband, wife )
- Parch: \# of parents/children aboard the Titanic (Parent = mother,
father; Child = daughter, son, stepdaughter, stepson)
- Pclass: Ticket class (1 = 1st class, 2 = 2nd class, 3 = 3rd class)
- Embarked: Port of Embarkation (C = Cherbourg, Q = Queenstown, S =
Southampton)
- Survived: Survival (0 = No, 1 = Yes)
- Cabin: Cabin number
- Ticket: Ticket number