Skip to content

Modelo de machine learning para predecir la demanda horaria de taxis en aeropuertos, optimizando la disponibilidad de conductores en horas pico mediante series temporales y remuestreo.

Notifications You must be signed in to change notification settings

alexkhype/03Python-TimeSeriesForecaster

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 

Repository files navigation

Predicción de Taxis Necesarios por Hora

Tabla de Contenidos

Descripción

Este proyecto predice la cantidad de taxis necesarios por hora en aeropuertos para optimizar la disponibilidad de conductores durante las horas pico, usando modelos de machine learning basados en series temporales y remuestreo horario.

Datos

Se utilizó un conjunto de datos principal:

  • taxi.csv: DataFrame con 26,496 registros horarios de marzo a agosto de 2018, que contiene el número de órdenes de taxis en aeropuertos para cada intervalo.

Análisis

  • Se analizó el histórico de órdenes de taxis horario entre marzo y agosto de 2018, identificando tendencias y estacionalidades diarias y semanales.
  • Se comprobó estacionariedad con prueba ADF y se seleccionaron variables predictivas clave usando ACF y PACF.
  • Se crearon características adicionales como medias móviles y variables de tiempo para mejorar la precisión.
  • Se dividió el dataset para una validación robusta evitando información futura en el modelo.
  • Se entrenaron y ajustaron múltiples modelos, incluyendo regresión lineal, DecisionTree, RandomForest, LGBM y CatBoost, usando GridSearchCV y validación cruzada específica para series temporales.

Tecnologías y herramientas

  • Python 3.9 para desarrollo y análisis
  • Pandas, NumPy para manipulación y análisis de datos
  • Matplotlib, sktime para visualización de series temporales
  • statsmodels para análisis estadístico y diagnóstico de series temporales
  • Scikit-learn, LightGBM, CatBoost, XGBoost para modelado y validación de machine learning
  • Jupyter Notebook para desarrollo interactivo y documentación del proyecto

Resultados

  • Modelos de boosting como LGBMRegressor y CatBoostRegressor superaron a los modelos base y de árbol tradicionales en RMSE.
  • LGBMRegressor mostró mejor precisión para anticipar picos de demanda en horas críticas.
  • CatBoostRegressor ofrece predicciones más estables pero menos sensibles a extremos.
  • El modelo base de regresión lineal logró un RMSE de referencia de 46.02.
  • La selección del modelo depende de la prioridad: exactitud en picos o estabilidad en predicciones.

Contribuciones

Bienvenidas sugerencias, correcciones y nuevas visualizaciones. Por favor, abre un issue o pull request para colaborar.

Licencia

Este proyecto está bajo la licencia MIT.

Contacto

Nombre: Alejandro M. García
Email: alexkhype@gmail.com
LinkedIn: linkedin.com/in/amggl

About

Modelo de machine learning para predecir la demanda horaria de taxis en aeropuertos, optimizando la disponibilidad de conductores en horas pico mediante series temporales y remuestreo.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published