Pipeline de Predicción de Demanda en Retail (End-to-End)

Este repositorio contiene el código fuente y la documentación técnica de un Trabajo de Fin de Grado (TFG) centrado en la predicción de series temporales para el sector retail.

El proyecto implementa un flujo de trabajo comparativo robusto que evalúa tres enfoques distintos: un Baseline Ingenuo (Media Móvil), modelos estadísticos clásicos (ARIMA/SARIMAX) y algoritmos modernos de Machine Learning Supervisado (Gradient Boosting).

Objetivo del Proyecto

Optimizar la precisión del pronóstico de ventas a nivel de tienda y producto para mejorar la planificación de inventario, minimizar costes de almacenamiento y evitar roturas de stock.

Metodología y Arquitectura

El desarrollo se estructura en un único pipeline secuencial (Pipeline_Prediccion_Demanda.ipynb) que abarca las siguientes fases:

1. Análisis Exploratorio de Datos (EDA)

Estudio exhaustivo de la naturaleza de la serie temporal:

Descomposición: Análisis de componentes de Tendencia, Estacionalidad y Residuo.
Tests de Estacionariedad: Aplicación de pruebas (Dickey-Fuller) para validar la estabilidad de la serie.
Autocorrelación: Gráficos ACF y PACF para identificar patrones temporales.

2. Baseline y Modelado Estadístico

Para validar la eficacia del Machine Learning, establecemos dos puntos de referencia:

Media Móvil (Baseline): Modelo simple de ventana deslizante para establecer el error mínimo aceptable.
ARIMA / SARIMAX (Benchmark): Implementación de modelos econométricos clásicos. Se utiliza pmdarima para la selección automática de hiperparámetros (p,d,q) basada en la optimización del criterio AIC.

3. Machine Learning Avanzado (Skforecast)

Transformación del problema de series temporales en un problema de regresión supervisada:

Ingeniería de Features: Creación de variables exógenas, retardos (lags) y ventanas móviles (rolling statistics).
Modelo: Entrenamiento de un Regresor de Gradient Boosting (LightGBM/XGBoost) capaz de capturar relaciones no lineales complejas.
Validación: Uso de ForecasterRecursive para predicciones multi-step.

Stack Tecnológico

Lenguaje Principal: Python 3.x
Orquestación de Forecasting: skforecast.
Modelado Estadístico: pmdarima, statsmodels.
Machine Learning: scikit-learn, lightgbm.
Manipulación de Datos: pandas, numpy.
Visualización: matplotlib, seaborn, plotly.

Instalación y Ejecución

Sigue estos pasos para reproducir el análisis en tu entorno local.

Prerrequisitos

Python 3.8 o superior.
Jupyter Lab o VS Code.

Pasos de Instalación

Clonar el repositorio:

git clone [https://github.com/danielfernandezf/prediccion-demanda-retail.git](https://github.com/danielfernandezf/prediccion-demanda-retail.git)
cd prediccion-demanda-retail

Configurar el Entorno Virtual (Recomendado):

# Windows
python -m venv venv
.\venv\Scripts\activate

# Mac/Linux
python3 -m venv venv
source venv/bin/activate

Instalar Dependencias:
```
pip install -r requirements.txt
```
Ejecutar el Pipeline: Abre el proyecto en Jupyter y ejecuta todas las celdas:
```
jupyter lab Pipeline_Prediccion_Demanda.ipynb
```

Resultados y Conclusiones

El rendimiento se evaluó comparando las métricas de error (RMSE y MAE) entre los tres enfoques: Baseline, Estadístico y Machine Learning.

Conclusión: El modelo de Gradient Boosting demostró ser superior tanto al Baseline (Media Móvil) como al enfoque estadístico tradicional (ARIMA), logrando una mejor generalización ante picos de demanda y estacionalidades complejas.

Autor: Daniel Fernández Ingeniero de Software & Data Scientist

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
data		data
Pipeline_Prediccion_Demanda.ipynb		Pipeline_Prediccion_Demanda.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Pipeline de Predicción de Demanda en Retail (End-to-End)

Objetivo del Proyecto

Metodología y Arquitectura

1. Análisis Exploratorio de Datos (EDA)

2. Baseline y Modelado Estadístico

3. Machine Learning Avanzado (Skforecast)

Stack Tecnológico

Instalación y Ejecución

Prerrequisitos

Pasos de Instalación

Resultados y Conclusiones

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Pipeline de Predicción de Demanda en Retail (End-to-End)

Objetivo del Proyecto

Metodología y Arquitectura

1. Análisis Exploratorio de Datos (EDA)

2. Baseline y Modelado Estadístico

3. Machine Learning Avanzado (Skforecast)

Stack Tecnológico

Instalación y Ejecución

Prerrequisitos

Pasos de Instalación

Resultados y Conclusiones

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages