Plataforma de Análisis Inteligente del Sistema Eléctrico Español
"La verdadera inteligencia artificial comienza con datos en los que se puede confiar"
El 28 de abril de 2025, la Península Ibérica sufrió el apagón eléctrico más significativo de las últimas décadas. Un fallo en la red provocó la caída abrupta de la demanda a niveles técnicos de cero, afectando a millones de usuarios durante horas. Las causas exactas siguen sin esclarecerse completamente.
Enerlytics nació como una investigación forense de este evento, pero rápidamente se transformó en algo más ambicioso: una plataforma integral de ingeniería de datos que integra múltiples fuentes heterogéneas del sistema eléctrico español, construyendo la infraestructura necesaria para análisis profundos y confiables.
- Integrar datos de generación eléctrica, demanda, precios de mercado y variables climáticas
- Implementar un pipeline end-to-end siguiendo la arquitectura Medallion (Bronze → Silver → Gold)
- Crear un modelo dimensional optimizado para análisis mediante star schema
- Desarrollar dashboards interactivos en Power BI para visualización de métricas clave
- Garantizar la calidad, trazabilidad y reproducibilidad de todo el proceso
┌─────────────────┐
│ DATA SOURCES │
│ REData, ESIOS │
│ Open-Meteo │
└────────┬────────┘
│
▼
┌─────────────────┐
│ BRONZE LAYER │ ← Datos crudos JSON/Delta
│ (Raw Data) │ Sin transformaciones
└────────┬────────┘
│
▼
┌─────────────────┐
│ SILVER LAYER │ ← Limpieza, deduplicación
│ (Curated Data) │ Normalización temporal
└────────┬────────┘ Validación de calidad
│
▼
┌─────────────────┐
│ GOLD LAYER │ ← Modelo dimensional
│ (Business Data) │ Star schema optimizado
└────────┬────────┘
│
▼
┌─────────────────┐
│ POWER BI │ ← Dashboards interactivos
└─────────────────┘
- Microsoft Fabric: Plataforma principal (Lakehouse, Notebooks PySpark, orquestación)
- Delta Lake: Almacenamiento con transacciones ACID y versionado
- Power BI: Visualización y reporting
- Python/PySpark: Procesamiento y transformación de datos
- GitHub: Control de versiones y gestión de proyecto (metodología Scrum/Agile)
energy-management-control/
├── .github/ # Configuración de GitHub
│ ├── CONTRIBUTING.md # Normas de contribución
│ └── pull_request_template.md
│
├── notebooks/ # Notebooks de análisis
│ ├── bronze/ # Ingesta de datos crudos
│ ├── silver/ # Limpieza y normalización
│ └── gold/ # KPIs y modelo dimensional
│
├── data/ # Datos locales (gitignored)
│
├── docs/ # Documentación técnica
│
├── requirements.txt # Dependencias Python
└── README.md # Este archivo- Lakehouse (OneLake): Almacenamiento en capas Bronze/Silver/Gold
- Notebooks: Extracción y procesamiento con PySpark/Python
- Power BI: Dashboards y visualización integrada
- Versionado de código (notebooks exportados, scripts)
- Gestión de issues, milestones y Pull Requests
- Documentación técnica en
/docs - Automatización del backlog mediante GitHub Projects
⚠️ Los datos NO se guardan en GitHub, solo el código y documentación. Los datos viven en Fabric/OneLake.
| Fuente | API | Datos Clave |
|---|---|---|
| REData | Red Eléctrica de España | Demanda, generación por tecnología, balance eléctrico, emisiones CO₂ |
| ESIOS | Sistema de Información del Operador | Precios SPOT horarios, previsiones de demanda, métricas de balance |
| Open-Meteo | Weather API | Temperatura, viento, precipitaciones, radiación solar |
Cobertura: 20 comunidades autónomas + sistemas insulares (Canarias, Baleares) + territorios (Ceuta, Melilla)
Período: Enero 2023 - Junio 2025 (mensual)
- Datos crudos desde APIs en formato JSON
- Metadata enriquecida con timestamps de captura
- Sistema de logging y control de duplicados
- Deduplicación mediante claves de negocio
- Corrección de zonas horarias (UTC → hora peninsular)
- Eliminación de campos decorativos y nulos
- Validación de integridad y análisis exploratorio
- Dimensiones:
dim_date,dim_geography,dim_technology - Hechos:
fact_generation_month - Star schema optimizado para Power BI
- Particionamiento estratégico por año
- Generación y Demanda por Tecnología: Balance interno y déficit/superávit energético
- Distribución Geográfica: Mix energético por comunidad autónoma
- Evolución de Renovables: Tendencias de solar, eólica e hidráulica
- Análisis Climático: Correlación temperatura-demanda, viento-eólica, precipitaciones-hidráulica
- Análisis del Apagón de Abril 2025: Comparativa con 2024 y descarte de causas climáticas
- Ver
.github/CONTRIBUTING.md - Todas las ramas y commits deben estar en inglés
- Cada PR debe estar vinculado a una issue
- Los notebooks se exportan desde Fabric como
.ipynbpara versionado en GitHub
- ✅ Pipeline completo Bronze → Silver → Gold operativo
- ✅ Modelo dimensional con integridad referencial verificada
- ✅ Eliminación de 720 registros duplicados (3% del total)
- ✅ Corrección sistémica del problema de conversión de zonas horarias
- ✅ Dashboards interactivos con filtros dinámicos en Power BI
- Completar integración de datos horarios de ESIOS
- Ampliar dashboards con análisis de precios de mercado
- Automatización completa de pipelines
- Análisis predictivo de demanda con Machine Learning
- Sistema de alertas ante anomalías en el sistema
- Cálculo de emisiones CO₂ totales por comunidad autónoma
- Sistema multiagente para simulación de gestión energética
- API propia para consumo externo de datos procesados
- Análisis forense detallado del apagón con datos subhorarios
Ver /docs para documentación detallada:
Factoría F5 - Bootcamp de Inteligencia Artificial
Período: 15 septiembre - 17 octubre 2025
| Nombre | Responsabilidad |
|---|---|
| Andrea Alonso | REData - Red Eléctrica de España, Scrum Master |
| Anca Bacria | OMIE y REData (Mercados) |
| Max Beltrán | ESIOS - Datos del sistema eléctrico |
| Fernando García | Orquestación de pipelines y Data Analytics |
| Alla Haruty | Open-Meteo - Datos climáticos |
Tutor/Stakeholder: Alfonso del Valle Lima (Microsoft)
Este proyecto ha sido desarrollado con fines académicos como parte del Bootcamp de IA de Factoría F5.
- Red Eléctrica de España - API REData
- ESIOS - Sistema de Información del Operador
- Open-Meteo - Weather API
- OMIE - Operador del Mercado Ibérico
Enerlytics - Transformando datos eléctricos en conocimiento confiable