Este repositorio contiene el desarrollo del Proyecto Final del Módulo 6, enfocado en la clasificación y análisis del rendimiento ofensivo de jugadores de la MLB utilizando técnicas avanzadas de Machine Learning.
El objetivo principal de este proyecto es demostrar cómo los modelos de Machine Learning pueden identificar patrones complejos en estadísticas de béisbol para diferenciar perfiles ofensivos.
Para este análisis, desarrollamos tres variables objetivo clave para clasificar a los bateadores:
- 🏆 Rendimiento General: Evaluación del aporte estándar y consistencia del jugador en el campo.
- 💎 Nivel Elite: Identificación de jugadores con un desempeño excepcionalmente alto (outliers positivos).
- 👁️ Disciplina en el Plato: Análisis de la capacidad del bateador para tomar decisiones correctas y su control de la zona de strike.
- Ingeniería de Variables (Feature Engineering): Creación de métricas personalizadas a partir de datos brutos de Statcast para capturar la esencia del juego.
- Análisis Multidimensional: Integración de métricas tradicionales (AVG, HR) con estadísticas avanzadas de última generación.
- Modelos de Clasificación: Implementación y optimización de modelos Random Forest para determinar qué variables impactan más en el éxito de un bateador.
| Herramienta | Uso |
|---|---|
| Python | Lenguaje principal de desarrollo. |
| Pandas | Manipulación, limpieza y transformación de datos. |
| Matplotlib / Seaborn | Visualización de datos y análisis exploratorio. |
| Scikit-Learn | Construcción, entrenamiento y evaluación de modelos de ML. |
Nota: Aquí puedes ver algunos de los resultados clave obtenidos tras el entrenamiento del modelo.
El análisis comenzó comparando cómo la disciplina en el plato se relaciona con el rendimiento general de los bateadores.
Utilizamos modelos de Random Forest para identificar qué métricas son las que realmente definen a un jugador en las tres categorías analizadas:
| Disciplina en el Plato | Rendimiento General |
|---|---|
![]() |
![]() |
El modelo permite distinguir qué factores separan a un jugador promedio de uno Élite, destacando métricas como el wOBA (Weighted On-Base Average).
Factores clave para determinar el estatus Elite.
📝 Nota: Este proyecto fue desarrollado con fines académicos para el Módulo 6 del programa de Ciencia de Datos.



