Skip to content

Stronauta/MLB-Performance-Analytics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 

Repository files navigation

⚾ MLB-Performance-Analytics

Proyecto Final - Módulo 6 | Data Science & Machine Learning

Python Scikit-Learn Pandas MLB

Este repositorio contiene el desarrollo del Proyecto Final del Módulo 6, enfocado en la clasificación y análisis del rendimiento ofensivo de jugadores de la MLB utilizando técnicas avanzadas de Machine Learning.

📋 Descripción del Proyecto

El objetivo principal de este proyecto es demostrar cómo los modelos de Machine Learning pueden identificar patrones complejos en estadísticas de béisbol para diferenciar perfiles ofensivos.

Para este análisis, desarrollamos tres variables objetivo clave para clasificar a los bateadores:

  • 🏆 Rendimiento General: Evaluación del aporte estándar y consistencia del jugador en el campo.
  • 💎 Nivel Elite: Identificación de jugadores con un desempeño excepcionalmente alto (outliers positivos).
  • 👁️ Disciplina en el Plato: Análisis de la capacidad del bateador para tomar decisiones correctas y su control de la zona de strike.

🚀 Características Principales

  • Ingeniería de Variables (Feature Engineering): Creación de métricas personalizadas a partir de datos brutos de Statcast para capturar la esencia del juego.
  • Análisis Multidimensional: Integración de métricas tradicionales (AVG, HR) con estadísticas avanzadas de última generación.
  • Modelos de Clasificación: Implementación y optimización de modelos Random Forest para determinar qué variables impactan más en el éxito de un bateador.

🛠️ Tecnologías Utilizadas

Herramienta Uso
Python Lenguaje principal de desarrollo.
Pandas Manipulación, limpieza y transformación de datos.
Matplotlib / Seaborn Visualización de datos y análisis exploratorio.
Scikit-Learn Construcción, entrenamiento y evaluación de modelos de ML.

📊 Visualizaciones

Nota: Aquí puedes ver algunos de los resultados clave obtenidos tras el entrenamiento del modelo.

📈 Rendimiento y Disciplina

El análisis comenzó comparando cómo la disciplina en el plato se relaciona con el rendimiento general de los bateadores.

Disciplina vs Rendimiento

🧠 Importancia de las Variables (Feature Importance)

Utilizamos modelos de Random Forest para identificar qué métricas son las que realmente definen a un jugador en las tres categorías analizadas:

Disciplina en el Plato Rendimiento General

💎 Identificación de Jugadores Élite

El modelo permite distinguir qué factores separan a un jugador promedio de uno Élite, destacando métricas como el wOBA (Weighted On-Base Average).

Variables Elite
Factores clave para determinar el estatus Elite.

wOBA Elite vs No Elite


📝 Nota: Este proyecto fue desarrollado con fines académicos para el Módulo 6 del programa de Ciencia de Datos.

About

Análisis de Rendimiento de la MLB: Análisis y clasificación basados ​​en aprendizaje automático del rendimiento de los bateadores de la MLB. Uso de Bosques Aleatorios para identificar bateadores de élite y patrones de disciplina en el plato mediante datos de Statcast.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors