Skip to content

MonicaFernandezM/investigate_a_dataset

Repository files navigation

Medical Appointments No-Show Analysis

Este proyecto analiza un conjunto de datos reales de citas médicas en Brasil para investigar los factores que afectan la asistencia de los pacientes. El objetivo principal es identificar patrones que puedan ayudar a mejorar la tasa de asistencia a las citas médicas.

📊 Descripción del Dataset

El conjunto de datos contiene información sobre más de 100.000 citas médicas en Brasil, incluyendo:

  • Género y edad del paciente
  • Condiciones médicas como hipertensión, diabetes, alcoholismo
  • Si el paciente recibió un SMS de recordatorio
  • Si asistió o no a la cita médica (No-show)

🔍 Objetivo del Análisis

Explorar preguntas como:

  • ¿Qué factores influyen en que un paciente no se presente a su cita?
  • ¿Recibir un SMS mejora la asistencia?
  • ¿La edad, género o condiciones médicas influyen en la asistencia?
  • ¿Hay barrios con mayores tasas de inasistencia?

🧹 Limpieza de Datos

Se realizaron las siguientes transformaciones:

  • Se eliminaron columnas irrelevantes como PatientId, AppointmentID y ScheduledDay
  • Se convirtieron columnas de fecha a tipo datetime y se creó la columna waiting_days
  • Se eliminaron edades negativas
  • Se eliminaron columnas duplicadas o innecesarias
  • Se renombraron columnas para mejorar la legibilidad

📈 Análisis Exploratorio (EDA)

  • Visualización de distribución de asistencia por edad, género, barrio y condiciones médicas
  • Análisis de impacto de recibir un SMS en la asistencia
  • Cálculo de tasas de asistencia por categoría

Ejemplo de resultado:

📌 ¿Recibir un SMS mejora la asistencia?

Gráfico de barras mostró que recibir un SMS no mejora significativamente la asistencia, e incluso hay una ligera disminución en la tasa de asistencia entre quienes recibieron el recordatorio.

🧪 Herramientas y Librerías Utilizadas

  • Python 3.11
  • Pandas
  • Matplotlib
  • Seaborn
  • Jupyter Notebook

🧠 Conclusiones

  • La mayoría de los pacientes sí asisten a sus citas (~80%).
  • La edad y algunas condiciones médicas parecen estar relacionadas con la asistencia.
  • Enviar SMS no se correlaciona con una mayor asistencia.
  • Algunas regiones geográficas muestran tasas más bajas de asistencia.

🚀 Próximos pasos

  • Aplicar modelos de machine learning para predecir inasistencias
  • Evaluar si otros métodos de recordatorio podrían ser más efectivos
  • Integrar con sistemas hospitalarios para toma de decisiones

📌 Créditos

Dataset original de Kaggle.

Proyecto realizado como parte de mi formación en análisis de datos.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors