Este proyecto analiza un conjunto de datos reales de citas médicas en Brasil para investigar los factores que afectan la asistencia de los pacientes. El objetivo principal es identificar patrones que puedan ayudar a mejorar la tasa de asistencia a las citas médicas.
📊 Descripción del Dataset
El conjunto de datos contiene información sobre más de 100.000 citas médicas en Brasil, incluyendo:
- Género y edad del paciente
- Condiciones médicas como hipertensión, diabetes, alcoholismo
- Si el paciente recibió un SMS de recordatorio
- Si asistió o no a la cita médica (
No-show)
🔍 Objetivo del Análisis
Explorar preguntas como:
- ¿Qué factores influyen en que un paciente no se presente a su cita?
- ¿Recibir un SMS mejora la asistencia?
- ¿La edad, género o condiciones médicas influyen en la asistencia?
- ¿Hay barrios con mayores tasas de inasistencia?
🧹 Limpieza de Datos
Se realizaron las siguientes transformaciones:
- Se eliminaron columnas irrelevantes como
PatientId,AppointmentIDyScheduledDay - Se convirtieron columnas de fecha a tipo
datetimey se creó la columnawaiting_days - Se eliminaron edades negativas
- Se eliminaron columnas duplicadas o innecesarias
- Se renombraron columnas para mejorar la legibilidad
📈 Análisis Exploratorio (EDA)
- Visualización de distribución de asistencia por edad, género, barrio y condiciones médicas
- Análisis de impacto de recibir un SMS en la asistencia
- Cálculo de tasas de asistencia por categoría
📌 ¿Recibir un SMS mejora la asistencia?
Gráfico de barras mostró que recibir un SMS no mejora significativamente la asistencia, e incluso hay una ligera disminución en la tasa de asistencia entre quienes recibieron el recordatorio.
🧪 Herramientas y Librerías Utilizadas
- Python 3.11
- Pandas
- Matplotlib
- Seaborn
- Jupyter Notebook
🧠 Conclusiones
- La mayoría de los pacientes sí asisten a sus citas (~80%).
- La edad y algunas condiciones médicas parecen estar relacionadas con la asistencia.
- Enviar SMS no se correlaciona con una mayor asistencia.
- Algunas regiones geográficas muestran tasas más bajas de asistencia.
🚀 Próximos pasos
- Aplicar modelos de machine learning para predecir inasistencias
- Evaluar si otros métodos de recordatorio podrían ser más efectivos
- Integrar con sistemas hospitalarios para toma de decisiones
📌 Créditos
Dataset original de Kaggle.
Proyecto realizado como parte de mi formación en análisis de datos.