Skip to content

Este proyecto trabaja con el dataset del Titanic, aplicando técnicas de procesamiento y análisis de datos en Python con apoyo de la librería pandas. El objetivo es limpiar, transformar y estudiar las características disponibles, identificando valores faltantes, duplicados o atípicos, así como calcular métricas estadísticas relevantes.

License

Notifications You must be signed in to change notification settings

SR-YH/Titanic-Proyect---Data-Analysis

Repository files navigation

by Yanxia Zou

Análisis del Dataset del Titanic

Este proyecto se centra en el conjunto de datos del Titanic, que recoge información sobre 891 pasajeros que viajaban en el transatlántico RMS Titanic, hundido en su viaje inaugural el 15 de abril de 1912 tras colisionar con un iceberg.

El propósito principal es analizar qué factores influyeron en la supervivencia, evaluando variables como clase social, género, edad, situación familiar, cabina asignada y puerto de embarque.

Preguntas a responder

A partir de los datos disponibles se busca responder:

  • ¿Qué porcentaje de personas sobrevivió?
  • ¿Tuvo la clase social un mayor impacto en la supervivencia?
  • ¿Existió un sesgo de género en la supervivencia?
  • ¿Cómo se distribuían las edades de los pasajeros? ¿Hubo diferencias en la edad promedio entre los supervivientes y los no supervivientes?
  • ¿Las personas que viajaban solas tenían menos probabilidades de sobrevivir que aquellas que viajaban en familia?
  • ¿Tener una cabina asignada influyó en las posibilidades de supervivencia?
  • ¿El punto de embarque tuvo alguna relación con la tasa de supervivencia?

Descripción de las características

El dataset contiene 12 variables:

  • PassengerId: Identificador único de cada pasajero.
  • Survived: Indica si el pasajero sobrevivió (1) o no (0).
  • Pclass: Clase socioeconómica del pasajero (1 = Alta, 2 = Media, 3 = Baja).
  • Name: Nombre completo del pasajero, con título (Mr., Mrs., Miss, etc.).
  • Sex: Género del pasajero.
  • Age: Edad del pasajero.
  • SibSp: Número de hermanos y/o cónyuges a bordo.
  • Parch: Número de padres y/o hijos a bordo.
  • Ticket: Número del billete.
  • Fare: Precio total del billete pagado.
  • Cabin: Número de cabina asignada.
  • Embarked: Puerto de embarque (C = Cherbourg, Q = Queenstown, S = Southampton).

Visualizaciones

  • Porcentaje de supervivencia
  • Distribución de clases sociales
  • Supervivencia por clase socioeconómica
  • Distribución de tarifas por supervivencia
  • Distribución de género en el Titanic
  • Supervivencia por género
  • Distribución de edades de los pasajeros
  • Distribución de edad por supervivencia
  • Cantidad de pasajeros por puerto de embarque
  • Tasa de supervivencia por puerto de embarque
  • Distribución del tamaño de familia
  • Supervivencia según tamaño de familia
  • Supervivencia según si viajaba solo o acompañado
  • Supervivencia según si tenía cabina asignada
  • Frecuencia de títulos
  • Tasa de supervivencia por título

Infografía

¿Quién sobrevivió al Titanic?

Puedes consultar el notebook en Google Colab para más detalles aquí.

About

Este proyecto trabaja con el dataset del Titanic, aplicando técnicas de procesamiento y análisis de datos en Python con apoyo de la librería pandas. El objetivo es limpiar, transformar y estudiar las características disponibles, identificando valores faltantes, duplicados o atípicos, así como calcular métricas estadísticas relevantes.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published