Skip to content

SergioGomis/shark-dataset-cleanup

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Pandas Dataset Cleanup

Shark Attack!

Introducción

Este repositorio es un proyecto que pertenece al bootcamp de Data Analytics de Ironhack Madrid. La finalidad es la de aprender a manipular datos usando la librería Pandas. Para ello partiremos del dataset Shark attack y aplicaremos funciones y métodos de transformación que nos permitan subsanar el mal estado de la información original y obtener conclusiones sobre los datos.

Técnicas empleadas

  • Lectura de ficheros csv y creación de dataframe.
  • Análisis estadísticos y descriptivos de dataframes.
  • Aplicar funciones a columnas para tranformarlas.
  • Gráficos con matplotlib.
  • Utilizar funciones propias en librerías auxiliares.
  • Conversiones de tipo, reemplazo de textos.
  • Expresiones regulares.
  • Borrado de columnas.
  • Volcado a dataframe a fichero csv.

Conclusiones

  1. Pandas es una herramienta muy potente para manipular gran cantidad de información.
  2. Hay más ataques documentados conforme avanzamos en el tiempo.

attacks per decade

About

Pandas Project @ Ironhack

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors