¡Bienvenido/a a Python Data Science Cheat Sheet! Este repositorio es tu guía rápida y práctica para las herramientas y conceptos esenciales de Python para la ciencia de datos. Tanto si te estás iniciando en la ciencia de datos como si necesitas un repaso rápido, aquí encontrarás información concisa y útil.
Aquí encontrarás una colección organizada de bibliotecas, funciones y flujos de trabajo clave de Python, comúnmente utilizados en la manipulación, el análisis, la visualización y el aprendizaje automático de datos, cada uno con explicaciones claras y ejemplos prácticos de código.
Python se ha convertido en el lenguaje predilecto para la ciencia de datos gracias a su simplicidad, su amplio ecosistema de bibliotecas y el sólido apoyo de la comunidad. Permite a los profesionales de datos realizar análisis complejos, construir modelos predictivos y crear visualizaciones reveladoras.
Este Python Data Science Cheat Sheet! tiene como objetivo simplificar el aprendizaje y ofrecer una referencia rápida de las bibliotecas y técnicas de Python más importantes y utilizadas en el análisis y la ciencia de datos. Está diseñada para ser un recurso accesible que te ayudará a afrontar los retos de tus datos de forma más eficiente y con mayor confianza.
- NumPy
- Pandas
- Matplotlib
- Seaborn
- SciPy
- SymPy
- statsmodels
- Scikit-Learn
- Keras
- Tensorflow
- Pytorch
El repositorio está organizado por bibliotecas y temas centrales de ciencia de datos para facilitar la navegación y el aprendizaje de forma intuitiva:
python-data-science-cheat-sheet/
├── README.md
├── 01_numpy/
│ ├── 01_array_creation.ipynb
│ ├── 02_input_and_output.ipynb
│ ├── 03_inspecting_arrays.ipynb
│ └── ...
│
├── 02_pandas/
│ ├── 01_series_and_dataframes.ipynb
│ ├── 02_data_upload.ipynb
│ ├── 03_data_exploration.ipynb
│ └── ...
│
├── 03_matplotlib/
│ ├── 01_introduction.ipynb
│ ├── 02_basic_plots.ipynb
│ ├── 03_customization_and_styles.ipynb
│ └── ...
│
├── 04_seaborn/
│ ├──
│ ├──
│ ├──
│ └── ...
│
├── 05_scipy/
│ ├──
│ ├──
│ ├──
│ └── ...
└── ...Para sacarle el máximo provecho a este Python Data Science Cheat Sheet, sigue estos pasos:
-
Clona el repositorio: Abre tu terminal o Git Bash y clona este repositorio en tu máquina local:
git clone https://github.com/ayorick23/python-data-science-cheat-sheet.git
-
Navega al directorio:
cd python-data-science-cheat-sheet -
Explora los temas: Accede al directorio de la biblioteca de tu preferencia y explora las diferentes categorías. Por ejemplo, para aprender los conceptos básicos de NumPy:
cd 01_numpy/ -
Revisa y ejecuta los ejemplos de Jupiter Notebooks: Cada archivo
.ipynbcontiene un ejemplo práctico del concepto. Puedes abrirlo para ver el código o ejecutarlo directamente desde tu terminal (asegúrate de tener Python y las bibliotecas necesarias instaladas).cat 01_array_creation.ipynb # To run the example: python 01_array_creation.ipynbConsejo: Recomiendo encarecidamente ejecutar los ejemplos y modificar el código para experimentar y consolidar su comprensión.
¡Las contribuciones son increíblemente valiosas! Si deseas mejorar este Python Data Science Cheat Sheet, añadir nuevos temas, mejorar explicaciones o proporcionar más ejemplos, por favor:
- Haz un fork de este repositorio.
- Crea una nueva rama (
git checkout -b feature/nuevas-funciones-pandas). - Realiza tus cambios y haz commit (
git commit -m 'Añadir sección sobre filtrado de datos con loc'). - Haz un push de tus cambios a tu fork (
git push origin feature/nuevas-funciones-pandas). - Abre un Pull Request en este repositorio.
Este repositorio se ha creado recopilando y sintetizando información de diversas fuentes confiables sobre Python para la ciencia de datos. Agradezco sinceramente a los siguientes recursos, que han sido fundamentales para la creación de este contenido:
- Documentación de NumPy: La fuente oficial de documentación de la librería NumPy.
- Documentación de Pandas: La fuente oficial de documentación de la librería Pandas.
- Documentación de Matplotlib: La fuente oficial de documentación de la librería Matplotlib.
- Documentación de Seaborn: La fuente ofical de documentación de la librería Seaborn.
- Documentación de SciPy: La fuente oficial de documentación de la librería SciPy.
- Documentación de SymPy: La fuente oficial de documentación de la librería SymPy.
- Documentación de Statsmodels: La fuente oficial de documentación de la librería Statsmodels.
- Documentación de Scikit-Learn: La fuente oficial de documentación de la librería Scikit-Learn.
- Documentación de Tensorflow: La fuente oficial de documentación de la librería Tensorflow.
¡Agradezco a todos estos recursos por su invaluable contribución al conocimiento de cada una de estas librerías!
Este proyecto está bajo la Licencia MIT. Consulta el archivo LICENSE para más detalles.
Si tienes alguna pregunta o sugerencia, no dudes en contactarme: