diff --git a/INSTRUCTIONS.es.md b/INSTRUCTIONS.es.md index e9453e2301..defc553315 100644 --- a/INSTRUCTIONS.es.md +++ b/INSTRUCTIONS.es.md @@ -16,19 +16,10 @@ Puedes elegir cualquier página que contenga datos visibles en el HTML y que sea - La estructura debe ser simple y repetitiva (tablas o listas). -**Opción B:** Propuesta sugerida – Wikipedia: Canciones más reproducidas en Spotify 🎧 +**Opción B:** Propuesta sugerida – Scrapthissite.com -Si prefieres no buscar un sitio por tu cuenta, puedes usar esta tabla de Wikipedia: [Canciones más reproducidas en Spotify](https://en.wikipedia.org/wiki/List_of_most-streamed_songs_on_Spotify) - -Contiene información sobre: - -- Título de la canción - -- Artista - -- Reproducciones - -- Año de lanzamiento +Si prefieres no buscar un sitio por tu cuenta, puedes usar web hecha específicamente para ello: +(https://www.scrapethissite.com/) Es una excelente opción para practicar scraping con tablas. @@ -57,7 +48,7 @@ Si usás Wikipedia y contiene una tabla, podés usar directamente `pandas.read_h ## Paso 4: Procesa el DataFrame -A continuación, limpia las filas para obtener los valores limpios eliminando `$` y `B`. Elimina también aquellas que estén vacías o no tengan información. +A continuación, limpia las filas para obtener los valores que necesites. Elimina también aquellas que estén vacías o no tengan información. ## Paso 5: Almacena los datos en sqlite @@ -74,51 +65,3 @@ Crea una instancia vacía de la base de datos e incluye en ella los datos limpio Si aún no has revisado los conceptos y prácticas de visualización, no te preocupes. Intenta hacer que esto funcione, y exploraremos la visualización en detalle en los próximos proyectos. ¿Qué tipos de visualizaciones podemos realizar? Propón al menos 3 y muéstralos. - - -## ¿Te sientes confiado/a? 😎 - -### Monitoreo diario del ranking musical - Versión extendida para estudiantes con confianza - -Si te sientes confiado/a y quieres profundizar en el uso de scraping y análisis temporal de datos, te proponemos realizar esta version extendida y opcional del proyecto, que te ayudará a conectar scraping, análisis de datos reales y visibilidad profesional, lo cual será ideal para mostrar en LinkedIn o un portafolio. - -La idea es obtener información diaria del ranking musical (como el top 100 de canciones en Spotify desde Wikipedia) y estudiar tendencias reales a lo largo del tiempo. - - -### Propuesta 🚀 - -1. **Scraper diario:** Usa el scraper del proyecto original. Programalo para que se ejecute a diario (puede usarse cron en Linux/Mac o Task Scheduler en Windows). - - Almacena los datos en una base SQLite, agregando una columna `date` con el día de ejecución. - -2. **Base de datos:** Crea una tabla llamada `daily_rankings` que contenga las siguientes columnas: - - - scraping_date - - rank - - song - - artist - - streams - - release_year - - -3. **Visualizaciones sugeridas:** - - - Evolución de una canción a lo largo de los días - - Tiempo promedio en el top 10, top 50 o top 100 - - Artistas con más entradas y mayor duración promedio - -4. **Haz visible tu trabajo:** Publica en LinkedIn tu trabajo. Haz el seguimiento por al menos 2 semanas y publica una visualización o hallazgo diariamente o cada 2-3 días; usa notebooks, dashboards o posts gráficos para compartir lo aprendido. - - A continuación te sugerimos una posible publicación, para tu LinkedIn: - - - > Entre mis primeros proyectos como Data Scientist, hoy empecé a monitorear diariamente el - > ranking de las canciones más escuchadas en Spotify. Revisar estos rankings es clave para - > entender muchísimo sobre cómo se mueve el dinero, el marketing y las tendencias en la industria - > musical. - > - > Ire compartiendo mis visualizaciones e insights en los próximos días. - > - > ¡La música también se puede estudiar con datos! 🎶📊 - > - > **#DataScience #Spotify #WebScraping #TendenciasMusicales**