-
Notifications
You must be signed in to change notification settings - Fork 0
Portfolio Projects is a curated collection showcasing skills in coding, data analysis, and visualization. Each project highlights problem‑solving, creativity, and technical expertise, offering clear insights and practical solutions. A hub designed to demonstrate growth, versatility, and impactful results.
giadabonanno/portfolio_projects
Folders and files
| Name | Name | Last commit message | Last commit date | |
|---|---|---|---|---|
Repository files navigation
### Presentazione del progetto ETL_PIPELINE Ben trovati! Ho deciso di lavorare su tre diversi mini-progetti in un'unica root che raggruppa l'argomento principale: processo ETL. In sostanza noterete tre cartelle che ripuliscono ciascuno un dataset diverso. Inoltre ho deciso di dimostrare come può avvenire l'analisi interrogando in modo corretto i dati. L'ambiente è pronto per un'eventuale dashboard. *** -> Il primo passo per poter comprendere come ho lavorato è installare l'ambiente virtuale con tutte le librerie del caso di modo da non creare conflitti. Potete digitare nella vostra shell direttamente 'pip install -r requirements.txt' in quanto ho ritagliato per voi un comodo testo per poter vedere quali librerie uso e la loro versione. -> Di seguito noterete tre cartelle ciascuno con un argomento diverso. Ho deciso di lavorare diversamente seguendo lo stesso concept per poter dimostrare come interrogare diversamente i dati nella fase di analisi. -> Notiamo innanzitutto di aver scaricato un dataset in CSV sporco con dati mancanti e/o colonne superflue. Ho usato quindi la scrittura in codice Python per poter selezionare il nostro target e fare un po' di pulizia. Infatti in ultimo vi ritornerà un dataset CSV pulito. -> Dopo aver ottenuto il nostro dataset pulito lo possiamo utilizzare per interrogare in modo corretto i dati. Così è stato fatto in Jupyter nella cartella notebooks di ciascun progetto. Ho scelto Jupyter per la comodità di scrivere sia delle spiegazioni in Markdown, come potrete notare, sia per poter scrivere il codice. -> Infine ho voluto accompagnare ogni cartella con una README propria di modo da rendere il tutto più semplice da comprendere. *** Spero che vi sia stato utile per poter capire il mio ragionamento nell'attuazione di questo progetto! Ovviamente è possibile proseguire collegandosi ad un database e trasportando tutti i nostri dati tramite Docker (io uso questo ma potete anche usarne altri). State attenti a considerare la prima riga di ciascun database come il nome delle colonne delle vostre tabelle. In questo caso basterà scrivere una semplice query per rendere il tutto molto interessante. Vi confido che sarebbe più macchinoso da terminale ma anche questo è fattibile. A presto - Giada
About
Portfolio Projects is a curated collection showcasing skills in coding, data analysis, and visualization. Each project highlights problem‑solving, creativity, and technical expertise, offering clear insights and practical solutions. A hub designed to demonstrate growth, versatility, and impactful results.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published