Skip to content

Portfolio Projects is a curated collection showcasing skills in coding, data analysis, and visualization. Each project highlights problem‑solving, creativity, and technical expertise, offering clear insights and practical solutions. A hub designed to demonstrate growth, versatility, and impactful results.

Notifications You must be signed in to change notification settings

giadabonanno/portfolio_projects

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

### Presentazione del progetto ETL_PIPELINE
Ben trovati! Ho deciso di lavorare su tre diversi mini-progetti in un'unica root che raggruppa l'argomento principale: processo ETL. In sostanza noterete tre cartelle che ripuliscono ciascuno un dataset diverso. Inoltre ho deciso di dimostrare come può avvenire l'analisi interrogando in modo corretto i dati. L'ambiente è pronto per un'eventuale dashboard. 

***
-> Il primo passo per poter comprendere come ho lavorato è installare l'ambiente virtuale con tutte le librerie del caso di modo da non creare conflitti. Potete digitare nella vostra shell direttamente 'pip install -r requirements.txt' in quanto ho ritagliato per voi un comodo testo per poter vedere quali librerie uso e la loro versione.
-> Di seguito noterete tre cartelle ciascuno con un argomento diverso. Ho deciso di lavorare diversamente seguendo lo stesso concept per poter dimostrare come interrogare diversamente i dati nella fase di analisi.
-> Notiamo innanzitutto di aver scaricato un dataset in CSV sporco con dati mancanti e/o colonne superflue. Ho usato quindi la scrittura in codice Python per poter selezionare il nostro target e fare un po' di pulizia. Infatti in ultimo vi ritornerà un dataset CSV pulito.
-> Dopo aver ottenuto il nostro dataset pulito lo possiamo utilizzare per interrogare in modo corretto i dati. Così è stato fatto in Jupyter nella cartella notebooks di ciascun progetto. Ho scelto Jupyter per la comodità di scrivere sia delle spiegazioni in Markdown, come potrete notare, sia per poter scrivere il codice.
-> Infine ho voluto accompagnare ogni cartella con una README propria di modo da rendere il tutto più semplice da comprendere.
***

Spero che vi sia stato utile per poter capire il mio ragionamento nell'attuazione di questo progetto!
Ovviamente è possibile proseguire collegandosi ad un database e trasportando tutti i nostri dati tramite Docker (io uso questo ma potete anche usarne altri). State attenti a considerare la prima riga di ciascun database come il nome delle colonne delle vostre tabelle. In questo caso basterà scrivere una semplice query per rendere il tutto molto interessante. Vi confido che sarebbe più macchinoso da terminale ma anche questo è fattibile.
A presto
- Giada

About

Portfolio Projects is a curated collection showcasing skills in coding, data analysis, and visualization. Each project highlights problem‑solving, creativity, and technical expertise, offering clear insights and practical solutions. A hub designed to demonstrate growth, versatility, and impactful results.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published