Questo progetto contiene un'analisi completa del dataset Olist, con pulizia dati, feature engineering e analisi statistica esplorativa.
Tableau: https://public.tableau.com/shared/5ZYX49XNZ?:display_count=n&:origin=viz_share_link
Dataset: https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce
/ (cartella principale)
│
├── data/ # Dataset originali CSV (non versionati su Git)
├── outputs/ # File generati: dataset puliti, grafici, ecc. (non versionati su Git)
│ └── figures/ # Grafici salvati
├── eda.ipynb # Notebook Jupyter con l'analisi
├── config.py # Configurazioni e percorsi
├── utils.py # Funzioni di utilità per caricamento, pulizia, aggregazione
├── requirements.txt # Dipendenze Python
├── .gitignore # File per escludere file/cartelle da Git
└── README.md # Questo file
- Clona il repository:
git clone <URL-del-repository>
cd <nome-cartella>- Crea e attiva un ambiente virtuale:
python -m venv env
source env/bin/activate # Linux/macOS
.\env\Scripts\activate # Windows- Installa le dipendenze:
pip install -r requirements.txt-
Scarica i dataset originali e posizionali nella cartella
data/ -
Esegui il notebook Jupyter:
jupyter notebook eda.ipynb-
pandas,numpyper manipolazione dati -
matplotlib,seabornper visualizzazioni -
scipyper test statistici -
missingnoper analisi dati mancanti
Questo progetto è rilasciato sotto licenza MIT.
Creato da Andrea Conti