ETL de Clientes com Databricks

Bronze: ingestão directa do ficheiro CSV
Silver: validação, limpeza e transformação dos dados
Gold: análise e agregação dos dados transformados

Este projecto implementa uma pipeline ETL robusta com PySpark e Delta Lake, usando dados sintéticos de clientes.

Arquitectura Medallion

1_ingestao_bronze.py: lê dados crus e grava em Delta na camada bronze
2_transformacao_silver.py: valida e transforma os dados para a camada silver
3_analise_gold.py: produz indicadores (ex: clientes por ano) e grava na camada gold

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data		data
notebooks		notebooks
utils		utils
README.md		README.md
dbx_project.json		dbx_project.json
requirements.txt		requirements.txt