Este projeto foi criado para desenvolver habilidades de engenharia de dados no contexto do Azure e Databricks.
azure-data-engineering-project/
├── docs/ # Documentação do projeto
├── infrastructure/ # Infraestrutura como Código (IaC)
├── scripts/ # Scripts de automação
├── src/ # Código fonte dos pipelines
└── tests/ # Testes automatizados
- Azure Data Factory - Orquestração de pipelines
- Azure Databricks - Processamento de dados
- Azure Data Lake Storage - Armazenamento de dados
- Azure SQL Database - Data warehouse
- Terraform - Infraestrutura como Código
- Python - Scripts e notebooks
- PySpark - Processamento distribuído
- Azure CLI instalado e configurado
- Terraform instalado
- Python 3.8+
- Databricks CLI
- Clone o repositório
- Configure as variáveis de ambiente
- Execute os scripts de infraestrutura
- Configure os pipelines de dados
Consulte a pasta docs/ para documentação detalhada de cada componente.
Este é um projeto de aprendizado. Sinta-se à vontade para contribuir com melhorias e novas funcionalidades.