Este projeto demonstra a construção de um pipeline de dados completo e automatizado para Extração, Transformação e Carga (ETL) da cotação do Dólar, além da geração de relatórios analíticos.
O ecossistema orquestrado pelo Apache Airflow executa dois pipelines principais:
-
Pipeline de ETL (Diário):
- Extrai o histórico de cotações do Dólar (BRL) do último ano, utilizando a API pública do Banco Central do Brasil.
- Valida os dados extraídos para garantir a integridade.
- Transforma os dados e os carrega em um banco de dados PostgreSQL.
- Gera um gráfico da evolução diária da cotação.
-
Pipeline de Análise (Semanal):
- Lê os dados consolidados do PostgreSQL.
- Gera múltiplos relatórios visuais, como a cotação média por mês e por dia da semana.
- Orquestração: Apache Airflow
- Containerização: Docker & Docker Compose
- Banco de Dados: PostgreSQL
- Linguagem & Bibliotecas: Python, Pandas, SQLAlchemy, Matplotlib, Seaborn
- Clone este repositório.
- Na raiz do projeto, crie um arquivo
.envbaseado no arquivo.env.examplee preencha suas credenciais de usuário para o Airflow. - Execute o seguinte comando no terminal:
docker-compose up -d --build
- Acesse a interface do Airflow em
http://localhost:8080e ative as DAGs.