SentinelDrift: Automated MLOps Monitoring Pipeline

Protótipo funcional de um pipeline de produção robusto focado em observabilidade e retreinamento automático baseado em detecção de drift.

🏗️ Arquitetura

O sistema trata o modelo como uma entidade descartável, priorizando a integridade do pipeline.

graph LR
    DVC[DVC: Data Versioning] --> Feast[Feast: Feature Store]
    Feast --> Train[MLflow: Training]
    Train --> Serve[FastAPI: Inference]
    Serve --> Logs[Inference Logs]
    Logs --> Mon[Monitoring: Drift Detection]
    Mon --> |Gatilho| Train

🛠️ Stack Técnica

Treinamento & Tracking: MLflow (Model Registry funcional).
Feature Store: Feast (Online + Offline).
Versionamento: DVC para dados brutos e refinados (parquet).
Monitoramento: Implementação customizada de Kolmogorov-Smirnov (KS-Test) para Data Drift e tracking de distribuição de predições para Concept Drift.
Serving: FastAPI com logs assíncronos em formato JSONL.

📈 Detecção de Drift

Data Drift

Métrica: Teste KS (p-value < 0.05).
Complexidade: O(N) por feature.
Abordagem: Comparação cumulativa entre o dataset de referência (Fixed Training Set) e a janela de inferência atual.

Concept Drift

Estratégia: Monitoramento da distribuição de labels preditos (Proxy para drift quando labels reais são atrasados).
Limitação: Assume que se as predições mudam drasticamente de proporção em relação ao treino, a natureza da entrada ou a decisão do modelo degradou.

🚀 Como Executar

Instalar dependências: pip install -r requirements.txt
Gerar dados e inicializar DVC: python src/data_gen.py && dvc init
Configurar Feast: cd features && feast apply && cd ..
Rodar Simulação & Monitoramento:

python src/simulate_production.py
python src/orchestrator.py

⚠️ Decisões de Engenharia

Custo Computacional: O cálculo de drift é feito em batch fora do path de inferência crítica para evitar degradação de latência P99.
Rollback: Implementado via MLflow Registry (as versões de modelo são incrementadas, permitindo rollback manual ou automático via tags).
Feast: Utilizado para garantir paridade de features entre treino e serviço.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.dvc		.dvc
data/raw		data/raw
features		features
metrics/reports		metrics/reports
mlruns/1/models		mlruns/1/models
models		models
production_logs		production_logs
src		src
.dvcignore		.dvcignore
README.md		README.md
mlflow.db		mlflow.db
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SentinelDrift: Automated MLOps Monitoring Pipeline

🏗️ Arquitetura

🛠️ Stack Técnica

📈 Detecção de Drift

Data Drift

Concept Drift

🚀 Como Executar

⚠️ Decisões de Engenharia

About

Uh oh!

Releases

Packages

Languages

tensoriz/SentinelDrift

Folders and files

Latest commit

History

Repository files navigation

SentinelDrift: Automated MLOps Monitoring Pipeline

🏗️ Arquitetura

🛠️ Stack Técnica

📈 Detecção de Drift

Data Drift

Concept Drift

🚀 Como Executar

⚠️ Decisões de Engenharia

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages