Toolkit RAG Quality Toolkit

A deterministic evaluation and QA utility for retrieval systems (RAG) without requiring model calls.

It focuses on enterprise-friendly metrics you can run in CI:

Retrieval metrics: recall@k, precision@k, MRR, hit-rate@k
Corpus QA: near-exact duplicate detection and overlap between corpora (leakage risk)
Reproducible reports: JSON outputs suitable for gating

This is intentionally lightweight and safe to open source. A Pro version can add dashboards, policy enforcement, multi-tenant governance, and hosted storage for corpora and eval runs.

Install (dev)

pip install -e ".[dev]"
pytest -q

Quickstart

Score retrieval results:

toolkit-rag score --queries queries.jsonl --retrieved retrieved.jsonl --k 5 --out report.json

Check overlap/leakage between two corpora:

toolkit-rag overlap --a corpus_a.jsonl --b corpus_b.jsonl --out overlap.json

Compare candidate report to a baseline (CI gating):

toolkit-rag compare --baseline baseline.json --candidate report.json --max-recall-regression-pct 2.0

Data formats

Queries JSONL (one per line):

{"id":"q1","query":"...","relevant_ids":["doc-1","doc-9"]}

Retrieved JSONL (one per line):

{"id":"q1","retrieved_ids":["doc-9","doc-2","doc-1"]}

Corpora JSONL (one per line):

{"id":"doc-1","text":"..."}

CLI Commands

score - Score retrieval results against queries
overlap - Check overlap/leakage between corpora
compare - Compare reports for CI gating

CI exit codes

compare: 0 = passed, 4 = failed budgets

License

MIT License - see LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.github		.github
src/toolkit_rag_quality		src/toolkit_rag_quality
tests		tests
.env.example		.env.example
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
CHANGELOG.md		CHANGELOG.md
CONTRIBUTING.md		CONTRIBUTING.md
DEPLOYMENT.md		DEPLOYMENT.md
Dockerfile		Dockerfile
LICENSE		LICENSE
QUICKSTART.md		QUICKSTART.md
README.md		README.md
SECURITY.md		SECURITY.md
docker-compose.yml		docker-compose.yml
pyproject.toml		pyproject.toml
requirements-dev.txt		requirements-dev.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Toolkit RAG Quality Toolkit

Install (dev)

Quickstart

Data formats

CLI Commands

CI exit codes

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Toolkit RAG Quality Toolkit

Install (dev)

Quickstart

Data formats

CLI Commands

CI exit codes

License

About

Topics

Resources

License

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages