DocuProof

DocuProof is a local-first Document AI + RAG API for selectable-text PDFs.

In 60 seconds: upload a PDF, ask evidence-grounded questions, extract typed invoice/receipt fields, and get backend-generated citations. If evidence is weak, responses deterministically refuse with "Not found in the document.".

Demo

2-minute quickstart

python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
export PYTHONPATH=src
uvicorn docuproof.api:app --reload

In a second terminal:

source .venv/bin/activate
export PYTHONPATH=src
python -m docuproof.cli upload data/samples/sample_invoice.pdf
# copy doc_id from output
python -m docuproof.cli ask --doc-id <doc_id> --question "What is the total amount?"
python -m docuproof.cli verify --doc-id <doc_id> --question "What is the total amount?"
bash scripts/demo.sh

Optional (for embedding download rate limits):

export HF_TOKEN=your_token_here

Proof

Expected response shapes for upload are versioned under:

examples/expected_upload.json
examples/expected_upload_presence.json

The smoke path is validated by:

tests/test_smoke.py
scripts/demo.sh

Security

Local-first default (remote LLM disabled unless LLM_PROVIDER is explicitly set).
No sensitive logging: no PDF bytes, extracted text, chunks, prompts, or answers.
Citations are backend-generated from metadata, not model-generated text.

Limitations

No OCR/scanned PDFs.
No multi-document QA.
No line-item extraction.
No layout/bbox reasoning.

CI

GitHub Actions runs lint + tests on push and PR:

python -m ruff check .
python -m pytest -q

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
.github/workflows		.github/workflows
data/samples		data/samples
docs		docs
examples		examples
scripts		scripts
src/docuproof		src/docuproof
storage		storage
tests		tests
.env.example		.env.example
.gitignore		.gitignore
AGENTS.md		AGENTS.md
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
docker-compose.yml		docker-compose.yml
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DocuProof

Demo

2-minute quickstart

Proof

Security

Limitations

CI

About

Uh oh!

Releases 2

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

DocuProof

Demo

2-minute quickstart

Proof

Security

Limitations

CI

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 2

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages