eval-metrics-lab

A simple, text-only playground for evaluating reasoning model outputs.
Local, lightweight, and perfect for PMs exploring AI reliability.

Run it

python eval_metrics_lab.py

Evaluating 3 mock responses...
Accuracy: 0.87
Hallucination: 0.11
Trust Score: 76.0
✅ Model reliability acceptable.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
LICENSE		LICENSE
README.md		README.md
eval_metrics_lab.py		eval_metrics_lab.py
requirements.txt		requirements.txt