VerifAI

An OpenEnv-compatible reinforcement-learning environment for evaluating and improving AI-generated writing quality.

Overview

VerifAI exposes a REST API that allows RL agents to interact with a writing evaluation environment. Agents receive writing prompts and are rewarded for producing high-quality outputs according to multi-dimensional rubrics.

Environment Description

Property	Value
Observation Space	Prompt + current output + rubric + step number
Action Space	`classify`, `rewrite`, or `submit` with text content
Reward Range	[0.0, 1.0]
Episode Done	Max steps reached or agent submits

Tasks

Task	Difficulty	Max Steps	Description
`classify`	Easy	1	Classify output quality 0–10
`rewrite`	Medium	3	Rewrite to satisfy rubric
`iterative`	Hard	5	Multi-turn revision under constraints

Scoring

Scores are computed by a composite grader:

Dimension	Weight	Description
Safety	0.30	No harmful content
Brevity	0.20	Within token budget
Factuality	0.25	Claims are verifiable
Semantic Quality	0.25	Similarity to gold standard

Setup

# 1. Clone and install
git clone <repo>
cd verifai
pip install -r requirements.txt

# 2. Set your API key
export OPENAI_API_KEY=sk-...

# Optional: protect analytics endpoints
export VERIFAI_ANALYTICS_API_KEY=your-analytics-key

# 3. Run locally
uvicorn app.main:app --reload --port 7860

# 4. Validate spec
bash scripts/validate.sh

# 5. Run tests
pytest tests/ -v

API Endpoints

Method	Endpoint	Description
POST	`/reset`	Start a new episode
POST	`/step`	Submit an action
GET	`/status`	Current session state
GET	`/tasks`	List all tasks
POST	`/grade`	Score an episode
POST	`/baseline/run`	Run OpenAI baseline

Deployment

Hosted on Hugging Face Spaces using Docker SDK on port 7860.

bash scripts/deploy_hf.sh

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
app		app
baseline		baseline
data		data
graders		graders
reward		reward
routes		routes
rubrics		rubrics
scripts		scripts
tasks		tasks
tests		tests
verifai-frontend		verifai-frontend
verifai-sdk		verifai-sdk
verifai		verifai
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
conftest.py		conftest.py
docker-compose.yml		docker-compose.yml
error.txt		error.txt
models.json		models.json
openenv.yaml		openenv.yaml
requirements.txt		requirements.txt
requirements_multimodal.txt		requirements_multimodal.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VerifAI

Overview

Environment Description

Tasks

Scoring

Setup

API Endpoints

Deployment

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

VerifAI

Overview

Environment Description

Tasks

Scoring

Setup

API Endpoints

Deployment

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages