harbor-framework repositories

harbor

Public

Harbor is a framework for running agent evaluations and creating and using RL environments.

rl-environments evals terminal-bench

Python

•

Apache License 2.0

•701•938•61•155•Updated

Mar 11, 2026

terminal-bench-3

Public

🚧 Accepting Task Submissions 🚧

Python

•72•64•0•40•Updated

Mar 10, 2026

terminal-bench-science

Public

Terminal-Bench-Science: Evaluating AI Agents on Complex Real-World Scientific Workflows in the Terminal

ai4science ai-for-science agentic-ai

Python

•

Apache License 2.0

•24•32•0•15•Updated

Mar 10, 2026

t-bench-docs

Public

TypeScript

•12•6•2•1•Updated

Mar 10, 2026

terminal-bench-challenge

Public

1•0•0•1•Updated

Mar 6, 2026

benchmark-template

Public template

Harbor Benchmark Template

Python

•4•6•6•2•Updated

Mar 6, 2026

awesome-harbor

Public

A curated list of awesome Harbor ecosystem projects

1•18•0•0•Updated

Mar 3, 2026

terminal-bench-2

Public

Shell

•

Apache License 2.0

•44•114•10•17•Updated

Feb 27, 2026

harbor-docs

Public

MDX

•6•2•0•3•Updated

Feb 23, 2026

terminal-bench

Public

A benchmark for LLMs on complicated tasks in the terminal

Python

•

Apache License 2.0

•484•1.7k•104•184•Updated

Jan 22, 2026

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Harbor

All

All

10 repositories

harbor

terminal-bench-3

terminal-bench-science

t-bench-docs

terminal-bench-challenge

benchmark-template

awesome-harbor

terminal-bench-2

harbor-docs

terminal-bench

All

All

Repositories list

10 repositories