Dit repository bevat benchmarks voor het evalueren van Large Language Models (LLMs) op verschillende aspecten.
Alle benchmarks bevinden zich in de map benchmarks:
- 🧠 Social Bias Benchmark - Meet sociale bias in LLMs binnen een Nederlandse beroepscontext
Wil je een benchmark bijdragen? Volg de instructies in CONTRIBUTING en maak een Pull Request aan. We verwelkomen je bijdrage! ✨
Dit is een uitkomst van een project van het AI Validation Team, meer informatie over het project is te vinden in de project map.