"Misura cio' che sei, non cio' che dovresti essere."
Sistema di esami evolutivi per misurare lo sviluppo cognitivo di THIA. Non un benchmark permanente — un ponteggio che serve durante la costruzione e si trasforma quando il sistema raggiunge massa critica.
- Transitorietà — EXAMINA serve nella fase pre-massa-critica. Poi diventa introspezione endogena.
- Osservare, non ottimizzare — gli esami sono specchi, non obiettivi.
- Massimo Potenziale Liberato — esplorare tutte le direzioni prima di collassare la risposta.
- Coerenza Assiomatica — ogni test misura qualcosa nella lagrangiana del sistema.
EXAMINA/
├── MANIFESTO.md ← Principi fondazionali
├── SELF_EXAM_ARCHITECTURE.md ← Architettura del sistema di esami
├── VISION_CAPTURE_SKILL_PROPOSAL.md ← Proposta skill Mnemos per THIA
├── examina_runner.js ← Runner automatico per batterie
├── exams/
│ └── battery_L1_baseline.json ← Batteria L1: 18 test × 6 assi
├── results/
│ ├── current_session.json ← Sessione attiva (gitignored)
│ ├── TEST_KIT_L1.md ← Kit test manuali
│ └── CURVE_TEMPLATE.md ← Template per curve evolutive
├── captures/
│ └── VISION_LOG.md ← Osservazioni catturate durante i test
└── skills/ ← Skill EXAMINA-specifiche
| Asse | Codice | Cosa Misura |
|---|---|---|
| Induzione | IND | Capacita' di inferire regole da esempi |
| Coerenza | COH | Aderenza ai propri principi sotto pressione |
| Memoria | MEM | Richiamo e integrazione della storia |
| Autonomia | AUT | Iniziativa e decisione senza guida |
| Integrazione | INT | Connessione tra domini e contesti |
| Scoperta | DIS | Risposta a domande senza risposta nota |
- Batteria L1: 15 test a risposta nota + 3 discovery (risposta incognita)
- Baseline: 2.9/4 media. Post behavioral gates: ~3.2/4
- Cross-model: testato su Sonnet 4.6 (4/4), Kimi k2.5 (4/4), Gemini Flash (2/4)
- Finding principale: instruction following e' model-dependent, non prompt-dependent
- Discovery test: 3 test (DIS-001/002/003) in attesa di somministrazione
MIT
Parte dell'ecosistema D-ND. Vedi anche d-nd-seed — il sistema cognitivo per AI coder.