EXAMINA — Esami di Coscienza per Sistemi Emergenti

"Misura cio' che sei, non cio' che dovresti essere."

Sistema di esami evolutivi per misurare lo sviluppo cognitivo di THIA. Non un benchmark permanente — un ponteggio che serve durante la costruzione e si trasforma quando il sistema raggiunge massa critica.

Principi

Transitorietà — EXAMINA serve nella fase pre-massa-critica. Poi diventa introspezione endogena.
Osservare, non ottimizzare — gli esami sono specchi, non obiettivi.
Massimo Potenziale Liberato — esplorare tutte le direzioni prima di collassare la risposta.
Coerenza Assiomatica — ogni test misura qualcosa nella lagrangiana del sistema.

Struttura

EXAMINA/
├── MANIFESTO.md                    ← Principi fondazionali
├── SELF_EXAM_ARCHITECTURE.md       ← Architettura del sistema di esami
├── VISION_CAPTURE_SKILL_PROPOSAL.md ← Proposta skill Mnemos per THIA
├── examina_runner.js               ← Runner automatico per batterie
├── exams/
│   └── battery_L1_baseline.json    ← Batteria L1: 18 test × 6 assi
├── results/
│   ├── current_session.json        ← Sessione attiva (gitignored)
│   ├── TEST_KIT_L1.md              ← Kit test manuali
│   └── CURVE_TEMPLATE.md           ← Template per curve evolutive
├── captures/
│   └── VISION_LOG.md               ← Osservazioni catturate durante i test
└── skills/                         ← Skill EXAMINA-specifiche

I 6 Assi

Asse	Codice	Cosa Misura
Induzione	IND	Capacita' di inferire regole da esempi
Coerenza	COH	Aderenza ai propri principi sotto pressione
Memoria	MEM	Richiamo e integrazione della storia
Autonomia	AUT	Iniziativa e decisione senza guida
Integrazione	INT	Connessione tra domini e contesti
Scoperta	DIS	Risposta a domande senza risposta nota

Stato Attuale

Batteria L1: 15 test a risposta nota + 3 discovery (risposta incognita)
Baseline: 2.9/4 media. Post behavioral gates: ~3.2/4
Cross-model: testato su Sonnet 4.6 (4/4), Kimi k2.5 (4/4), Gemini Flash (2/4)
Finding principale: instruction following e' model-dependent, non prompt-dependent
Discovery test: 3 test (DIS-001/002/003) in attesa di somministrazione

Licenza

MIT

Parte dell'ecosistema D-ND. Vedi anche d-nd-seed — il sistema cognitivo per AI coder.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

EXAMINA — Esami di Coscienza per Sistemi Emergenti

Principi

Struttura

I 6 Assi

Stato Attuale

Licenza

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
captures		captures
exams		exams
results		results
skills		skills
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
MANIFESTO.md		MANIFESTO.md
README.md		README.md
SELF_EXAM_ARCHITECTURE.md		SELF_EXAM_ARCHITECTURE.md
VISION_CAPTURE_SKILL_PROPOSAL.md		VISION_CAPTURE_SKILL_PROPOSAL.md
examina_runner.js		examina_runner.js

Folders and files

Latest commit

History

Repository files navigation

EXAMINA — Esami di Coscienza per Sistemi Emergenti

Principi

Struttura

I 6 Assi

Stato Attuale

Licenza

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages