1.1.0
Questa release consolida il toolkit come runtime tecnico dei repo dataset DataCivicLab, riducendo il surface area non core e chiarendo meglio i contract di runtime, output e notebook.
Il workflow canonico resta:
toolkit run all --config dataset.ymltoolkit validate all --config dataset.ymltoolkit status --dataset <dataset> --year <year> --latest --config dataset.ymltoolkit inspect paths --config dataset.yml --year <year> --json
Cambiamenti principali
Riduzione del surface area
- rimossi shim deprecated di
core - rimosso
gen-sql - rimossi plugin periferici/experimental
- chiariti meglio i confini tra:
- runtime core
- tooling avanzato
- compatibilità legacy
Miglioramenti al motore
- refactor del flusso di lettura DuckDB in CLEAN
- refactor della selezione input CLEAN
- refactor dell’orchestrazione e validazione CLEAN
- refactor del profiling RAW
- aggiunti hint minimi nel metadata RAW per facilitare lettura e diagnostica
Chiarezza del contract runtime/output
- distinzione esplicita tra:
metadata.jsonmanifest.json- run record in
data/_runs/... inspect paths --json
- separato nel codice il concetto di:
- manifest standard di layer
- manifest RAW libero/layer-specific
Test e manutenzione
- suite test stratificata con marker:
coreadvancedcompat
- branch finale verificato con:
146 passedruff checkpulito
Documentazione
- README riallineato al workflow canonico
- chiariti i confini del toolkit nell’ecosistema DataCivicLab
- aggiornate le docs su:
- workflow avanzati
- feature stability
- notebook contract
- runtime boundaries
- smoke e profiling docs
Impatto
Questa release rende il toolkit:
- più piccolo
- più leggibile
- più coerente con
project-template - più chiaro per notebook e repo dataset
- più facile da mantenere come motore tecnico condiviso
Note
Le feature advanced restano supportate ma non fanno parte del percorso base da promuovere nei nuovi repo dataset:
resumeprofile rawrun raw|clean|mart- artifact policy avanzata
- compatibilità legacy