Skip to content

v1.1.0

Latest

Choose a tag to compare

@Gabrymi93 Gabrymi93 released this 02 Mar 23:33
· 37 commits to main since this release
6a5cd7d

1.1.0

Questa release consolida il toolkit come runtime tecnico dei repo dataset DataCivicLab, riducendo il surface area non core e chiarendo meglio i contract di runtime, output e notebook.

Il workflow canonico resta:

  • toolkit run all --config dataset.yml
  • toolkit validate all --config dataset.yml
  • toolkit status --dataset <dataset> --year <year> --latest --config dataset.yml
  • toolkit inspect paths --config dataset.yml --year <year> --json

Cambiamenti principali

Riduzione del surface area

  • rimossi shim deprecated di core
  • rimosso gen-sql
  • rimossi plugin periferici/experimental
  • chiariti meglio i confini tra:
    • runtime core
    • tooling avanzato
    • compatibilità legacy

Miglioramenti al motore

  • refactor del flusso di lettura DuckDB in CLEAN
  • refactor della selezione input CLEAN
  • refactor dell’orchestrazione e validazione CLEAN
  • refactor del profiling RAW
  • aggiunti hint minimi nel metadata RAW per facilitare lettura e diagnostica

Chiarezza del contract runtime/output

  • distinzione esplicita tra:
    • metadata.json
    • manifest.json
    • run record in data/_runs/...
    • inspect paths --json
  • separato nel codice il concetto di:
    • manifest standard di layer
    • manifest RAW libero/layer-specific

Test e manutenzione

  • suite test stratificata con marker:
    • core
    • advanced
    • compat
  • branch finale verificato con:
    • 146 passed
    • ruff check pulito

Documentazione

  • README riallineato al workflow canonico
  • chiariti i confini del toolkit nell’ecosistema DataCivicLab
  • aggiornate le docs su:
    • workflow avanzati
    • feature stability
    • notebook contract
    • runtime boundaries
    • smoke e profiling docs

Impatto

Questa release rende il toolkit:

  • più piccolo
  • più leggibile
  • più coerente con project-template
  • più chiaro per notebook e repo dataset
  • più facile da mantenere come motore tecnico condiviso

Note

Le feature advanced restano supportate ma non fanno parte del percorso base da promuovere nei nuovi repo dataset:

  • resume
  • profile raw
  • run raw|clean|mart
  • artifact policy avanzata
  • compatibilità legacy