You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Molti dataset pubblici non misurano direttamente il fenomeno che ci interessa.
Misurano invece un suo proxy: una traccia indiretta, utile ma non equivalente.
E' un punto importante, perche' una parte consistente degli errori di lettura nasce proprio qui: si prende la metrica disponibile e la si tratta come se fosse il fenomeno reale.
Alcuni esempi semplici
Nei dati sui delitti, spesso osserviamo il momento della denuncia, non il reato "reale" in senso pieno.
Nei dati scolastici, le iscrizioni non coincidono automaticamente con la presenza effettiva o con l'abbandono durante l'anno.
Nei dati ambientali, l'assenza di un superamento puo' dipendere anche dal fatto che una sostanza non e' stata cercata o monitorata in modo uniforme.
Perche' conta
Un proxy puo' essere molto utile, ma va letto per quello che e'.
Se lo carichiamo di significato oltre il suo perimetro, il rischio e' duplice:
fare claim troppo forti
leggere come "miglioramento" o "peggioramento" qualcosa che il dataset, da solo, non puo' davvero dimostrare
Come proviamo a trattarlo
Quando lavoriamo su una fonte, cerchiamo di chiarire presto:
cosa misura davvero
cosa non misura
qual e' il salto interpretativo piu' rischioso
se il proxy e' comunque abbastanza utile da sostenere una domanda pubblica seria
Questo non vuol dire scartare il dato.
Vuol dire usarlo con un perimetro piu' chiaro.
Domanda aperta
Quali sono, secondo voi, i casi in cui un dato pubblico sembra parlare da solo ma in realta' sta misurando solo un proxy parziale del problema?
reacted with thumbs up emoji reacted with thumbs down emoji reacted with laugh emoji reacted with hooray emoji reacted with confused emoji reacted with heart emoji reacted with rocket emoji reacted with eyes emoji
Uh oh!
There was an error while loading. Please reload this page.
-
Molti dataset pubblici non misurano direttamente il fenomeno che ci interessa.
Misurano invece un suo proxy: una traccia indiretta, utile ma non equivalente.
E' un punto importante, perche' una parte consistente degli errori di lettura nasce proprio qui: si prende la metrica disponibile e la si tratta come se fosse il fenomeno reale.
Alcuni esempi semplici
Perche' conta
Un proxy puo' essere molto utile, ma va letto per quello che e'.
Se lo carichiamo di significato oltre il suo perimetro, il rischio e' duplice:
Come proviamo a trattarlo
Quando lavoriamo su una fonte, cerchiamo di chiarire presto:
Questo non vuol dire scartare il dato.
Vuol dire usarlo con un perimetro piu' chiaro.
Domanda aperta
Quali sono, secondo voi, i casi in cui un dato pubblico sembra parlare da solo ma in realta' sta misurando solo un proxy parziale del problema?
Beta Was this translation helpful? Give feedback.
All reactions