Quali dati devono essere open data? I primi 10!

letto 4879 voltepubblicato il 27/12/2011 - 17:16 nel blog di Salvatore Marras, in Open Government

A parte il fatto, impressionante, che esordisce con 350.000 "giochi" di dati, il contiene molte informazioni utili anche per l'Italia. Una che mi sembra importante condividere, con il contest di in corso, è quali sono i dati più richiesti. Sono messi belli in ordine nella home page: basta cambiare un tab!

Per primi i risultati delle elezioni. Questi non dovrebbe essere difficile renderli pubblici: il pubblica i dati di sintesi e potrebbe facilmente rendere disponibili i dati elementari. Il riuso di questi dati è limitato solo dalla fantasia, basta pensare alle . Non ci sono dati aperti.

Al secondo posto i dati sui dipendenti della PA. Forse il Italia questo dato è più frammentato e si dovrebbero incrociare diverse fonti dalla alla . La ha dato recentemente il buon esempio pubblicando i suoi dati in formato aperto. Pochi dati aperti.

Seguono i dati sulla sicurezza e criminalità. Sembra che i dati non abbiamo il dettaglio territoriale utile per fare applicazioni note come , si fermano ai dipartimenti. In Italia il soggetto di riferimento è il servizio della Direzione Centrale della Polizia Criminale. Dati niente e i rapporti al parlamento sulla criminalità si fermano al 2006. Non ci sono dati aperti.

Al quarto posto i risultati della scuola superiore. Dati che misurano le prestazioni di ogni istituto superiore. La Commissione Europea prevede un sulla qualità dell'istruzione scolastica. Un  utilizza 96 indicatori, dei quali presso il Ministero dell’Istruzione dell’Università e della Ricerca, il Ministero dell’Interno, la Ragioneria Generale dello Stato, l’ISTAT e l’INVALSI. Qualcosa di analogo è stato fatto per . Non ci sono dati aperti.

Impiego e disoccupazione seguono al quinto posto. L'Istat mette a disposizione nel suo in formato aperto tutti i suoi dati. Sufficienti dati aperti?

Al sesto posto la fiscalità locale. I dati li raccoglie il del MEF e li dovrebbe pubblicare l'Istat (su dati.istat.it non li ho trovati). Qualcosa pubblica l'. L'Agenzia del Territorio potrebbe mettere a disposizione i dati catastali insieme alle . Non ci sono dati aperti.

I servizi sanitari con i dati relativi alle strutture, alle risorse e agli indicatori di servizio in Italia sono di competenza regionale. Non ci sono open data nemmeno nei portali dei dati aperti di Piemonte e Emilia Romagna. Qualche altra regione mette a disposizione banche dati consultabili on line e il  file xls. Non ci sono dati aperti.

L'inquinamento industriale è all'ottavo posto. I dati sull'ambiente sono gestiti nelle regioni dalle Arpa. L'Ispra cura il registro nazionale  e diverse per le quali si sta orientando verso una pubblicazione aperta. Non ci sono dati aperti.

Al nono i finanziamenti sulla politica agricola comunitaria. In Italia i dati più interessanti in questo ambito riguardano l'utilizzo dei fondi strutturali nelle regioni obiettivo convergenza. Nonostante ci sia l'obbligo della diffusione e che all'articolo 105 del  in approvazione si preveda esplicitamente il formato CSV, nessuna regione li ha pubblicati in una modalità rielaborabile. Non ci sono dati aperti.

Geolocalizzazione dei trasporti e dei servizi pubblici al decimo e undicesimo. Qui le fonti possono essere centrali e locali e qualcosa è disponibile, magari in modo frammentato. Mi sembra più facile trovare dati cartografici sulle strutture (esempio ) che informazioni sui servizi. Il comune di Torino, la regione Toscana e altre amministrazioni usano il formato Google Transit, ma non ho trovato dove scaricare i dati per eventuali riusi (sarebbe preoccupante una esclusiva per Google...). La geolocalizzazione dei servizi è un ambito etremamente vasto: dai musei alle scuole, dalle palestre ai cimiteri, dai servizi sociali a queli sportivi... Pochi, molto pochi dati aperti.

Sicuramente si potrebbe andare più a fondo e mi scuso per eventuali imprecisioni. Il mio è un primo esercizio senza troppe pretese stimolato dal portale data.gouv.fr. Però mi sembra che sia importante lavorare per rendere disponibile informazioni e dati che rispondano a interessi reali, che abbiano un valore che giustifica anche il loro riuso in applicazioni e strumenti di analisi. Ogni contribuito per completare il quadro delle fonti è ovviamente benvenuto.

8 commenti

Alberto Cottica

Alberto Cottica14/01/2012 - 18:52
Guarda Salvatore che non mi pare che questi siano i dati più richiesti, ma quelli con il maggior numero di "rechèrches", cioè i dataset con più queries... tra quelli disponibili. Se non ho capito male, non è indicativo di ciò che gli utenti desidererebbero maggiormente vedere se potessero scegliere tra tutti i dataset, compresi quelli non rilasciati in formato aperto.
Salvatore Marras

Salvatore Marras15/01/2012 - 00:16
In mancanza di altre informazioni ho preso i più ricercati come indicativo di desiderati (senza pretesa di fare un trattato scientifico), contando che nessun altro paese ha pubblicato tanti dataset in un colpo... alla Francia va riconosciuta una attenzione alla informazione del settore pubblico (PSI) piuttosto rara, prima di fare open data hanno fatto una sistematica catalogazione dei database della pubblica amministrazione. Immagino che non abbiano aperto tutti i dataset, qualcuno ha idea se queste informazioni sono disponibili?
Luigi Sculco

Luigi Sculco31/12/2011 - 13:31
Il problema, a mio avviso, non e' tanto quello di "quali dati debbano essere open", ma l'uso dei medesimi per creare valore economicamente spendibile, inteso come accelerazione della "Macchina Pubblica" e, conseguentemente, recupero di competitività a livello globale. E' un concetto semplice, ma profondo: che senso ha aprire i dati se questi non entrano, poi, in meccanismi di efficientamento globale di una intera area geopolitica o, meglio ancora, pervadono il globo con nuove idee volte a superare l'attuale fase di stallo? La Rete ha rivoluzionato completamente il paradigma centro-periferia, sostituendo alla vecchia e comune "gerarchia" il concetto di "adhoc-crazia", dove due qualsiasi nodi instaurano tra loro un meccanismo di richiesta-risposta indipendentemente dalle funzioni burocratiche che le separano. In altri termini, se una volta era difficilissimo scrivere al Presidente della Repubblica, ottenendone risposta, ora e' divenuto non solo molto più semplice farlo, ma si e' anche alzata notevolmente la probabilità di ottenere responso, poiché il meccanismo e' molto più rapido e cablato, quindi, tracciabile. Qual e', a tal punto, la logica conseguenza? Il potere decisionale migra dal centro alla periferia dello Stato, in tutte le sue componenti (amministrazioni locali, regionali e centrali). E' in periferia che si fruisce dei risultati delle decisioni prese al centro ed e' dalla periferia che la Rete ha potenziato il flusso di richiesta... La periferia, pertanto, con la sua Dirigenza, non può aspettare imbelle che il centro decida, ma, pur rispettando l'ordine costituito, deve porsi obiettivi strategici che non sono di mera attesa, ma di azione. In tal senso, deve partire da un chiaro panorama di indicatori gestionali e macro-economici per migliorare i risultati futuri. Solo così, aggiungendo velocità a velocità si stimolano le nuove idee per affrontare un futuro che, ultimamente, appare essere e divenire sempre più volatile. Questo e' a mio avviso il vero ruolo dell'Informatica pubblica, della Rete e degli "open data". Luigi Sculco
Attilio A. Romita

Attilio A. Romita31/12/2011 - 14:14
Mi sembra che quanto dice Luigi SCULCO sia un ribaltamento del concetto di dati aperti ...o almeno io lo interpreto così, ma forse sbaglio. La periferia, visto che non ha prescrizione di quali dati aprire, apre solo i dati che ritiene possano essere utili. Ma qui c'è contraddizione, sempre che io abbia capito bene. Tutti i dati devono essere resi disponibili, poi ciascuno, libero cittadiono o PA, ne farà l'uso che vuole.
profilo vuoto

profilo vuoto28/12/2011 - 17:09
quanto poi a geodati vorrei ricordare che il portale cartografico nazionale del ministero dell'ambiente - http://www.pcn.minambiente.it/GN/ - ha una quantità impressionante di dati rilasciati però con una licenza restrittiva che vieta la possibilità di utilizzo a fini commerciali
profilo vuoto

profilo vuoto28/12/2011 - 17:07
Rispondendo alla domanda sui dati di trasporto in formato GTFS Sul sito di google transit si scopre invece che sono ben 12 le agenzie di trasporto che danno i loro dati a Google http://www.google.com/intl/it/landing/transit/text.html#eu Brescia Brescia Trasporti SpA Como ASF Autolinee Genova AMT Genova La Spezia ATC Marche TRASFER Modena ATCM S.p.A. - Azienda Trasporti Collettivi e Mobilità Naples Solo il livello di Transit Reggio Emilia ACT Torino Gruppo Torinese Trasporti Toscana Trasporti Regionali Trentino Trentino trasporti S.p.A. Servizio Urbano Trento Vicenza AIM Il dato deve essere reso disponibile su un server in formato GTFS. Il sito gtfs data exchange raccoglie l'elenco (su segnalazione volontaria) le url dove e' possibile scaricare i dati in questo formato. Gli unici pubblicati sono quelli di Torino http://www.gtfs-data-exchange.com/agency/gruppo-torinese-trasporti/ http://www.gtfs-data-exchange.com/agency/gtt-servizi-turistici/ Per ironia c'è il feed (non ufficiale) dei dati di trasporto della Sardegna http://www.gtfs-data-exchange.com/agency/trasporti-regionali-della-sarde... ... ho espresso il mio disappunto anche sul mio blog ... http://de.straba.us/2011/12/28/dati-dei-trasporti-ma-perche-solo-per-goo...
profilo vuoto

profilo vuoto28/12/2011 - 15:16
In un paese come l'Italia credo che sarebbe necessario avere dati aperti sul patrimonio dei Beni culturali (storici, archeologici, monumentali ecc.) sia per monitorarne la tutela, sia per incrementarne la fruizione. I recenti casi di Pompei e del Colosseo illustrano lo stato di decomposizione dei gioielli del nostro patrimonio, ma non rendono evidente quanto sia diffusa questa lenta (?) distruzione. La possibilità di fare maggiore tutela grazie ad un semplice censimento pubblico ed aperto di questi beni è evidente, non solo per evidenziare le carenze presenti, ma per coadiuvare le politiche di tutela attraverso buone pratiche di cittadinanza attiva. D'altra parte questi beni sono una ricchezza per la comunità tutta sia da un punto di vista culturale, sia da un punto di vista economico, la possibilità di avere dati aperti potrebbe consentire lo sviluppo di pratiche alle quali non pensiamo e che in un territorio così ricco come il nostro potrebbero significare un buon volano economico. In ultimo la conoscenza soprattutto del patrimonio archeologico sepolto consentirebbe migliori pratiche di archeologia preventiva (le valutazioni di impatto aracheologico VIARCH artt, 95 e 96 del codice per gli appalti), consentendo di costruire opere sia pubbliche, sia private nei luoghi più idonei, con minor costo e mitigando l'impatto sul patrimonio.
Laura Strano

Laura Strano27/12/2011 - 23:34
potrebbe essere interessante, qualora non incluso nei servizi publici, che si aprissero al pubblico i dati relativi a consistenza numerica, ubicazione e utilizzo delle unità abitative immobilari di proprietà dello Stato, della Regione, dei Comuni, degli IACP e degli ex IACP trasformati e variamente denominati, ecc. Mi riferisco non solo agli alloggi di edilizia sociale, ERP, ma anche e soprattutto alla possibilità di consentire in futuro un possibile riuso dei dati relativi alle unità immobiliari non destinate a finalità sociali, bensì a finalità commerciali, le botteghe e i locali commerciali per intenderci .... sarebbe interessante conoscere i dati sulla consistenza numerica, sulle modalità di gestione, per capire a chi e con quali procedure (asta pubblica, affidamenti diretti ecc. )sono state assegnate in locazione, a quali canoni .... quanto rendono l'ATC di Torino (ente pubblico) ci offre un buon esempio di trasparenza quantomeno nella fase precedente l'assegnazione che è già qualcosa http://www.atc.torino.it/www/locali.aspx ma non tutte le Regioni gestiscono il patrimonio pubblico di edilizia sociale come fà la Regione Piemonte .... non so se ci sono dati aperti a livello Regionale ma a mio avviso tutte le Amministrazioni pubbliche dovrebbero aprire anche i dati relativi al patrimonio immobiliare pubblico.