[Barcamp #InnovatoriPA 2012]: Uso degli Open Data

letto 2969 voltepubblicato il 06/06/2012 - 13:54 nel blog di Gianfranco Andriola

 

Che la teoria del governo aperto abbia ormai attirato la curiosità delle istituzioni pubbliche italiane sembra essere oggi un dato di fatto, come ultima conferma è arrivato quest’anno ForumPA 2012 con un sottotitolo decisamente eloquente: “: Open data, Smart city, Cloud Computing”. Molte, moltissime le iniziative dedicate ad ognuno dei tre temi tra cui – come ormai di consuetudine - il , quest’anno dedicato alla “Smart governance”, ovvero il governo con e attraverso la rete.

Open data: da nicchia a consuetudine

Sarà che è il meno oneroso in termini economici e organizzativi, sarà che le iniziative internazionali continuano a moltiplicarsi e noi italiani non vogliamo essere da meno, sarà che l’Unione europea sempre con maggiore insistenza, ma è ormai un dato di fatto che - tra i temi connessi all’Open Government appena citati - l’open data sembra, ad oggi, quello che sta riscuotendo maggiore interesse presso le pubbliche amministrazioni italiane. Più di resultano essere i dataset (insiemi di dati) aperti rilasciati dalla PA italiana in questo momento; circa i datastore (piattaforme gestite da enti pubblici attraverso cui è possibile scaricare i dati in maniera strutturata); una legge regionale approvata ed altre 9 in corso di discussione sul tema ( per maggiori informazioni). L’open data sembra quindi essere un tema che merita attenzione e come tale diventa oggetto di critica costruttiva da parte di una platea sempre più vasta di esperti di settore. A parere di chi scrive in questo momento emergono almeno due approcci critici: da un lato gli entusiasti (sul piano internazionale ben rappresentati da del battaglione O’Railly) che contribuiscono esaltando pregi e potenziali ricadute dello strumento; dall’altro gli scettici (ugualmente ben rappresentati da della Gartner) che placano gli entusiasmi iniziali mettendo in guardia dai rischi che possono arrivare da una gara all’esposizione dei dati pubblici aperti priva di una solida governance alle spalle. Al tavolo di discussione “Uso degli Open Data” del Barcamp di quest’anno sono emersi entrambi gli orientamenti, concentrandosi su tre diversi aspetti del fenomeno: ; potenzialità e limiti dei formati più evoluti; cluster di dati e destinatari.

 

“Ne sarebbe valsa la pena anche se fosse servito solo ad aiutare un qualsiasi studente degli stati uniti a fare meglio i propri compiti a casa”, così qualche tempo fa Vivek Kundra, primo Chief Information Officer del Governo Obama, commentava l’importanza dell’apertura dei dati governativi statunitensi ponendo l’accento su come il dovere di trasparenza che uno stato di diritto ha nei confronti dei propri cittadini da solo possa giustificare la fattibilità anche economica di questo nuovo paradigma di divulgazione delle informazioni prodotte dalle pubbliche amministrazioni. Eppure, in un periodo in cui dall’ottimizzazione della spesa pubblica può dipendere un contributo importante dell’economia di un Paese, l’etica da sola potrebbe non bastare. Al di là delle metodologie di rilevazione di cui ci si può avvalere per estrarre un ipotetico “open data ROI” (su questo si rimanda ad un esaustivo di approfondimento) bisogna tener conto di quanto la pratica dell’open data sia ancora acerba nel nostro paese. A questo proposito si consideri, ad esempio, come in Italia non esiste ancora una normativa nazionale che affronti in maniera approfondita il tema (al contrario di quanto è accaduto sin da subito negli USA) e di come questo di ripercuota nella pratica, producendo forme ancora poco strutturate, a volta quasi sporadiche, di rilascio dei dati da parte degli enti pubblici i quali spesso si riservano dal pubblicare informazioni davvero appetibili per il mercato (i dati sulle rendite catastali dell’Agenzia del territorio sono il , ma non il solo). In un contesto come questo gli sviluppatori, intesi qui come i “ri-utilizzatori” dei dati, ovvero coloro che attraverso la propria creatività e competenza aggiungono valore ai dati creando indotto economico, sembrano non vedere ancora nella PA un soggetto affidabile, una fonte su cui investire in termini di competenze e risorse.

 

Oltre all’arcinoto e indomito motto (ROW DATA NOW!) il grande contributo dato da al movimento internazionale dell’open data è stata la sua così detta “” cioè una classificazione in una scala cha va da 1 a 5 dei possibili formati in cui esporre i dati aperti, che vede sul grandino più basso i file statici (es. pdf e immagini scannerizzate) per poi arrivare, passo dopo passo,  ai così detti Linked Open Data, cioè “un aspetto del web semantico, usato per descrivere un metodo di esporre, condividere e connettere dati attraverso URI deferenziabili (cit. )”. A questo proposito, nel corso della discussione al tavolo del Barcamp, è spesso emersa l’esigenza di una riflessione più approfondita e consapevole sugli effettivi benefici di un formato complesso (sia in fase di implementazione, che in quella di gestione) come quello Linked Data può portare. Esporre dati in formato linked comporta necessariamente la composizione di una ontologia che ne descriva le relazioni tra le diverse “entità” presenti nel database, impresa assolutamente non banale se si considera il dominio sconfinato dei tematismi trattati dalle diverse amministrazioni pubbliche per i quali le potrebbero non essere sufficienti. Va poi tenuto conto della gestione tecnologica dei dati linked attraverso formati evoluti come l’RDF (acronimo di , un così detto dialetto del più noto linguaggio XML), la quale richiede professionalità di alto profilo e quindi non proprio a buon mercato. Volendo riassumere in un'unica frase le considerazioni emerse nel corso della discussione potremmo dire che, confrontando gli effettivi benefici derivanti dall’uso ai Linked Open data rispetto da altri formati meno evoluti e (quindi) meno onerosi, il gioco potrebbe non valere la candela. Anche se su questo sembrano arrivare segnali incoraggianti dai grandi player del web: a breve Wikimedia dovrebbe rilasciare una versione stabile di , una enciclopedia composta da database linked costruiti attraverso il contributo degli utenti come già avviene per la più famosa Wikipedia; così come la stessa Google ha lanciato poche settimane fa il proprio , cioè una funzione del proprio motore di ricerca che sfrutta le potenzialità del web semantico (e quindi dei dati in formato linked) per offrire risultati di ricerca in maniera più precisa e strutturata.

 

Una questione di destinatari

Oltre essere un riferimento condiviso sul piano internazionale, scala di Berners-Lee citata al paragrafo precedente ha rappresentato, per i formati di rilascio dati aperti, una chiave di lettura del fenomeno, un elemento sulla base del quale tutti gli operatori del settore – siano essi PA produttrici di dati o sviluppatori “consumatori” degli stessi dati – si sono potuti confrontare in maniera univoca per pianificare un’iniziativa di apertura o di riutilizzo del patrimonio informativo della pubblica amministrazione. Nulla di simile è avvenuto ancora per le categorie dei dati. Al di là delle canoniche aree tematiche (es. Ambiente, Turismo, Istruzione, Sanità, ecc) in cui di solito i siti istituzionali degli enti pubblici categorizzano i proprio contenuti non si è ancora provato a fare un posso avanti nella definizione di cluster di dati che possano essere funzionali più al loro riutilizzo che alla loro archiviazione. Qualcosa in questo senso lo si sta facendo con i dati aperti geolocalizzati, dove in alcuni data store (ad esempio americano o il del comune di Firenze) è stata fatta la scelta redazionale di dedicare una sezione specifica a questa particolare tipologia di informazioni. Partendo da questo spunto si potrebbe proseguire sulla stessa strada provando a creare nuove categorie di raggruppamento dei dati, come da esempio:

  • dati in tempo reale, funzionali alla creazione di servizi avanzati e quindi particolarmente appetibili da parte degli sviluppatori

  • dati non numerici, come ad esempio le FAQ che tutti gli URP della PA producono per i propri siti informativi

  • dati necessari alla gestione delle attività, come tutti quei dati che servono all’Amministrazione per il corretto funzionamento dei suoi processi. Ad esempio i dati anagrafici, provenienti da altri Enti.

  • dati prodotti come risultato dell’attività, cioè i dati in uscita ottenuti come risultato finale dei processi e dei procedimenti gestiti da un ente pubblico. Ad esempio: dati relativi all’inquinamento ambientale prodotti dalle centraline di controllo dislocate sul territorio; dati relativi all’incidenza della criminalità sul territorio prodotti dalle prefetture; dati inerenti i risultati scolastici prodotti dalle scuole e dai provveditorati; dati riferiti al mercato immobiliare; ecc

  •  dati prodotti nella gestione delle attività, cioè i dati che l’Amministrazione ottiene come sottoprodotto di un processo. Ad esempio: dati relativi all’attività dei parlamentari e dei consiglieri regionali, provinciali o comunali. (queste ultime tre categorie sono già stata proposte nel , scaricabile dal sito Dati.gov.it)

Più in generale sarebbe utile che le pubbliche amministrazioni esplicitassero anche all’esterno - attraverso categorie uniformi - i criteri e le modalità di produzione dei dati aperti, al fine di semplificare la lettura dei dati e dei fenomeni anche presso quelle categorie di utenti (gli sviluppatori su tutti) che non sono addentro i meccanismi della PA.