I dati sono la risorsa più importante in un sistema informativo e informatico.
Spesso si sente parlare di open data, ma cosa sono veramente e cosa significa in pratica utilizzare dati aperti al posto dei tradizionali dati?
Open data, o dati aperti.
Cosa significa la parola open (aperto) in open data (quindi dati aperti)?
Per capirlo dovreste leggere e studiarvi attentamente la Open Definition (disponibile all’indirizzo http://opendefinition.org/od/), tuttavia per praticità una definizione concisa può essere la seguente:
Un dato aperto è un dato che può essere liberamente utilizzato, riutilizzato e ridistribuito da chiunque – oggetto solo, al più, di richieste di attribuzione e condivisione in modo analogo, al fine di preservarne provenienza e apertura.
Principi fondamentali
La Open Definition stabilisce alcuni elementi fondanti per definire un dato “aperto”, di cui 3 sono i più importanti.
- Disponibilità e accessibilità del dato
I dati aperti devono essere disponibili nella loro completezza, a non più di un costo di riproduzione ragionevole e preferibilmente attraverso il download tramite Internet. I dati devono essere inoltre disponibili in un formato conveniente e modificabile facilmente. - Riuso e redistribuzione
I dati devono essere soggetti ad una licenza che ne permetta il riutilizzo e la redistribuzione. Questi termini devono consentire, inoltre, la possibilità di derivare dati o di unirli ad altre fonti. - Partecipazione universale
Chiunque deve essere in grado di riusare e ridistribuire gli open data. Non sono ammissibili discriminazioni sui campi di applicazione, contro persone o gruppi di persone. A titolo di esempio non sono ammesse restrizione sull’uso non commerciale del dato o restrizioni sull’uso esclusivamente didattico degli stessi.
Cosa comporta nella pratica?
Comporta che gli open data e gli open content (contenuto aperto) possono essere utilizzati, modificati e condivisi liberamente da chiunque per ogni scopo, anche per costruirci un business o aumentare il valore di questi dati aggregandoli in modo opportuno o ripulendoli e trasformandoli in formati facilmente distribuibili o elaborabili.
I principi fondamentali degli open data stabiliscono con precisione punti fermi che consentono di garantire l’interoperabilità dei sistemi. L’interoperabilità è molto importante in quanto consente a componenti diverse di parlarsi e lavorare insieme per aumentare il valore complessivo del sistema, sia a livello informativo che economico.
La capacità di integrarsi dei dati e di costituire sistemi più complessi dei sistemi originali è fondamentale e necessaria per evitare l’effetto Babele: tanti dataset con poca o nessuna possibilità di combinazione e collaborazione.
Perché sono nati gli Open Data?
I dati sono una grande risorsa. Molti individui e organizzazioni (pubbliche e private) collezionano una vastissima gamma di dati diversi per raggiungere gli scopi pre-configurati.
Gli enti governativi, in particolare, hanno un grande valore e impatto nella produzione dei dati per via della quantità e della centralità dei dati collezionati, senza trascurare l’importanza dell’autorevolezza del dato acquisito dall’Ente Pubblico (diversamente dai dati acquisiti dai privati).
I dati aperti nascono dalla consapevolezza che i dati governativi sono dati pubblici per legge e quindi potrebbero (e dovrebbero) essere resi liberi e disponibili per l’utilizzo da parte di tutti, cittadini e aziende.
Perché è importante la disponibilità del dato?
Sono molte le aree applicative che possono beneficiare dell’apertura dei dati. Molti gruppi di persone e aziende possono beneficiare dalla disponibilità degli open data, inclusi gli enti pubblici.
In questo frangente è possibile individuare applicazioni per gli open data in molti settori applicativi, dov’è dimostrata la creazione di valore:
- Trasparenza e controllo democratico
- Partecipazione civica e dei cittadini
- Innovazione e miglioramento di servizi e prodotti esistenti
- Aumento dell’efficienza dei servizi ai cittadini
- Aumento dell’efficacia dei servizi ai cittadini
- Misura dell’impatto dei provvedimenti
- Evidenze dalla combinazione di sorgenti dati diverse
- Analisi di grandi moli di dati alla ricerca di pattern
Non è possibile sapere da dove arriverà la prossima grande innovazione o idea. La creazione di valore non è predicibile e non si può sapere dove avverrà nel futuro.
L’innovazione ha spesso origine da posti improbabili e si sviluppa in modo inaspettato.
Possiedo dei dati che vorrei rendere aperti: come creo un Open Data?
Fantastico! Aprire i dati è una procedura semplice:
- Scegliete il dataset da rendere open
Questo è generalmente il punto più complicato perché, in presenza di molti dati, si tende a voler strafare. Il consiglio è quello di partire in piccolo e iterare più volte un rilascio di dati. Se avete tanti dataset, liberatene uno e ascoltate la community. Poi ripetete con gli altri dati. - Applicate una licenza aperta
Verificate quali diritti di proprietà intellettuale potrebbero essere presenti nei dati e applicate una licenza adeguata ai diritti individuati.
A volte potrebbero esserci ostacoli insormontabili per via di contratti pregressi e condizioni particolari: in questo caso è conveniente tornare al punto precedente e cambiare dataset.
Fate riferimento alla pagina http://opendefinition.org/licenses/ per scoprire la licenza adeguata al vostro caso. Potreste anche volervi confezionare una licenza personalizzata ma è consigliabile consultare un legale in tal caso. - Rendete disponibili i dati
Scegliete un formato adeguato al tipo di dati che state rilasciando pubblicamente. Privilegiate formati aperti e liberi, rispetto a formati proprietari (anche se standard di fatto).
Potreste anche pensare di fornire delle API per accedere direttamente al dato o a sue porzioni. Se non conoscete il termine API fate semplicemente in modo di far scaricare i dati da una pagina del sito in formato compresso. - Fate in modo che si riescano a trovare
Ora avete pubblicato i dati ma nessuno ne è a conoscenza. Fate girare la notizia attraverso comunicati stampa, blog e mailing list. Non dimenticatevi di registrare i nuovi open data nei cataloghi appositi (DataHub per esempio).
Coinvolgete le varie associazioni di dati aperti per la promozione del dato.