lunedì 9 settembre 2013

LOD ed interoperabilità semantica

Siamo quindi alla seconda parte sugli Open Data che descrive la parte più tecnologica, che ci porta poi alla definizione dei Linked Open Data.
All'interno delle organizzazioni pubbliche e private, i dati già ci sono, tocca aprirli, modificando i processi esistenti, affinché sia previsto questo passo non di poco impatto. Si tratta quindi di una reingegnerizzazione dei processi, e dello sviluppo di applicazioni per l'apertura dei dati che consentano di traguardare l'obiettivo.
Una volta pubblicati, i dati possono essere usati dagli sviluppatori o dagli utenti che navigano i dati, dandone un significato, si parla quindi più propriamente di informazione.
I dati vanno poi manutenuti, così come nelle normali applicazioni già esistenti; certamente il fatto che siano pubblici, obbliga ad avere una manutenzione ancora più adeguata, con dei processi e strumenti tecnologici che mirano ad ottenere una qualità del dato più elevata.
L'ottenimento di una maggiore qualità può essere anche prerequisito per la pubblicazione del dato stesso, molto dipende dal dominio e dallo scopo prefisso.
Si pensi ad esempio ad un dataset contenente degli indirizzi in formato testo libero, prima di pubblicarlo potrebbe essere necessario un trattamento del dato per aggiungere al dataset dati più precisi per la localizzazione, quali coordinate geografiche, comune, provincia, etc.
Il processo tecnologico per la produzione di un dato di maggiore qualità può essere anche incrementale, il culmine di questo è l'ottenimento di un formato Linked Open Data, ove si creano inter-relazioni tra dataset gestiti in modo distribuito sul web. Tali inter-relazioni possono essere anche circoscritte in un contesto più limitato, ad esempio all'interno di una rete intranet di un'organizzazione, in tal caso si parla semplicemente di Linked Data.
Attraverso l'utilizzo di metadati, vocabolari condivisi controllati ed ontologie, si riusano dati presenti altrove al fine di arricchire il dato, abilitando un ulteriore livello di interoperabilità, ovvero l'interoperabilità semantica.
Con essa si indica la capacità dei sistemi di trasmettere dati con un significato condiviso, non ambiguo.
E' quindi un requisito per abilitare la logica computazionale, l'inferenza, la scoperta di nuova conoscenza.
L'interoperabilità semantica è il massimo livello di interoperabilità concernente il dato, che deve necessariamente verificare un altro livello di interoperabilità, ovvero quello sintattico, come ad esempio quello offerto dal formato HTML delle pagine web, o dal formato XML dei dati che si scambiano i servizi web.
L'interoperabilità semantica passa per l'interoperabilità da progettazione, che si raggiunge attraverso una progettazione ad un livello quanto più generico, indipendente dall'applicazione e basata possibilmente sui principi di architetture WOA(Web Oriented Architecture).
L'obiettivo di generalizzare le dipendenze e le relazioni è di fondamentale importanza per la condivisione dell'informazione.
Nell'interoperabilità da progettazione, in linea con l'Enterprise Architecture, viene data notevole importanza all'aspetto middle-out della progettazione, ovvero al fatto di concentrarsi sugli identificatori, i formati ed i protocolli di scambio delle informazioni(IFaPs, Identifiers, Formats and Protocols).
Non si parte quindi da un design top-down in cui si parte dall'esigenza particolare o da un design bottom-up in cui si parte dalla particolare implementazione, ma ci si posiziona in mezzo partendo da un insieme di IFaPs aperte ad una serie di possibili usi ed implementazioni.