«
»
Minerva Web
Rivista online della Biblioteca "Giovanni Spadolini"
A cura del Settore orientamento e informazioni bibliografiche
n. 20 (Nuova Serie), aprile 2014

LOD2014 “Linked Open Data: where are we?”. Roma, 20-21 febbraio 2014

Il 22 febbraio 2014 si è svolta in molte città della penisola la quarta edizione italiana dell'International Open Data Day, l'iniziativa che annualmente coinvolge i cittadini di tutto il mondo nella creazione, analisi, adozione, condivisione di "dati aperti" ("Open Data" appunto), per sensibilizzare i singoli e per sollecitare istituzioni e governi a intraprendere politiche attive in questa direzione, alla luce della pervasività delle nuove tecnologie di informazione e comunicazione e anche in vista di una sempre maggiore trasparenza dei processi decisionali.

Il 20 e 21 febbraio 2014, in prossimità dell'evento, l'Ufficio italiano del World Wide Web Consortium (W3C) - la comunità internazionale che si interessa dello sviluppo del Web - ha organizzato a Roma presso l'Archivio Centrale dello Stato un convegno per condividere informazioni sugli ultimi sviluppi e applicazioni nel mondo Web dei Linked Open Data (LOD), dati non solo "aperti" (basati su standard non proprietari) e riusabili, ma anche connessi e interoperabili, secondo la filosofia del Web Semantico.

In prospettiva, si va dunque costituendo un "Web dei dati" che si affianca al Web così come attualmente lo conosciamo e che consentirà di mettere a sistema e a frutto - dentro una cornice semantica - i contenuti informativi grezzi accumulati fin qui e da qui in poi prodotti.

Il fittissimo programma del convegno, articolato in brevi interventi di presentazione di iniziative e progetti, si è aperto con una introduzione di Phil Archer del W3C e una illustrazione di Diego Valerio Camarda sullo stato dell'arte per i Linked Open Data in Italia. Si sono poi alternate sessioni dedicate alle applicazioni dei LOD nei settori più disparati: dall'urbanistica e dai progetti di smart cities ai nuovi linguaggi dei motori di ricerca, dall'agronomia all'e-learning, dalla pubblica amministrazione alle arti dello spettacolo, dall'industria e dalle osservazioni satellitari all'archivistica e alla conservazione e comunicazione del patrimonio storico e culturale.

Non sono mancati interventi di specifico interesse per il settore bibliotecario; in particolare, nella sessione sulle Best practices del giovedì mattina, l'intervento presentato da Vittore Casarosa (scritto con la collaborazione di Anna Maria Tammaro e di Carlo Meghini) ha sottolineato la centralità dei Linked Data per i progetti di costruzione delle biblioteche digitali e presentato l'esperienza del Master Internazionale DILL. Nel pomeriggio della stessa giornata lo stesso Casarosa (a partire da un progetto seguito insieme a Giulia Lombardi e Anna Maria Tammaro) ha invece illustrato un'esperienza di esportazione del catalogo di una piccola biblioteca nel Web, sotto forma di dati aperti e liberamente interrogabili, a testimonianza non solo della fattibilità tecnica di questa operazione, ma anche dei vantaggi che ne derivano per la biblioteca stessa e per il suo pubblico.

Spunti e riflessioni sono arrivati anche dalle sessioni dedicate al Cultural heritage, in particolare dagli interventi dedicati alla messa a disposizione dei LOD relativi alla biblioteca digitale europea, Europeana, al portale culturale italiano, Cultura Italia, e al Servizio Bibliotecario Nazionale (SBN).

Il Senato della Repubblica ha partecipato presentando il sito dati.senato.it, interfaccia di un progetto che ha lo scopo di "rendere disponibili, in formati aperti e liberamente riusabili, gran parte dei dati già pubblicati nel sito istituzionale del Senato; ciò al fine di garantire una maggiore trasparenza sull'operato dell'istituzione e favorire la partecipazione concreta dei cittadini ai processi decisionali. In particolare, sono pubblicati i dati relativi alla composizione del Senato, ai disegni di legge, e all'attività dei senatori (presentazione di documenti e disegni di legge, interventi e votazioni elettroniche) a partire dalla XIII legislatura [cioè dal 1996] fino ad oggi. Tali dati sono aggiornati con cadenza giornaliera" (per leggere la presentazione completa del progetto cliccare qui).

Gli ingegneri Carlo Marchetti e Giovanni Lalle, del Servizio Informatica del Senato, hanno esposto le principali funzionalità del sito, caratterizzato da una veste volutamente essenziale per rivolgersi a un pubblico il più possibile ampio.

Due le principali modalità di accesso ai dati: l'opzione Interroga i dati, per un pubblico che conosca il linguaggio di ricerca specialistico SPARQL e sappia come impostare una query;l'opzione Scarica i dati, che guida alle principali possibilità di ricerca nei dati relativi a composizione, atti, votazioni del Senato. I dati sono disponibili in diversi formati, includendo la possibilità di esportazione in un comune programma di foglio elettronico. Si possono anche scaricare insiemi di dati precostituiti (dataset) per le ricerche più frequenti.

Oltre ai dati che attengono alla sfera politica dell'attività del Senato, si segnala che è stata realizzata la machine readibility anche per i testi dei Dossier prodotti dai servizi interni di documentazione parlamentare, estendendo dunque anche al versante amministrativo dell'attività dell'ente la disponibilità di informazioni strutturate e "aperte".

Il progetto del Senato si inserisce in un contesto di studi sulle possibilità di elaborare strutture di LOD per i testi legislativi (come ha fatto il sito ufficiale per la legislazione del Regno Unito). La nuova frontiera è tener conto sempre più dei flussi di lavoro e dei procedimenti che hanno portato alla creazione di quei testi, con lo scopo di verificare la validità del procedimento - dunque del testo stesso - e di visualizzare (anche graficamente) le relazioni dei testi con altri connessi (ad es., altre disposizioni che un testo normativo modifica/abroga o da cui è modificato/abrogato), in un contesto semanticamente più ricco.

Su questi aspetti si è concentrata la doppia relazione di Monica Palmirani, che ha parlato delle ontologie per descrivere i documenti legislativi e di un modello realizzato per gli atti normativi della Regione Piemonte. L'obiettivo di creare un'ontologia sufficientemente generale ed estensibile per rappresentare anche procedure di normazione che cambiano nel tempo si scontra con alcune criticità: in particolare, la necessità di confrontarsi col linguaggio di marcatura proposto dallo standard NIR (NormeInRete) - pionieristico in Italia, ma che non rappresenta più lo stato dell'arte - e l'esigenza di far convergere su linguaggi comuni enti diversi.

Dal convegno sono emerse inoltre numerose questioni aperte rispetto al futuro dei Linked Open Data. In particolare, diversi relatori hanno sottolineato che non basta mettere a disposizione dei dati aperti per garantirne la riusabilità e che la messa in relazione di questi dati allo stato attuale richiede ancora un pesante intervento umano e non è realizzabile in modo automatico, in quanto le componenti architetturali, i linguaggi, i vocabolari non sono del tutto trasparenti e capaci di comunicare tra di loro. Altri hanno posto l'accento sulla difficoltà di rappresentare la complessità semantica dei contenuti informativi, in particolare di quelli più articolati, attraverso l'architettura attualmente in uso per i LOD, basata sul meccanismo delle "triple" di tipo soggetto-predicato-oggetto. Infine, da più parti si è messo in evidenza che al momento attuale il Web dei dati è ancora una "cosa da informatici", nel senso che la possibilità di un utilizzo allargato di tali dati mediante interfacce amichevoli è ancora all'inizio.

Ad oggi, come è stato testimoniato dal convegno, numerosi soggetti pubblici e privati stanno realizzando servizi specialistici - o su base disciplinare o rivolti a particolari categorie di pubblico - che, sfruttando i LOD già disponibili, consentono di cominciare a sperimentare le potenzialità - in buona parte ancora inesplorate - del Web dei dati.

L'obiettivo di lungo termine è però quello di creare un Web semantico globale a disposizione di tutti, che sia interrogabile in maniera semplice e a partire dal quale si possano realizzare innumerevoli servizi per i più diversi usi (forse ad oggi ancora inimmaginabili), sebbene allo stato attuale gli ostacoli al raggiungimento di questo obiettivo, nonché i possibili intoppi, siano numerosi e non facilmente superabili.

Certamente le biblioteche non possono restare fuori da tali processi, sia in quanto fornitori di dati bibliografici e di dati contenuti nei documenti digitalizzati, sia in quanto fruitori dei LOD messi a disposizione dalle altre istituzioni. A distanza di oltre 100 anni dall'elaborazione dell'utopia del controllo bibliografico universale da parte di Otlet e La Fontaine, sembrerebbe che il sogno dei bibliotecari di offrire una visione d'insieme del patrimonio bibliografico mondiale sia tecnologicamente a portata di mano, anzi possa addirittura evolvere in una disponibilità globale dei dati bibliografici all'interno del quadro complessivo di apertura e di interconnessione di dati di qualunque tipologia.

Archivio Newsletter

FINE PAGINA

vai a inizio pagina