-
Giugno 2011
-
Sabato 11
www.senato.it, tecnologie open source per il motore di ricerca e l'archivio legislativo. 550 mila documenti indicizzati: è online la nuova banca dati sull'attività parlamentare
Più di 550 mila documenti indicizzati grazie ad un software open source; modalità di ricerca all'avanguardia con caratteristiche come l'autocompletamento del testo e l'evidenziazione automatica delle parole ricercate nei risultati; la possibilità di filtrare i risultati in base ai valori di una o più proprietà (ad esempio: Legislatura, tipologia di documento, anno, ecc.). Sono queste le principali caratteristiche del nuovo motore di ricerca entrato in funzione in questi giorni nel sito del Senato, con una interfaccia quasi immutata per ridurre al minimo l'impatto sugli utenti abituali.
Le banche dati internet di Palazzo Madama si sono guadagnate negli anni una crescente autorevolezza nel settore della documentazione sull'attività parlamentare, oltre a rappresentare un contributo fondamentale alla trasparenza dei lavori legislativi. Lo dimostrano gli accessi in continuo aumento: nel corso del 2004 ne sono stati contati 96 mila; nel 2010 si è passati a 5 milioni 322 mila, con un aumento di oltre il 5 mila per cento.
I dati conservati dai server di Palazzo Madama dimostrano inoltre che gran parte dei "dossier" sull'attività parlamentare presentati da movimenti politici, centri di ricerca, fondazioni ecc., anche a scopo di critica, vengono elaborati a partire da interrogazioni (spesso svolte in automatico da appositi software) alle banche dati del Senato.
Il nuovo motore di ricerca è basato sul software open source "Apache Solr" (http://lucene.apache.org/solr/), la cui adozione non comporta alcun costo in termini di licenze d'uso.
E' in linea anche il nuovo archivio legislativo, sviluppato e alimentato da personale del Senato e anch'esso realizzato con software open source (in questo caso, il sistema documentale "Alfresco", www.alfresco.org). L'archivio contiene la copia digitale di circa 79 mila atti stampati (disegni di legge, resoconti, ordini del giorno, bollettini di Giunte e Commissioni, etc.) a partire dalla Prima Legislatura repubblicana, in formato Pdf, quindi nella forma più simile all'originale stampato, inseriti all'interno di un sofisticato apparato di classificazione ed indicizzazione.
La catalogazione degli atti parlamentari ha fatto un grande passo avanti, anche attraverso un maggiore impegno di risorse umane, e questo ha consentito, tra l'altro, il varo di un servizio di feed RSS che consente agli utenti di essere aggiornati in tempo reale sulla pubblicazione degli atti. In pratica, si tratta di una nuova forma di "abbonamento" - questa volta totalmente gratuito - che consente a tutti gli interessati di visualizzare (ed eventualmente salvare nel proprio disco rigido) le versioni pdf degli atti stampati che, fino a pochi anni fa, potevano essere ricevuti solo in formato cartaceo, previo abbonamento e con spedizione postale, quindi con una modalità decisamente onerosa.
La pubblicazione dei feed RSS di tutti gli stampati aumenta l'accessibilità degli atti, migliora la trasparenza dell'Istituzione, ed abilita percorsi virtuosi di risparmio basati sulla riduzione delle tirature tipografiche grazie alla tempestiva disponibilità pubblica delle versioni elettroniche.
-