A cura del Settore orientamento e informazioni bibliografiche
Emeroteca
I giornali storici nell'era digitale. Bolzano, 27 ottobre 2014
Il 27 ottobre 2014 l'Accademia europea di Bolzano ha ospitato una giornata di incontri sul tema della digitalizzazione dei giornali storici, organizzata dalla Biblioteca provinciale "F. Teßman", con sede nel capoluogo altoatesino. La questione riveste particolare interesse per la Biblioteca del Senato, che ha recentemente messo a disposizione degli utenti un archivio per la consultazione di giornali storici digitalizzati appartenenti alle proprie collezioni e risalenti al periodo tra XVIII e XIX secolo (si veda l'articolo pubblicato nel n. 23 N.S. di MinervaWeb).
Obiettivo del convegno, riassunto nella formula "Dal file immagine al full text", era quello di analizzare le principali problematiche legate alle procedure di digitalizzazione delle testate storiche e di fare il punto della situazione in merito ai più rilevanti progetti avviati in tal senso da biblioteche, istituzioni e atenei europei - tra cui l'Università di Innsbruck, la Biblioteca di Stato di Berlino, la Biblioteca nazionale Marciana di Venezia - anche con riferimento al progetto Europeana Newspapers. I relatori che si sono avvicendati hanno affrontato vari aspetti della questione, a partire dalle tecnologie di riconoscimento automatico dei caratteri (OCR) applicate a documenti di non recente pubblicazione, con le inevitabili conseguenze in termini di percentuale di errore, profili illustrati da Günter Mühlberger, responsabile del progetto di digitalizzazione e archiviazione elettronica presso l'Istituto di germanistica dell'ateneo di Innsbruck, e da Michel Généreux, ricercatore presso l'Istituto di comunicazione specialistica e plurilinguismo dell'Accademia europea di Bolzano (Eurac), fino alla possibilità di correzioni in linea da parte degli utenti e all'utilizzo di algoritmi per l'estrazione di informazioni in grado di discriminare tra i diversi elementi strutturali di un giornale, tema cui il linguista computazionale Andrea Borioli ha dedicato ampio spazio nel proprio intervento.
L'argomento è stato poi ulteriormente approfondito attraverso l'esame di automatismi finalizzati a individuare le entità nominali dei testi (named entity recognition) con lo sviluppo di learning machines atte alla ricerca semantica, aspetto quest'ultimo analizzato da Clemens Neudecker, coordinatore del progetto Europeana Newspapers presso la Biblioteca di Stato di Berlino, il quale ha sottolineato la migliore qualità dei risultati ottenuti quanto ad accuratezza della query. Nell'ultima fase del convegno i relatori Maurizio Messina, direttore della Biblioteca nazionale Marciana di Venezia, e Klaus Kempf, direttore del Centro di digitalizzazione della Biblioteca di Stato della Baviera, hanno ribadito la necessità di superare il concetto tradizionale di collezione interpretato in un'ottica locale, facendo ad esempio confluire i contenuti in repositories istituzionali in rete, o entrando a far parte di ambienti di ricerca virtuali. L'idea più volte affermata è stata dunque quella di far sì che l'attività di raccolta e sviluppo dei fondi da parte delle biblioteche non rappresenti più la finalità precipua ma solo uno dei tanti servizi offerti in base alle specifiche esigenze degli utenti.
Per chi volesse approfondire queste e altre tematiche affrontate nel corso del convegno, sono in via di pubblicazione, sul sito della Biblioteca provinciale "F.Teßman", i contributi dei relatori e le discussioni scaturite dai loro interventi.