Biblioteca Apostolica Vaticana: big data per custodire tesori

La Biblioteca Vaticana, una delle più antiche del mondo, aveva bisogno di salvaguardare circa 80mila manoscritti storici e metterli a disposizione di studiosi e storici di tutto il mondo. Grazie ai Big data, il progetto di digitalizzazione dei manoscritti permetterà di preservare nel tempo il patrimonio culturale e consentirne la fruizione e la diffusione dei contenuti in maniera digitale.

Pubblicato il 04 Dic 2013

La Biblioteca Apostolica Vaticana è la biblioteca che la Santa Sede ha organizzato e curato in Vaticano a partire dal Quattrocento. Si tratta di una delle istituzioni culturali più importanti del mondo, con un immenso patrimonio documentale; possiede una delle raccolte di testi antichi e di libri rari fra le più importanti al mondo, testimonianze uniche della storia della cultura umana, con opere che spaziano dalle scienze all’arte, fino all’antica corrispondenza e, naturalmente, inerenti la cultura religiosa.
Tra i pezzi più famosi della biblioteca c’è il Codex Vaticanus, il più antico manoscritto completo della Bibbia che si conosca. La Biblioteca Apostolica Vaticana contiene oggi 1,6 milioni di libri a stampa antichi e moderni, 8.300 incunaboli, ossia documenti stampato con la tecnologia dei caratteri mobili e realizzati tra la metà del XV secolo e l’anno 1.500 (di essi, 65 in pergamena), 150 mila codici manoscritti e carte di archivio, 300 mila monete e medaglie e circa 20 mila oggetti d’arte. Il suo patrimonio di manoscritti e incunaboli include la Bibbia di Gutenberg (nota come Bibbia a 42 linee: le linee di caratteri, distribuite su due colonne, presenti in ogni pagina, com’era d’uso nei messali), il primo libro stampato con i caratteri mobili e datato tra il 1.451 e il 1.455
“La Biblioteca ha un importante ruolo di custodia e salvaguardia di documentazione antichissima, tra cui un numero elevato di manoscritti di altissimo valore storico, culturale e artistico”, spiega a ZeroUno Luciano Ammenti, Responsabile Coordinamento Servizi Informatici, Ced Director della Biblioteca Apostolica Vaticana. “Dopo diversi periodi di studio sulle tecniche di conservazione più efficaci, ci siamo resi conto che con il passare del tempo avremmo avuto difficoltà sempre maggiori nella conservazione di questi documenti. Quattro anni fa abbiamo dunque costituito una Commissione di Ricerca il cui obiettivo è quello di ottemperare l’obiettivo principale della Biblioteca: conservare e rendere accessibili i documenti antichi alla popolazione mondiale. Compito che la Commissione sta portando avanti anche attraverso l’uso delle tecnologie informatiche, in particolare per un importante progetto di digitalizzazione dei manoscritti per poterne garantire una efficace conservazione a lungo termine”.

Ottantamila manoscritti da digitalizzare
La Biblioteca Apostolica Vaticana, infatti, digitalizzerà 80mila manoscritti storici, pari a 450 milioni di pagine scritte, con un progetto che durerà all’incirca 9 anni. Una sfida complessa resa ancora più ardua dal fatto che non esistono best practice da cui ‘prendere esempio’. “Ci siamo guardati attorno e abbiamo constatato che nel mondo non c’erano altri progetti con le stesse caratteristiche o similari – evidenzia Ammenti -; abbiamo dunque iniziato a cercare negli ambienti scientifici qualche spunto per la conservazione a lungo termine e abbiamo constatato l’importanza di due temi da fronteggiare: l’obsolescenza tecnologica (il data center deve garantire sempre la massima affidabilità e sicurezza, quindi essere sempre aggiornato sul piano tecnologico); il formato di conservazione dei documenti (ad oggi il formato più utilizzato è il Tiff, Tagged Image File Format, progettato nel ’87 il cui ultimo upgrade risale al ’92)”.
Sul fronte dell’affidabilità del data center, secondo Ammenti, le problematiche sono facilmente risolvibili: “Queste sono competenze di coloro che devono gestire le infrastrutture; è naturale che debbano essere allineati alle esigenze degli utenti e agli obiettivi, in questo caso, della Biblioteca, ma le tecnologie oggi sono molto avanzate e consentono di raggiungere i massimi livelli di affidabilità, qualità, performance, sicurezza e disponibilità. Da questo punto di vista, dunque, non ci siamo allarmati e abbiamo deciso di affidarci a partner tecnologici in grado di accompagnarci nel percorso di cambiamento e ‘adattamento’ delle infrastrutture di supporto [l’iniziativa è seguita da Emc e Dedanext, che fa parte di Dedagroup Ict Network – ndr]”.

Luciano Ammenti, Responsabile Coordinamento Servizi Informatici, Ced Director della Biblioteca Apostolica Vaticana

Le problematiche maggiori si sono dunque riscontrate sul formato del dato digitale. “Il formato Tiff è obsoleto e non ci dava le garanzie di cui avevamo bisogno in termini di longevità dei file digitali e, soprattutto, non garantisce supporto alle architetture a 64 bit – spiega Ammenti -. Non solo: è un formato non pronto per il 3D, per noi condizione quasi imprescindibile perché un manoscritto ha caratteristiche molto particolari non solo per la calligrafia e il contenuto dei testi ma anche per lo spessore, la profondità, i materiali utilizzati. Tutte caratteristiche che devono essere rese accessibili agli utenti nel momento in cui si decide di rendere disponibile un manoscritto in formato digitale”.
Obiettivo del progetto, infatti, è acquisire in un formato digitale (certificato Iso) i delicati testi della Biblioteca, vulnerabili al deterioramento e all’usura, assicurando non solo che il patrimonio di conoscenza in essi contenuto sia preservato anche per le generazioni future ma che gli studiosi e i ricercatori di tutto il mondo vi possano accedere con semplicità, in qualunque momento e da qualunque parte.
È stato così deciso di utilizzare il formato open standard Flexible Image Transport System (Fits) oggi già utilizzato in ambienti scientifici (astrofisica, medicina) e dalla Nasa per le missioni lunari (si tratta di un formato a 64 bit, già pronto per il 3D).

Big data per preservare e rendere accessibili antichi tesori
La digitalizzazione dei manoscritti rappresenta a pieno un progetto di gestione dei big data per l’enorme mole di dati digitali che rappresenteranno gli 80mila manoscritti. La prima fase del progetto, che durerà almeno 3 anni, prevede la fornitura di 2,8 petabyte di storage attraverso l’utilizzo delle architetture targate Emc (complessivamente la digitalizzazione arriverà a richiedere ben 43 petabyte di spazio storage):

  • Atmos, piattaforma progettata appositamente per il cloud storage con la gestione di milioni di oggetti al giorno con archiviazione e protezione di dati a livello di petabyte; garantisce gestione e protezione dei dati – anche fuori dei classici sistemi di archiviazione – durante tutto il loro ciclo di vita;
  • Data Domain per la parte di backup con la deduplica in linea ad alta velocità;
  • Isilon, storage NAS per Big data con un singolo file system in grado di gestire applicazioni con attività di I/O elevate, sistemi di storage e archivi Near-Line;
  • NetWorker per il backup unificato con varie opzioni di protezione dei dati per semplificare e velocizzare il ripristino in ambienti fisici e virtuali;
  • Sistemi Vnx, piattaforma di Unified Storage ottimizzata per applicazioni virtuali.

Trattandosi di un progetto senza uguali nel mondo, si sono resi necessari alcuni anni di studi preparatori, ma alla fine del 2012 il progetto è entrato nella sua fase operativa. Si sta dunque lavorando al lungo processo di digitalizzazione: ogni singola pagina degli 80 mila manoscritti verrà scansionata con una risoluzione di immagine ad altissima definizione ed archiviata in formato digitale per la conservazione e la consultazione. “Come accennato, abbiamo optato per il formato di archiviazione Fits perché garantisce la massima riproducibilità nel tempo e usabilità per diverse applicazioni – aggiunge Ammenti -. Il formato offre la possibilità di definire e inserire facilmente numerosi metadati descrittivi, fondamentali per il sistema di ricerca dei materiali e delle informazioni, ancor più utili per arricchire il patrimonio di dati disponibili e offrire agli utenti la possibilità di consultare contemporaneamente più documenti uniti da correlazioni e analogie messe in evidenza proprio grazie ai metadati”.
Tra i manoscritti che stanno per essere digitalizzati ci sono il Sifra, risalente al IX secolo, uno dei più antichi codici ebraici oggi esistenti, il codice B (il noto Codex Vaticanus) e testimonianze greche delle opere di Omero, Sofocle, Platone e Ippocrate. “Siamo una biblioteca il cui scopo è la conservazione a lungo termine ma non possiamo non rendere disponibile all’umanità l’immenso patrimonio che custodiamo – conclude Ammenti -. Si tratta però di manoscritti e antiche opere molto delicate: la digitalizzazione è l’unica via per poterli rendere accessibili e fruibili senza danneggiare o compromettere gli originali”.
Per Emc, infine, il progetto di digitalizzazione della Biblioteca Apostolica Vaticana rientra in una più ampia iniziativa denominata ‘Information Heritage’, volta a proteggere informazioni e documenti rilevanti e a renderle disponibili in formato digitale a scopi di formazione e ricerca.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Speciale Digital360Awards e CIOsumm.it

Tutti
Update
Round table
Keynote
Eventi
Digital360 Awards e CIOsumm.IT, ecco i progetti vincitori
Tavola rotonda
Evoluzione del CIO: da centro di costo a motore strategico del business
Tavola rotonda
Business Process Augmentation: dall’RPA alla GenAI… il dato e tratto
Approfondimenti
Sistemi digitali potenziati: l’intelligenza dei chatbot è nelle mani dei CIO
Tavola rotonda
Intelligenza collaborativa e AI: sfide e opportunità per i CIO nell’era dello Human to Machine (H2M) 
Approfondimenti
Open Source: collaborazione e innovazione nel caos apparente del software libero 
Metodologie
BANI: che cos’è e come l’AI può aiutare i CIO a gestire la felicità (e l’infelicità) dei talenti
Prospettive
AI in un mondo complesso. Tra ordine e disordine, le aziende iniziano a capire la giusta via
Approfondimenti
Intelligenza Umana vs Intelligenza Artificiale insieme. Non invece
Eventi
Digital360 Awards e CIOsumm.IT, al via l’evento conclusivo
Eventi
Digital360 Awards e CIOsumm.IT, ecco i progetti vincitori
Tavola rotonda
Evoluzione del CIO: da centro di costo a motore strategico del business
Tavola rotonda
Business Process Augmentation: dall’RPA alla GenAI… il dato e tratto
Approfondimenti
Sistemi digitali potenziati: l’intelligenza dei chatbot è nelle mani dei CIO
Tavola rotonda
Intelligenza collaborativa e AI: sfide e opportunità per i CIO nell’era dello Human to Machine (H2M) 
Approfondimenti
Open Source: collaborazione e innovazione nel caos apparente del software libero 
Metodologie
BANI: che cos’è e come l’AI può aiutare i CIO a gestire la felicità (e l’infelicità) dei talenti
Prospettive
AI in un mondo complesso. Tra ordine e disordine, le aziende iniziano a capire la giusta via
Approfondimenti
Intelligenza Umana vs Intelligenza Artificiale insieme. Non invece
Eventi
Digital360 Awards e CIOsumm.IT, al via l’evento conclusivo

Articoli correlati

Articolo 1 di 4