検索
ニュース

バチカン図書館の8万冊におよぶ文献の長期デジタル保存プロジェクトを支えるNTTデータNTT DATA Innovation Conference 2015リポート(2/2 ページ)

2世紀から20世紀に書き残された約8万冊、約4千万ページにおよぶバチカン図書館の膨大な手書き文献。この人類歴史遺産をいかにデジタル化し長期保存するか……。壮大なプロジェクトが始まった。

PC用表示 関連情報
Share
Tweet
LINE
Hatena
前のページへ |       

オープンなテクノロジーで長期保存を

 これまでバチカン図書館では、大がかりなデジタル化は行ってこなかった。その理由をアメンティ氏は、「テクノロジーが変化することで、デバイスが使えなくなる、フォーマットが変わる、またはデータが消えてしまうなどのリスクがあります。この影響は、非常に大きいのでテクノロジーの活用には消極的でした」と語る。

 そこでテクノロジーの変化にあわせ、ダイナミックに対応できる技術としてバチカン図書館が採用したのが「FITS」というフォーマット形式である。FITSは、45年前に登場したオープンソースのフォーマットで天体物理学の世界で多く利用され、半年ごとに更新も続けられている。

 「バチカン図書館の文献は全人類のものであり、特定企業などに依存した独自性の強いテクノロジーで保存してはいけません。そういったものは、テクノロジーの変化や企業の買収などでなくなってしまうリスクがあります。オープンソースであれば、100年先でも読むことができるはずです」(アメンティ氏)

同じ夢とゴールを共有するNTTデータ

 バチカン図書館の新しい理念は、「スキャニング」「保存」「公開」という、3つのステップで実現されている。

 まずは文献のスキャニングだが、これはけして簡単な作業ではない。スキャニングでは、特に色調が重要になる。そこで、まずはスキャニングのガイドラインを作成した。

 「以前はカメラで撮影して現像するというアナログな方法でした。デジタルでは、デバイスにより色調が異なるので、カラーチャートによる色のチューニングが必要です。テクノロジーやデバイスが変わっても、黄色は黄色であり、青は青であり、赤は赤なのです。どんなデバイスでもオリジナルの色を再現しなければなりません」(アメンティ氏)。

 また手書き文献を180度開き、ガラスに押しつけてスキャニングすることで、原本を破損しないようにしなければならない。保持に際してはスキャニングしたデータをいかに安全、確実に保存するのかといった点も重要になる。

 そしてデータの公開である。デジタル化されたバチカン図書館の文献の閲覧は、非常に簡単である。まず一般の利用者は、いつでも、どこからでも、表示された一覧から見たい文献を選び、閲覧することができる。

 研究者向けの利用方法として、カタログベースでの検索やパターン認識による検索などの機能も実現している。例えば、デジタル化された手書き文献をパターンとして認識し検索を可能とすることで、同じ書き手の文献が把握できたり、文献同士の相互関係が新たに分かったりする可能性がある。こうした機能により、手書き文献の歴史研究も大きく効率化され、時代をひもとく新たな研究成果も期待できるようになる。

 最後にアメンティ氏は、「われわれの理念の実現を強力にサポートしてくれたのがNTTデータでした。どのデバイスを使ってデータを保存し、ワークフローを実装して、どのように配信すればよいかという重要な意思決定を非常に近いところでサポートしてくれました」と当時を振り返り、NTTデータの貢献に大きな賛辞を贈った。

 「NTTデータをパートナーとして選んだのは、専門性、高度な知識を持った技術者がいるということはもちろん、同じ夢とゴールを共有できると感じたことが大きな理由でした。“約8万冊におよぶ膨大かつ基調な人類歴史遺産を長期保存し、誰でも閲覧できるようにする”という理念を実現するために、彼らは常に最適な提案を実施してくれました。その姿勢から、プロフェッショナル意識の高さ、そして多いに信頼できる人間性を感じ、パートナーに選びました。今後もこの壮大なプロジェクトは続きますが、同じ夢、同じハート、同じゴールを共有できるNTTデータと一緒であれば必ず成功すると確信しています」と話し、講演を終えた。

前のページへ |       

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る