Deutsche Nationalbibliothek entscheidet sich für IBM SONAS zur Archivierung seiner Sammlung

Stuttgart-Ehningen, Starnberg, 2. Febr. 2012 - Verstärkter Speicherbedarf durch das rasche Datenwachstum im Bereich neuer Medien...

Zum Hintergrund: Die deutsche Nationalbibliothek in Frankfurt sammelt als einzige Institution in Deutschland lückenlos alle deutschen und deutschsprachigen Publikationen ab 1913, archiviert diese dauerhaft, verzeichnet sie bibliografisch und stellt sie der Öffentlichkeit zur Verfügung. Ein zentraler Bestandteil der Sammlung sind die neuen Medien, wie zum Beispiel CDs, die sich stetig vermehren. So archivieren die Mitarbeiter derzeit alleine einen Bestand von 400.000 – 500.000 CDs. Das stellt die deutsche Nationalbibliothek zunehmend vor eine große Herausforderung beim Speicherbedarf. Bereits Ende 2011 wurde allein in diesem Bereich eine Datenmenge von 40 bis 50 Terabyte benötigt und der Bestand der digitalen Medien, die viel Speicherbedarf erfordern, wächst immer mehr. 

Damit die deutsche Nationalbibliothek auch langfristig dem Sammelauftrag, den ihr der Bundestag erteilt hat, nachkommen kann, benötigte sie nach eigenen Angaben "eine IT- Infrastruktur, mit der sich digitale Publikationen einfach speichern und bereitstellen lassen". Daher hat sich die Nationalbibliothek dazu entschlossen die Speicherlösung IBM Scale Out Network Attached Storage (SONAS) zu implementieren. SONAS ermöglicht es, die Daten in einem einzigen Filesystem (inklusive global Namespace) zu speichern. Besonders für digitale Medien bietet die Lösung zudem genug Speicherplatz (Skalierbare Scale-out NAS Architektur). Zudem reduziert sie Zeit, Kosten und Risiken beim Abrufen der archivierten Medien. 

In einem ersten Schritt der Implementierungsphase wurden die Server für Verwaltungsdaten und Dokumente virtualisiert, damit die Mitarbeiter unabhängig von den digitalen Publikationen auf diese zugreifen können. Eine weitere wichtige Komponente ist das Backup der Daten, das durch den Diskpool des IBM Tivoli Storage Manager (TSM) gewährleistet wird. Zuerst werden die Daten dupliziert und dann mit einem vorgelagerten Diskpool auf Band gespeichert. Als zweite Kernkomponente der Datensicherung verfügt die Nationalbibliothek mit IBM GPFS (General Parallel File System) über ein sehr skalierbares Filesystem, mit dem sich ein Datenaufkommen im Petabyte-Bereich bewältigen lässt. Zusätzlich können die Mitarbeiter mittels IBM GPFS Policy Engines innerhalb weniger Minuten erkennen, welche Daten sich in den letzten zwei Wochen geändert haben bzw. neu dazugekommen sind;  IBM TSM wird durch die enge Integration mit IBM GPFS mit diesen Daten versorgt, was ein kontinuierliches Sicherungsverfahren garantiert.

Eine wichtige Rolle spielt die Sicherheit bei der Archivierung der Daten: Die deutsche Nationalbibliothek hat sich deshalb für ein Daten-Backup auf Bändern entschieden. Die Mitarbeiter kopieren die Daten und tauschen die Kopien zwischen den Standorten Leipzig und Frankfurt aus. So sind alle Daten auch im Katastrophenfall zur Sicherheit nochmal in einem zweiten Standort gelagert. Die Nutzer in den Lesesälen der Bibliothek greifen aus Sicherheitsgründen niemals direkt, sondern immer nur mittels vorgeschalteter Applikationen auf IBM SONAS zu. 

Eine weitere Herausforderung neben der Migration weiterer elektronischer Publikationen, die auf verteilten kleinen Altsystemen und einem zehn Jahre alten Deposit-Server lagen, war die Migration von optischen Datenträgern: Anwenderzitat: „Unsere Mitarbeiter digitalisieren und speichern Audio-CDs und weitere Audiomedien ad hoc und im Bedarfsfall vor Ort. Hier und bei der Massenmigration von CDs kommt uns die neue Speicherlösung zu Gute. Gleichzeitig können so nun die täglich über die Repository-Software eingehenden Daten und Netzpublikationen gesichert und zugänglich gemacht werden“, so Reinhard Altenhoener,, Deutsche Nationalbibliothek. „Besonders unsere Nutzer profitieren von der neuen Lösung. Sie können nun einfach eine CD auswählen und diese direkt über ein Audiosystem anhören.“

IBM Geschäftspartner Bechtle hatte die Aufgabe, das Projekt gemeinsam mit der deutschen Nationalbibliothek zu planen und die passenden technischen Lösungsbausteine auszuwählen.

Weitere Informationen zur Deutschen Nationalbibliothek:  http://www.d-nb.de/

Informationen zu IBM SONAS:  http://www-03.ibm.com/systems/de/storage/