Machen Cloud- und Objektspeicher das Band als Speichermedium überflüssig?

Starnberg, 10. Dez. 2019 - Die Konsolidierung von Festplatten und Bändern zu einer mehrstufigen - unter Einbeziehung der Cloud - logisch einheitlich zu verwaltenden Architektur...

Um was es hier geht: Die Einschränkungen traditioneller Network Attached Storage Systeme auf Grund stark steigender unstrukturierter Dateien und Workloads veranlassen Anwender, heute verstärkt nach objektbasierten Speicherlösungen zu suchen, die Filesystem-Management-Funktionen als integrierten Ansatz unterstützen. Allerdings stellt die objektbasierte Speicherung in Verbindung mit Public Cloud Angeboten noch immer eine gewisse Herausforderung für Kunden und Anbieter dar (Applikationsunterstützung, Schnittstellenkompatibilität, Security etc). Aber wie verhält es sich in diesem Zusammenhang mit der Koexistenz von Bandspeicherlösungen und Objectstorage, welcher ja fast immer auf HDD's basiert?

Beim Einsatz von Bändern und Filesystem-Schnittstellen im Zusammenspiel mit Objektspeichern ergibt sich die Thematik, dass diese sich standardmäßig nicht leicht an Bänder angepassen lassen. Die Latenz langsamer Tape-Systeme kann z.B. zu NFS- bzw. HTTP-time-outs, Object Request Crashs etc. führen und Betriebsstörungen sind die Folge. AWS verwendet eine eigene API, um über eine Art „Caching“ (buffer) das Problem zu umgehen; dies gilt auch für OpenStack Swift. Swift HLM basiert auf einem hierarchischen Speicher, d.h. es gibt schnelle und langsamere Speichermedien innerhalb des Objektspeichers. HLM bietet eine API, mit der sich Datenbewegungen im hierarchischen Objektspeicher verwalten lassen. Tape und Objektspeicher können sich also im Zusammenhangt mit Filesystemen durchaus ergänzen, erfordern jedoch zusätzliche Tools und Verwaltungsaufwand = Kosten sowie natürlich fachspezifisches Know-how.

Unter Berücksichtigung der Ausgaben für die Verwaltung inkl. Strom, Energieverbrauch, Medien sowie Investitionskosten für Hard- und Software bieten aktuelle Bandtechnologien wie LTO-8 im Zusammenspiel mit virtuellen Tape Libraries (VTLs) jedenfalls für große Datenmengen ( >4 Pb ) eine bessere TCO beim Datenschutz. Erst darüber spielt aus meiner Sicht der Objektspeicher seine Trümpfe voll aus. Tape stellt im Verbund mit zertifizierten und compliant-gemäßen Archivlösungen für regulierte Märkte wie Finance, Healthcare, aber auch Anwenderunternehmen wie z.B. aus der Logistikbranche sicher, dass kritische Daten über Jahre hinweg sicher validiert und gespeichert werden können. Die Zuverlässigkeit bzw. Verfügbarkeit von Langzeit-Archivdaten - unabhängig vom jeweiligen Cloud Service Provider - ist damit sichergestellt.


Bänder haben sich von der früheren Rolle als primäre Backup-Lösung für eine breite Kundenbasis verabschiedet (von Ausnahmen wie virtual tape libraries für große Umgebungen abgesehen) und nicht nur Datenarchive und Disaster Recovery (DR) Services profitieren von den "neuen" Einsatzgebieten im Bereich der Langzeitspeicherung/ Archivierung großer Datenmengen. Die lange Lebensdauer moderner Bänder und damit Daten wie bei LTO-8 in Verbindung mit 256-bit AES Encryption bedeutet, große Datenmengen stromlos und sicher offline on-premise bzw. in der Cloud über lange Zeiträume aufbewahren zu können.


Ausblick

Statt Techniksilos transformieren IT-Architekturen zunehmend in ein abstraktes Netz cloud-basierter- und on-premise-Lösungen und arbeiten 'as-a-Service' auf Grundlage einer hybriden Multi Cloud. Notwendig ist hierfür ein einheitliches, automatisiertes und plattform-übergreifendes Datenmanagement über lokale- und Cloud-Umgebungen hinweg, das robust (Resilient), hochverfügbar (Always-on) und kostenoptimiert (TCO) bereitgestellt werden kann.

Speichertechnologien und damit Tape spielen eine wichtige Rolle, denn sie sind aus Datensicht letztlich die Basis zur Bereitstellung kosteneffizient skalierbarer, agiler IT-Services, wie wir sie im Zeitalter der Digitalisierung benötigen.

Die Speicherung der „kalten“ Daten auf Band stellt eine sinnvolle Option dar, um zusammen mit HDDs und Flash in der Cloud regelkonforme, mehrstufige und hybride Speicherverwaltungs-Lösungen aufzubauen = automatisiertes Data Life-Cycle Management. Damit kann die Cloud als weitere nahtlos integrierte Speicherebene (Tier) im Unternehmen etabliert werden, ohne dass Betreiber die Kontrolle über ihre Daten verlieren.

Fazit: Die Konsolidierung von Festplatten und Bändern zu einer mehrstufigen, unter Einbeziehung von Cloud-Speicherlösungen, logisch einheitlich zu verwaltenden Architektur ist für bestimmte Anwendungfälle durchaus sinnvoll.

Allerdings werden davon unabhängig neue Entwicklungen im Speichermedien-Bereich dringend notwendig (Microsoft z.B. forscht im Project Silica an Möglichkeiten der Speicherung auf Glas), um die rasant steigende Menge an Daten im Cloud-Umfeld zu wettbewerbsfähigen Kosten speichern zu können; sonst könnten künftige Preiserhöhungen bei Hyperscalern im (Public) Cloud Sektor unter Umständen unausweichlich sein...


Querverweis: Blogpost > DNA Storage vor dem Durchbruch? Alle Daten dieser Welt in einem Kleiderschrank

Abb. 1: Cost to store 1 Petabyte (Bildquelle: Catalog, Infinite Data Archives).