Tape ist eine zentrale Komponente zur Kontrolle des Wachstums von unstrukturierten Daten

Starnberg, 21. Juni 2019 - Aber neue Ansätze wie RAIL* werden nötig sein, um vollautomatisierte Exabyte-große Archivesysteme hochverfügbar bereitstellen zu können...

Um was es hier geht: Wie ich bereits in meinem Januar-Blogpost darauf hingewiesen haben, ist Hybrid Cloud Computing auf dem Weg zu einem bevorzugten Architekturmodell für Unternehmen-/Organisationen zu werden, und die Fachbereiche sind starke Treiber im Zuge der Digitalen Transformation. Man sieht das an den IT-Budgets, die sich in Richtung hybrider- und Multi Cloud Computing - Modelle (as a service) bewegen. Mit ein Grund ist dabei die Tatsache, dass wir täglich rund 2,5 Trillionen (10 hoch 18) Bytes produzieren-/sammeln und davon immerhin ca. ein Prozent speichern (Quelle: IBM). Aktuelle Anwendungsbeispiele sind Entwicklungen im Bereich des autonomen Fahrens, Videodatenspeicherung oder das Media-& Entertainment-Marktsegment. Gerade beim selbstfahrenden Auto ist Tape auf Grund von sequentials writes ideal und in Verbindung mit der richtigen Software als Tiering Lösung kosteneffektiv einzusetzen.

Auf immer mehr Daten wird jedoch gleichzeitig immer weniger regelmäßig zugegriffen (cold data), so dass Cloud Dienste attraktiver werden; aber auch die Auslagerung von Daten für z.B. Backup- oder Disaster Recovery Zwecke gewinnt an Fahrt (as a service). Die Konsolidierung von Festplatten und Bändern zu einer mehrstufigen, unter Einbeziehung von Cloud-Speicherlösungen logisch einheitlich zu verwaltenden Architektur macht hier Sinn. Standard Office-Anwendungen erzeugen derzeit noch immer die Masse aller Geschäftsdaten in der klassischen IT und diese altern schnell, was ebenfalls zu immer mehr Daten mit nur geringer Aktivität = Zugriffshäufigkeit führt. Eine Speicherung von kalten Daten auf Band stellt damit eine Option dar, um zusammen mit HDDs und Flash in der Cloud kostenoptimierte, regelkonforme, mehrstufige und hybride Speicherverwaltungs-Lösungen aufzubauen (automatisiertes Data Life-Cycle Management). Damit kann die Cloud als eine nahtlos integrierte Speicherebene (Tier) im Unternehmen etabliert werden, ohne jedoch die Kontrolle über seine Daten zu verlieren.

Speichertechnologien und Entwicklungen im Fokus

Die Zuverlässigkeit und lange Lebensdauer moderner Bänder wie LTO-7 / LTO-8 in Verbindung mit 256-bit AES Encryption bedeutet, auch sehr große Datenmengen stromlos und sicher (offline) on-premise bzw. in der Cloud über lange Zeiträume aufbewahren zu können Tape hat sich von seiner alten Rolle als primäre Backup-Lösung ja bereits seit längerem entfernt und insbesondere Datenarchivierungs- und Disaster Recovery (DR) Services profitieren nun davon.


Querverweis: Informationen zur aktuellen Tape-Entwicklungen erhalten Sie aus 1. Hand im Rahmen unserer kommenden Fachtagung am 25. Juni in Frankfurt im Quantum Corp. Expertenbeitrag „Hochverfügbare Cloud Storage Umgebung mit innovativen Tape-Technologien. Why do the world's biggest clouds Rely on Tape?“. Dort werden auch Entwicklungen wie Erasure Coding / Wide-striping / RAIL etc. für Tape angesprochen (1)


Die Tape-Entwicklungen führten bislang zu zahlreichen Verbesserungen, darunter Kapazitätssteigerungen durch den Einsatz von BaFe-Medien (LTO-8 bis zu 30 TB/Kassette komprimiert), Bitfehlerraten (BER) von 1x10 hoch 19 im Vergleich zur Festplatte, die verlängerte Lebensdauer der Medien (30 Jahre) und höhere Datenübertragungsraten (bis 750 MB/s). Damit können moderne Tape-basierte Lösungen auch eine größere Vielfalt an Anwendungen abdecken als früher (Archive, Compliance-Themen, Streaming-Media, Content-Repositories) und das zu durchaus wettbewerbsfähigen Kosten. LTO-9 mit 24 TB pro Bandkassette in ca. zwei Jahren und LTO-10 mit 48 TB in ca. vier Jahren werden Herstellerseitig als die nächsten Entwicklungsziele genannt. IBM forscht an einem eigenen Enterprise-Tape, das in Zukunft über 300 TB pro Kassette speichern soll. Tape ist damit auch im Wettbewerb zu Cloud-Archivierungslösungen von Microsoft Azure, AWS oder Google; Hyperscaler, die übrigens aus Sicherheits- und Kostengründen intern selbst wiederum Tape im Backend als Last-line-of-defense verwenden.

Allerdings darf die Tatsache nicht verschwiegen werden, dass insbesondere LTO sich gerade nicht schnell genug weiterentwickelt (weiterer Nachteil: auch nur mehr zwei Medienlieferanten). Neue Technologieansätze wie z.B. Erasure Coding / wirde-striping (reduziert die Datenmengen um bis zu 83%) und die möglichst vollständige Automatisierung (black-box-Ansatz) werden deshalb unbedingt nötig sein, um die o.g. Herausforderungen zu adressieren.

Redundant Array of Inexpensive Libraries* (RAIL) sind ein Weg, den die Firma Quantum eingeschlagen hat, um ein sicheres, hochverfügbares und voll-automatisiertes Handling via Software aus der Cloud zu ermöglichen. Ich sprach dazu letzte Woche auch mit Jamie Lerner, CEO, President & Chairman of Board, der Quantum Corp., der in unserer Diskussion durchblicken ließ, dass sein Unternehmen plant, sich auch mit der Entwicklung neuer Tape-Technologien (unabhängig von LTO) intensiver zu beschäftigen.


(1) Abbildung: Performancewerte auf Basis *RAIL-Architektur (Bildquelle: Storage Consortium Fachtagung am 25. Juni 2019; Quantum Corp. Technologieausblick zu RAIL)

Fazit: Tape kann Speicherkosten berechenbarer machen

Unter Berücksichtigung der Kosten für Verwaltung, Strom, Energieverbrauch, Media und Investitionskosten für Hard- und Software bietet die Bandtechnologie eine niedrigere TCO für selten genutzte Daten. Tape stellt zudem sicher, dass die Daten im Unternehmen über Jahre hinweg ohne Abrufkosten oder Abrufbefehlskosten validiert und gespeichert werden. Auch sind Zuverlässigkeit oder Verfügbarkeit der Langzeit-Archivdaten - unabhängig vom jeweiligen Cloud Service Provider - sichergestellt.

Statt Techniksilos sind künftige IT-Architekturen ein Netz aus on-premise und cloud-basierten Lösungen, die as-a-service auf Grundlage einer hybriden- oder Multi Cloud arbeiten. Zentral wird damit ein einheitliches, hochautomatisiertes und Plattform-übergreifendes Datenmanagement über lokale- und Cloud-Umgebunge, das sowohl robust (resilient) als auch hochverfügbar (always-on) und performant (Netzwerk) bereitsteht. Speichertechnologien spielen eine wichtige Rolle, denn sie sind aus Datensicht die Basis zur Bereitstellung kosteneffizienter (TCO) skalierbarer und agiler IT-Services, wie sie im Zeitalter der Digitalisierung benötigt werden.


Hinweis auf Beitrag: RAID Performance beim Einsatz mit Flash SSDs versus Erasure Coding und RAIN