Die Vorteile der Objektdaten-Speicherung beim Unternehmenseinsatz

München, Starnberg, 02. Okt. 2018 - Beim Thema Datenbeständigkeit geht es um den langfristigen Datenschutz. Ein Gastbeitrag von Western Digital Corporation, WDC...

Zum Hintergrund: Traditionelle Speicherarchitekturen verwenden typischerweise RAID (Redundant Array of Independent Disks) zum  langfristigen Schutz der Daten, wobei in den meisten Konfigurationen die Parität für die Datenwiederherstellung bei einem Laufwerksausfall in Blöcken auf mehrere Speichergeräte (Festplatten, SSDs) verteilt gespeichert wird. Bei Object Based Storage (OBS) wird die Datenbeständigkeit hingegen durch Erasure Coding erreicht – eine Technik, die Daten mit Paritätsinformationen kombiniert, die in Blöcke aufgeteilt und über den lokalen Speicherpool verteilt sind. Erik Ottem, Director of Product Marketing, Data Center Systems, Western Digital Corporation und Vivek Tyagi, Director for India Business Development, SanDisk Brand Commercial Sales and Support bei Western Digital Corporation beschreiben in ihrem folgenden Beitrag aus technischer Sicht die Vorteile der Objektdaten-Speicherung für Unternehmen.

Eine Fülle an Daten

„Um die riesigen Datenmengen zu bewältigen, die von Milliarden Menschen in Millionen von Anwendungen und auf Milliarden von PCs, Smartphones und mobilen Geräten erzeugt werden, verändern sich Rechenzentren auf der ganzen Welt. Die Daten müssen in vielen Fällen gespeichert und verarbeitet werden, damit daraus Mehrwerte und Informationen gewonnen werden können. Zudem muss in den meisten Fällen in Echtzeit auf die Daten zugegriffen werden, um beispielsweise einen besseren Kundenservice, einen besseren internen und externen Support und eine bessere Entscheidungsfindung zu erreichen – alles Dinge, die den Umsatz und das Betriebsergebnis verbessern können.

Analysen, analytische Berichte und historische Trends für große Datenmengen sowie die Möglichkeit, eine aktive Archivierung über mehrere Speicherebenen hinweg durchzuführen, sind nur einige Beispiele dafür, warum Unternehmen ihre großen Datenmengen längerfristig speichern möchten. Ihre Daten sind zu ihrem wertvollsten Kapital geworden, und so stehen IT-Organisationen immer stärker unter dem Druck sicherzustellen, dass die von ihnen gespeicherten und geschützten Daten bei Bedarf jederzeit verfügbar und beim Lesen genau sind.

Leider sind traditionelle Methoden wie Off-Site-Archivierung oder Tape-Library-Recovery nicht mehr effektiv oder in vielen Fällen sogar von den heutigen Unternehmen erlaubt, da sie Störungen im Service und in der Leistung verursachen.  Mit diesen anspruchsvollen Speicheranforderungen bewegen sich IT-Organisationen durch robustere Technologien wie Object-Based Storage (OBS) auf einem höheren Niveau der Datenbeständigkeit (Langzeit-Datenschutz).

Object Based Storage

Object Based Storage ist eine alternative Speicherarchitektur (im Gegensatz zu herkömmlichen NAS- oder SAN-basierten Architekturen), die Daten als Objekte verwaltet. Ob Dokument oder Präsentation, Audio- oder Videodatei, Bild oder Foto oder andere unstrukturierte Daten: Die Datei wird als ein einzelnes Objekt gespeichert. Da das Objekt auch Metadaten enthält, entfällt die Notwendigkeit, die Daten in einer Hierarchie zu strukturieren. Stattdessen wird das Objekt (Daten und Metadaten) in einem flachen Adressraum (Single Namespace) abgelegt, was den Datenzugriff gegenüber traditionellen Prozessen vereinfacht.

In dateibasierten NAS-Architekturen werden die Daten in einem Ordner gespeichert, der bei jedem Zugriff durchlaufen werden muss. In SAN-basierten Architekturen werden die Daten in Blöcken zusammengefasst und mit eindeutigen Adressen gespeichert. In beiden Fällen wird nur wenig oder gar keine Information zu den gespeicherten Daten zur Verfügung gestellt, die das Management und den Support der ständig anwachsenden Datenmengen (Data at Scale) vereinfachen würde.

In einer Object-Based-Storage-Architektur wird jedem Objekt ein eindeutiger Bezeichner zugewiesen, der es erleichtert, Daten zu indizieren und abzurufen, ein bestimmtes Objekt (z. B. ein Video oder Foto) zu finden oder sogar Datenanalysen oder andere Discovery-Techniken für große Mengen von Daten zu nutzen.

Was ist Datenbeständigkeit?

Bei der Datenbeständigkeit geht es um den langfristigen Schutz der Daten. Traditionelle Speicherarchitekturen verwenden typischerweise RAID (Redundant Array of Independent Disks), wobei in den meisten Konfigurationen die Parität für die Datenwiederherstellung bei einem Laufwerksausfall in Blöcken auf mehrere Speichergeräte (wie Festplatten und SSDs) verteilt gespeichert wird. Dieser Ansatz schützt ein oder zwei der Speichergeräte im Array vor Datenverlust, wenn ein Laufwerksausfall auftritt, da die Daten auf dem ausgefallenen Laufwerk rekonstruiert werden können (Rebuild). Ein Laufwerks-Rebuild verursacht aber nicht nur Leistungseinbußen während des Vorgangs, sondern erhöht auch die Wahrscheinlichkeit, dass andere Geräte in der Gruppe ausfallen, wodurch die Datenintegrität gefährdet wird. Die Zeit für einen RAID-Rebuild kann mehrerer Stunden oder sogar Wochen betragen, und wenn während des Wiederherstellens ein Lesefehler auftritt, können Daten dauerhaft verloren gehen, was eine große Gefahr für Unternehmen darstellt.

Bei Object Based Storage (OBS) hingegen wird die Datenbeständigkeit durch Erasure Coding erreicht – eine Technik, die Daten mit den Paritätsinformationen kombiniert, die in Blöcke aufgeteilt und über den lokalen Speicherpool verteilt sind. Während RAID ein Laufwerk rekonstruiert, stellt Object Based Storage Daten unabhängig vom Gerät wieder her. Die auf dem Markt erhältlichen Object-Based-Storage-Lösungen sind durch die dynamische Datenplatzierung in ihrem Erasure Coding noch fortschrittlicher: Sie passen sich an Laufwerks- oder Netzwerkausfälle an, indem sie weiterhin Objekte schreiben und nahtlos zusätzliche Speicherupgrades übernehmen. Es gibt in der Regel keine Wiederherstellungszeiten oder Leistungseinbußen und keine Dringlichkeit, ausgefallene Geräte zum Zeitpunkt des Lesefehlers sofort auszutauschen – sie können zu einem passenden Zeitpunkt ausgetauscht werden.

Ein weiteres Problem im Zusammenhang mit dem langfristigen Datenzugriff ist der Schutz von Datenblöcken, die ungenutzt auf Speichergeräten in Speicherumgebungen von Unternehmen vorhanden sind. Ein einfacher Schutz vor Geräteausfällen (wie es bei RAID der Fall ist) schützt nicht vor einem allmählichen Verschleiß der Speichermedien, wie zum Beispiel dem Bit Rot, bei dem ein Teil des Speichermediums unlesbar, beschädigt oder nicht mehr in seiner ursprünglichen, unveränderten Form wiederhergestellt werden kann.

OBS-Lösungen schützen vor verschiedenen Arten des Bit-Verfalls, wie zum Beispiel des Bit Rot: Wenn ein bestimmter Block beschädigt wird, kann aus den Paritätsinformationen, die in den verbleibenden Blöcken gespeichert sind, ein Ersatzblock erstellt werden (Selbstheilung). Ein Rebuild oder ein Ersatz des kompletten Laufwerks ist somit nicht erforderlich, sondern lediglich der betroffenen Daten. Durch die Verwendung von Erasure Coding mit einer Datenbereinigungstechnologie wird eine extrem hohe Datenbeständigkeit erreicht. Die Kombination dieser Technologien liefert eine Datenbeständigkeit von bis zu 17 Neunen, oder einfacher gesagt, bei 1.000 Billionen Objekten wäre nur eines unlesbar. Aus diesem Grund wird Object Based Storage häufig in Hyperscale-Rechenzentren und Cloud-Computing-Umgebungen eingesetzt.

Abschließende Gedanken

Unternehmen sind mit einem exponentiellen Datenwachstum konfrontiert, das sich ungünstig auf herkömmliche Speicherlösungen auswirkt, da sie für diese Datenflut nicht gerüstet sind. Der Verlust von Daten kann schwerwiegende Folgen haben und sich erheblich auf Ansehen und Umsätze eines Unternehmens auswirken. Um große Datenmengen langfristig zu erhalten und sicherzustellen, dass die gespeicherten Daten bei Bedarf immer verfügbar und beim Lesen präzise sind, ist eine Object-Based-Storage-basierte Plattform erforderlich. Durch die Kombination von Erasure Coding und der Möglichkeit, Daten nahtlos auf mehrere Rechenzentrumsstandorte zu verteilen, können hierbei große Datenmengen (Data at Scale) kostengünstig und mit einem geringeren Kapital- und Betriebsaufwand aufbewahrt werden, da der Schutz der Daten im Vergleich zu herkömmlichen Speicherarchitekturen effizienter ist.“


> Querverweis: weitere Informationen zur Objektdaten-Speicherung finden Sie auch auf unserer Webseite unter diesem Link...

> SNIA Link zu Erasure Coding