Backup oder CDP? KI-Daten und Workloads mit Continuous Data Protection sichern

München, Starnberg, 07. Nov. 2024 - Wie moderne Disaster-Recovery-Technologien wie von Zerto zur schnelleren Wiederherstellung von kritischen Daten beitragen können…

Zum Hintergrund: KI-Anwendungen werden über kurz oder lang zu den kritischen Workloads gehören, die im Gesundheitswesen, im Finanzwesen und in vielen anderen Bereichen eingesetzt werden. KI-Workloads müssen deshalb auch bestmöglich abgesichert werden. Um die ständige Verfügbarkeit dieser zunehmend kritischen Anwendungen zu gewährleisten, werden jedoch neben klassischen Backup-Verfahren vermehrt weitere moderne Lösungen benötigt, die eine schnelle Wiederherstellung garantieren; für Unternehmen stellt sich dann auch die Frage, wie sensible KI-Anwendungen ohne Ausfallzeiten am Laufen gehalten werden können - und wie die zugrunde liegenden Daten bestmöglich gesichert werden, ohne ihre Mobilität zu beeinträchtigen. Kevin Cole von Zerto hat im Folgenden kommentiert (Auszug), wie sich diese Anforderungen aus Sicht seines Unternehmens mit Hilfe von Continuous Data Protection (CDP) erfüllen lassen.

 

KI-Daten und KI-Workloads einsatzbereit halten

„Um Ausfallsicherheit und Schutz vor Datenverlusten und Ausfällen zu gewährleisten, setzen viele Unternehmen auf das bewährte Backup. Dies ist sinnvoll, um Daten auf breiter Ebene zu schützen. Für Business Continuity und Disaster Recovery sind Backups jedoch ungeeignet, insbesondere für die kritischsten Daten und Workloads - wie besagte kritische KI-Workloads. Backups haben die Schwäche, dass sie typischerweise einzelne Server, nicht aber komplette Anwendungen schützen. Nach der Wiederherstellung von Daten aus einem Backup, müssen die Anwendungen zunächst manuell aus ihren einzelnen Komponenten wieder zusammengesetzt werden. Das kostet Zeit und ist verantwortlich für Wiederherstellungszeiten, die Tage oder sogar Wochen dauern können.

Um die ständige Verfügbarkeit kritischer KI-Anwendungen zu gewährleisten, werden modernere Lösungen benötigt, die eine schnelle Wiederherstellbarkeit garantieren können. Derzeit ist CDP (Continuous Data Protection) die effektivste Wiederherstellungslösung. Mit CDP werden alle Datenänderungen während des Schreibvorgangs in einem Journal aufgezeichnet. CDP ermöglicht es somit, den Zustand, der nur wenige Sekunden vor einem Angriff oder einer anderen Störung bestand, in Sekundenschnelle und ohne größeren Datenverlust wiederherzustellen.

 

Kritische KI-Anwendungen benötigen die geringstmöglichen RPOs und RTOs

Um die geringstmöglichen RPOs und RTOs für diese kritischen KI-Anwendungen zu erreichen, bietet die „nahezu synchrone“ Replikation das Beste aus beiden Welten: die Leistungsvorteile der synchronen Replikation, ohne die hohen Netzwerk- oder Infrastrukturanforderungen. Bei der nahezu synchronen Replikation handelt es sich technisch gesehen um eine asynchrone Replikation. Diese funktioniert jedoch wie die synchrone Replikation, da die Daten gleichzeitig an mehrere Speicherorte geschrieben werden. Jedoch ist eine kleine Verzögerung zwischen dem primären und dem sekundären Speicherort möglich.

Die nahezu synchrone Replikation ist immer aktiv und repliziert ständig nur die geänderten Daten innerhalb von Sekunden an den Wiederherstellungsstandort. Da sie stets aktiv ist, muss sie nicht geplant werden, verwendet keine Snapshots, schreibt in den Quellspeicher und muss nicht auf die Bestätigung des Zielspeichers warten. Einer der Hauptvorteile der nahezu synchronen Replikation besteht darin, dass sie ein hohes Maß an Datenverfügbarkeit und Datensicherheit bietet und gleichzeitig schnellere Schreibgeschwindigkeiten als die synchrone Replikation ermöglicht. Dies macht sie zu einer guten Wahl für Workloads wie kritische KI-Anwendungen mit hoher Schreiblast und/oder sehr großen Datenmengen.

 

Mit CDP werden alle Datenänderungen während des Schreibvorgangs in einem Journal aufgezeichnet. CDP ermöglicht es somit, den Zustand, der nur wenige Sekunden vor einem Angriff oder einer anderen Störung bestand, in Sekundenschnelle und ohne größeren Datenverlust wiederherzustellen. (Bildquelle: generiert mit KI).

 

Unser Anmerkung: Falls eine möglichst sofortige Wiederherstellung von kritischen Daten gefordert ist (asynchrone Replikation mit CDP kann RPOs im Sekundenbereich realisieren) und Datenverluste nicht toleriert werden können, kommt CDP ins Spiel. Probleme wie potentielle Datenverluste, Latenzen, Größe-/Anzahl von Snapshots, Bandbreiten-Limitierungen oder Performance-Overheads lassen sich damit adressieren. Dies betrifft auch den Faktor Zeit für weniger aufwändige Tests zur Überprüfung der Ausfallsicherheit, sowie einen Resilienznachweis gegenüber Katastrophenfällen (KRITIS).

 

Datenmobilität für KI-Daten fordert die IT-Infrastruktur heraus

KI basiert auf Daten. Der Umfang der KI-Daten ist eine völlig neue Ära der Datenerstellung. Umfang und Volumen sind exponentiell größer als alles, was die IT bisher gesehen hat. Selbst einfache Anwendungen können Exabytes an Rohdaten verwenden, die für das Modelltraining und die anschließende Inferenz aufbereitet werden müssen. Die Datensätze werden oft vor Ort erstellt und müssen zur Verarbeitung in einen zentralen Datenspeicher übertragen werden. Am Ende des Lebenszyklus der KI-Daten müssen diese für ein mögliches erneutes Training archiviert werden. All dies stellt die IT-Infrastruktur und das Management vor neue Herausforderungen, da diese riesigen Datenmengen regelmäßig bewegt werden müssen.

Die traditionelle „Lift & Shift“-Migration solcher Datenmengen ist mit aktuellen Netzwerktechnologien und den auf synchroner Replikation basierenden Datenmanagement-Lösungen jedoch nicht möglich. Um KI-Daten auch bei begrenzter Verarbeitungsleistung und Bandbreite bewegen zu können, empfiehlt sich der Einsatz einer asynchronen Replikation. So lässt sich eine kontinuierliche Replikation mit geringer Bandbreite auf Blockebene gewährleisten, die keine hohen Datenübertragungsspitzen erzeugt.“

Fazit: „KI stellt die derzeitige IT-Infrastruktur vor große Herausforderungen, wenn es um die Speicherung, Verwaltung und Übertragung der enormen Datenmengen geht. Aktuelle Technologien werden die erforderliche Datenmobilität für die riesigen KI-Datensätze nicht bereitstellen können. Um KI-Daten erfolgreich zu verwalten, braucht es neue Lösungen für deren Mobilität.“

 

Querverweis:

Unser Beitrag > Funktionen zum Aufbau cyberresistenter Speicherinfrastrukturen für den Applikationsbetrieb

Unser Blogpost > NIS-2 Richtlinie und Datenspeicher: Auf was Unternehmen achten sollten

Unser Beitrag > Cyber Recovery Readiness Report 2024 zeigt Effekte von Investitionen in mehr Cyberresilienz