Blogpost zu Leistungsmerkmale, Einsatzbedingungen und Positionierung von Continuous Data Protection (CDP)...
Hintergrund
Kontinuierlicher Datenschutz- oder auch Datensicherung (engl. "Continuous Data Protection", kurz CDP) speichert automatisch alle Änderungen an Daten. Falls eine Modifikation erfolgt, werden je nach Implementierung kontinuierlich oder annähernd in real-time Kopien erzeugt. Im Vergleich dazu laufen Backup-Jobs mittels Snapshots ein- oder mehrmals zu bestimmten Zeiten (periodisch).
CDP ist im gewissen Sinn eine Backup-Weiterführung, allerdings mit Vorteilen in Bezug auf den Datenschutz, der Geschwindigkeit beim Restore, Migration, Datenverfügbarkeit und Disaster Recovery (D/R) Möglichkeiten; zudem besteht die Option, D/R-Tests on-premise und-/oder in Verbindung mit der Cloud einfacher und damit auch häufiger umzusetzen.
Wie arbeitet CDP?
Bei CDP-Systemen werden, wenn sich Daten ändern (schreiben, löschen), kontinuierlich Daten kopiert und ggf. repliziert. Technisch gesehen geschieht dies bei blockbasierten Systemen auf Basis von Journaling mit Caching. Wie viel sog. Checkpoints dazu pro Zeiteinheit gesetzt werden, hängt von der Leistungsfähigkeit und Zielsetzung ab. Es gibt CDP-Lösungen die entweder kontinuierlich (Full CDP) oder zu bestimmten Zeiten (Near CDP) Daten erfassen. Point-in-time Recovery im Bereich von Sekunden ohne Datenverluste kann damit erreicht werden. ES existieren File-basierte CDP-Anwendungen, die jeweils Daten und Ereignisse des jeweils verwendeten Dateisystems erfassen. Rein anwendungsbezogene Verfahren bedingen entsprechende Software-Agenten zur Applikationsseite (z.B. einer Datenbank-Umgebung).
Was unterscheidet kontinuierliche Datensicherung von Standard-Backup-Verfahren?
- Längere ungeplante IT-Ausfälle kann sich heute kaum mehr ein Betrieb leisten und traditionelle periodische Backups stoßen bei der Menge an verteilten Daten und stetig steigenden Ansprüchen an die Applikations- und Datenverfügbarkeit auch an Grenzen. Die kontinuierliche Datensicherung ist im Vergleich zu herkömmlichen Backup-Systemen ohne CDP sehr leistungsstark in Bezug auf die wichtigen Parameter RTO und RPO. Anstelle - um das Beispiel Virtual Machine - Sicherung zu nehmen - VM-Snapshot-Daten als primäre Quelle für Backup-Restore zu verwenden, nutzt CDP synchrone Replikation für Disaster Recovery-Zwecke und das Backup. Wenn die Lösung zur Durchführung regelmäßiger Sicherungsläufe verwendet wird, muss das System nur die geänderten Datenteile lesen.
- Bei periodischen Backups werden je nach Lösung alle Daten kopiert, was sich negativ auf die Leistung auswirken kann. CDP-Systeme verbessern die Wiederherstellungsziele, da die Zeitintervalle für die Sicherung kürzer sind und Datenverluste werden gegenüber periodischen Snapshot-Verfahren minimiert bzw. treten nicht auf.
- Da jede Änderung aufgezeichnet und gesichert wird, können auch die Daten auf jeden beliebigen Zeitpunkt zurückgefahren und wiederhergestellt werden. Alle Datentransaktionen bleiben nachvollziehbar erhalten - wichtig für Compliance-Anforderungen. Backups können zudem beliebig oft an ein Datenzentrum repliziert werden und ermöglichen so ein optimiertes, an den Betrieb (SLA) angepasstes Disaster Recovery (D/R).
- Systeme zur kontinuierlichen Datensicherung verfügen je nach Anbieterlösung über flexible Speicheroptionen. Anwender, die nur aktuelle Backups benötigen können, damit ihren Speicherplatz optimieren. Zudem lässt sich der Umfang der kontinuierlichen Datensicherung auch bei extrem vielen VMs skalierbar an ein kurzfristig erhöhtes Workload-Aufkommen wie bei Spitzenzeiten im Betrieb schnell und flexibel anpassen.
Welche Einschränkungen gibt es bei CDP zu beachten?
- Je nach Umfang der Sicherungslandschaft kann die Datenwiederherstellungsleistung geringer ausfallen, wenn die Daten außerhalb des Standorts über ein Netzwerk mit begrenzter Bandbreite gesichert werden. Bei Unternehmensnetzen gibt es mitunter Durchsatzlimitierungen, die regelmäßige Sicherungen beinträchtigen. Auch erfordern kontinuierliche Datensicherungssysteme herstellerspezifische Software bzw. Optionen (Lizenzen) und optimierte Hardware, die natürlich dann meist teurer gegenüber Standard-Backup-Lösungen sind. Für CDP werden idealerweise schnelle Laufwerke benötigt, SSDs bieten sich hier natürlich an. Aber der Datenumfang steigt mit CDP laufend an, da jede Änderung schrittweise gesichert wird (hochkapazitativer HDD-Speicher sinnvoll, sonst wird es u.U. teuer). Als Konsequenz können ferner Leistungs- und Stabilitätsprobleme bei den beteiligten Infrastruktur-Komponenten auftreten.
- Das richtige Sizing der Systeme in Verbindung mit modernen leistungsfähigen Devices wie schnellen NVMe)SSDs, Caching und Schnittstellen-/Protokollen ist wichtig. Zudem sind Cloud-basierte Verfahren unter Einbeziehung von AWS für D/R-Verfahren zu prüfen.
- Im Falle einer Dateibeschädigung (data corruption) kann technologiebedingt je nach Lösung der Wiederherstellungsprozess bei CDP langsamer ablaufen und ist neben der Netzwerkgeschwindigkeit auch direkt von der Dateigröße abhängig.
Wo liegen die Herausforderungen bei Backup-Verfahren ohne CDP-Funktionen?
- Datensicherungslösungen verwenden Snapshots, egal ob als rein Software-basierte Implementierung oder in Kombination von spezialisierter Hardware plus Software (Appliances). Software Backups integrieren sich z.B. in Hypervisor-Systeme und erzeugt über periodische Snapshots ein Backup auf Image-Ebene, um VMs oder Ordner wiederherzustellen. Aufgrund von potentiellen Performance-Einflüssen auf die Produktionsumgebung wurde bei älteren, weniger leistungsfähigen Systemumgebungen (on-Premise) die Anzahl von Snapshots schon mal begrenzt. Beim Restore-Prozess kann sich das jedoch in Datenverlusten bemerkbar machen, wenn Snapshots nicht entsprechend häufiger innerhalb von 24 Stunden erzeugt werden.
- Neben Backups bieten softwarebasierte Sicherungslösungen ebenfalls Disaster-Recovery-Funktionen via VM-Snapshots. Dazu werden Agenten (nicht immer für alle Plattformen verfügbar) sowie Proxy-Server benötigen, was die Umgebung je nach Größe im Betrieb aufwändiger machen kann (TCO). RPO- sowie RTO-Zeiten im niedrigen Sekunden- bzw. Minutenbereich sind mit "klassischen" Standard-Backupverfahren kaum zu erreichen, allerdings auch nicht für alle Applikationen erforderlich.
Bildquelle: Zerto
Fazit
Wo eine möglichst sofortige Wiederherstellung von kritischen Daten gefordert ist und Datenverluste nicht toleriert werden können, wird CDP seine Vorteile ausspielen können. Dies gilt auch für die Möglichkeit von wenig zeitaufwändigeren Tests zur Überprüfung der Ausfallsicherheit einer IT-Umgebung und als Nachweis der Resilienz gegenüber Katastrophenfällen (KRITIS*).
*Link > https://www.kritis.bund.de/SubSites/Kritis/DE/Home/home_node.html
- Anbieterlösungen mit Full- oder zumindest "Near-CDP" sowie Enterprise Backup-Recovery (B/R) mit Disaster-Recovery (D/R) sowie CDP-Funktionen (kein Anspruch auf Vollständigkeit!) sind verfügbar von Zerto (ein HPE-Unternehmen) als Plattform- und Hypervisor-agnostischer full-CDP Ansatz).
-
Über B/R- und D/R mit teilweise "Near-CDP-Funktionalitäten" verfügen Lösungen von z.B. Cohesity, Veeam, Rubrik, Commvault, Veritas Technology, Arcserve, Acronis (MSP-Fokus), Dell Technologies, IBM etc. Dies gilt auch auch für verschiedene Angebote / Implementierungen in der Cloud.
Hinweis: Unseren Podcast zum Thema CDP hören (Zeitbedarf: ca. 8 Min.) > https://podcasts.apple.com/de/podcast/kontinuierlicher-datenschutz-cdp-zur-erweiterung-von/id81294878?i=1000544447836