Starnberg, 26. Nov. 2021 - Blogpost zu den Leistungsmerkmalen, Einsatzbedingungen und einer Positionierung von Continuous Data Protection (CDP)...
Zum Beitrag: Kontinuierlicher Datenschutz- oder auch Datensicherung (Continuous Data Protection) speichert automatisch alle Änderungen an Daten. Falls eine Modifikation erfolgt, werden je nach Implementierung kontinuierlich oder annähernd in real-time Kopien erzeugt. Im Vergleich dazu laufen Backup-Jobs mittels Snapshots ein- oder mehrmals zu bestimmten Zeiten (periodisch). CDP ist im gewissen Sinn eine Backup-Weiterführung, allerdings mit Vorteilen in Bezug auf den Datenschutz, der Geschwindigkeit beim Restore, Migration, Datenverfügbarkeit und Disaster Recovery (D/R) Möglichkeiten; zudem besteht die Option, D/R-Tests on-premise und-/oder in Verbindung mit der Cloud einfacher und damit auch häufiger umzusetzen.
Wie arbeitet CDP?
- Bei CDP-Systemen werden, wenn sich Daten ändern (schreiben, löschen), kontinuierlich Daten kopiert und ggf. repliziert. Technisch gesehen geschieht dies bei blockbasierten Systemen auf Basis von Journaling mit Caching. Wie viel sog. Checkpoints dazu pro Zeiteinheit gesetzt werden, hängt von der Leistungsfähigkeit und Zielsetzung ab. Es gibt CDP-Lösungen die entweder kontinuierlich (Full CDP) oder zu bestimmten Zeiten (Near CDP) Daten erfassen. Ein Point-in-time Recovery im Bereich von Sekunden ohne Datenverluste kann damit erreicht werden. Ferner existieren File-basierte CDP-Anwendungen, die jeweils Daten und Ereignisse des jeweils verwendeten Dateisystems erfassen. Rein anwendungsbezogene Verfahren bedingen entsprechende Software-Agenten zur Applikationsseite (z.B. Datenbank-Umgebungen).
Warum überhaupt CDP und was unterscheidet kontinuierliche Datensicherung von Standard-Backup-Verfahren?
Längere ungeplante IT-Ausfälle kann sich heute kaum mehr ein Betrieb leisten und traditionelle periodische Backups stoßen bei der Menge an verteilten Daten und stetig steigenden Ansprüchen an die Applikations- und Datenverfügbarkeit auch an Grenzen. Die kontinuierliche Datensicherung ist im Vergleich zu herkömmlichen Backup-Systemen ohne CDP sehr leistungsstark in Bezug auf die wichtigen Parameter RTO und RPO. Anstelle - um das Beispiel Virtual Machine Sicherung zu nehmen - VM-Snapshot-Daten als primäre Quelle für Backup-Restore zu verwenden, nutzt CDP synchrone Replikation für Disaster Recovery-Zwecke und das Backup. Wenn die Lösung zur Durchführung regelmäßiger Sicherungsläufe verwendet wird, muss das System nur die geänderten Datenteile lesen. Bei periodischen Backups werden je nach Lösung alle Daten kopiert, was sich negativ auf die Leistung auswirkt. CDP-Systeme verbessern die Wiederherstellungsziele, da die Zeitintervalle für die Sicherung kürzer sind und Datenverluste werden gegenüber periodischen Snapshot-Verfahren minimiert bzw. treten nicht auf.
Da jede Änderung aufgezeichnet und gesichert wird, können auch die Daten auf jeden beliebigen Zeitpunkt zurückgefahren und wiederhergestellt werden. Alle Datentransaktionen bleiben nachvollziehbar erhalten - wichtig für Compliance-Anforderungen. Backups können zudem beliebig oft an ein Datenzentrum repliziert werden und ermöglichen so ein optimiertes, an den Betrieb (SLA) angepasstes Disaster Recovery (D/R).
Systeme zur kontinuierlichen Datensicherung verfügen je nach Anbieterlösung über flexible Speicheroptionen. Anwender, die nur aktuelle Backups benötigen können, damit ihren Speicherplatz optimieren. Zudem lässt sich der Umfang der kontinuierlichen Datensicherung auch bei extrem vielen VMs skalierbar an ein kurzfristig erhöhtes Workload-Aufkommen wie bei Spitzenzeiten im Betrieb schnell und flexibel anpassen.
Diesen Beitrag als Podcast hören (Zeitbedarf: ca. 8 Min.) > https://podcasts.apple.com/de/podcast/kontinuierlicher-datenschutz-cdp-zur-erweiterung-von/id81294878?i=1000544447836
Welche Einschränkungen gibt es bei CDP zu beachten?
Je nach Umfang der Sicherungslandschaft kann die Datenwiederherstellungsleistung geringer ausfallen, wenn die Daten außerhalb des Standorts über ein Netzwerk mit begrenzter Bandbreite gesichert werden. Bei Unternehmensnetzen gibt es mitunter Durchsatzlimitierungen, die regelmäßige Sicherungen beinträchtigen. Auch erfordern kontinuierliche Datensicherungssysteme herstellerspezifische Software bzw. Optionen (Lizenzen) und optimierte Hardware, die natürlich dann meist teurer gegenüber Standard-Backup-Lösungen sind. Für CDP werden idealerweise schnelle Laufwerke benötigt, was z.B. mit SSDs zusätzliche Kosten bedeutet; auch der Datenumfang steigt stetig, da jede Änderung schrittweise gesichert wird (hochkapazitativer Speicher). Als Konsequenz können Leistungs- und Stabilitätsprobleme bei den beteiligten Infrastruktur-Komponenten auftreten.
Das richtige Sizing der Systeme in Verbindung mit modernen leistungsfähigen Devices wie z.B. schnellen (NVMe) SSDs, Caching und Schnittstellen-/Protokollen gilt es zu beachten. Im Falle einer Dateibeschädigung (data corruption) kann technologiebedingt je nach Lösung der Wiederherstellungsprozess bei CDP langsamer ablaufen und ist neben der Netzwerkgeschwindigkeit direkt von der Dateigröße abhängig.
Wo liegen die Herausforderungen bei Backup-Verfahren ohne CDP-Funktionen?
Anbieterlösungen von Datensicherungslösungen verwenden eigentlich immer Snapshots, egal ob als rein Software-basierte Implementierung oder in Kombination von spezialisierter Hardware plus Software (Appliances). Software-basierte Datensicherung integriert sich in Hypervisor-Systeme und erzeugt über periodische Snapshots ein Backup auf Image-Ebene, um VMs oder Ordner wiederherzustellen. Aufgrund von negativen Performance-Einflüssen auf die Produktionsumgebung ist allerdings die Anzahl von Snapshots meist begrenzt. Beim Restore-Prozess kann sich das in möglichen Datenverlusten bemerkbar machen z.B. falls Snapshots nur 2 x in 24 Std. erzeugt werden.
Neben Backups bieten softwarebasierte Sicherungslösungen ebenfalls Disaster-Recovery-Funktionen via VM-Snapshots. Dazu werden Agenten (nicht immer für alle Plattformen verfügbar) sowie Proxy-Server benötigen, was die Umgebung je nach Größe im Betrieb aufwändiger machen kann (TCO). RPO- sowie RTO-Zeiten im niedrigen Sekunden- bzw. Minutenbereich sind typischerweise mit Standard-Backupverfahren nicht zu erreichen (allerding auch nicht für alle Anwendungen notwendig).
Kurzes Fazit
Wo eine möglichst sofortige Wiederherstellung von kritischen Daten gefordert ist und Datenverluste nicht toleriert werden können, wird CDP seine Vorteile ausspielen. Dies gilt auch für die Möglichkeit von wenig zeitaufwändigeren Tests zur Überprüfung der Ausfallsicherheit einer IT-Umgebung und als Nachweis der Resilienz gegenüber Katastrophenfällen (KRITIS). Link > https://www.kritis.bund.de/SubSites/Kritis/DE/Home/home_node.html
Anbieterlösungen mit Full- oder Near-CDP sowie Enterprise Backup-Recovery mit Disaster-Recovery- und CDP-Funktionalitäten (kein Anspruch auf Vollständigkeit!) sind verfügbar von Zerto (jetzt HPE, Plattform- und Hypervisor-agnostisch; full CDP); Cohesity, Veeam, Rubrik, Commvault, Veritas NetBackup, Arcserve, Acronis (MSP-Fokus), Dell Technologies, IBM usw...
Querverweis: Unser Beitrag > Unternehmensweite Backup- und Recovery-Lösungen 2021: aktueller Report von Gartner