Backup und Disaster Recovery: Vorgehensweisen und Technologien zur Aufrechterhaltung der Geschäftstätigkeit

Submitted by NDeuschle on 28 November, 2018 - 16:51

Starnberg, 28. Nov. 2018 - Notwendige Tätigkeiten sowie Verfahren, um die Verfügbarkeit von Anwendungsdaten (on-prem / Cloud) und IT-Systemen (on-prem) sicherzustellen...

Um was es hier geht: Die Planung von Datensicherungs-Konzepten ist zwar nicht trivial, aber häufig werden dabei nur die Anforderungen an RPO-Zeiten (Recovery Point Objective) berücksichtigt. Entscheidend für RPO ist dabei letztlich die Tatsache, wie schnell sich Daten auf der Zielseite den jeweiligen Applikationen wieder zur Verfügung stellen lassen. Zentral dabei ist aber, sich nicht nur auf Snapshots oder Backups zu verlassen, wenn es um die solide Planung zur kontinuierlichen Aufrechterhaltung des Geschäftsbetriebes geht. Eine valide Disaster-Recovery Strategie wird auf Grund der Datenzentrierung im Unternehmen immer wichtiger; nachfolgend finden Sie deshalb hierzu nochmals eine kurze Übersicht zu den wesentlichen Begrifflichkeiten.

Ein Backup stellt vereinfacht eine simple Kopie von Daten dar, die dazu erstellt wurden, in der ursprünglichen Version wiederhergestellt zu werden. In der Regel wird die Sicherung täglich (granular je nach Anforderung) durchgeführt. Backups sind nützlich für den Zugriff auf z.B. versehentlich gelöschte oder nicht mehr verfügbare Daten, ermöglichen jedoch natürlich nicht das Failover der gesamten Umgebung auf einen zweiten Standort oder die Cloud, falls die vorhandene IT-Infrastruktur von massiven Problemen betroffen ist. Das Thema Ransomware ist ein weiterer Punkt, der für eine gute Backup-Strategie spricht (mit Tape als off-line data copy als „last line of defense“). (Hinweis: Sie finden unter diesem Stichwort einige wichtige Beiträge hier auf dieser Webseite).

Eine Desaster-Recovery (DR) Strategie macht es erforderlich festzustellen, welche Systeme als unternehmenskritisch gelten; dann müssen Procedere zur Wiederherstellung mit diesbezüglichen Dokumentationen festgeschrieben werden. Nicht zu vergessen... die Möglichkeit, regelmäßig Test durchzuführen. Disaster Recovery Planung erfordert realistische Recovery Time Objective (RTO) Zeiten, um die maximale Zeitspanne festzulegen, die das Unternehmen ohne IT-Systeme nach einer Katastrophe sein kann. Bislang wurde hierzu mindestens ein Duplikat der IT-Infrastruktur (Ausweich-RZ) an einem sekundären Standort gefordert, um die Datenreplikation und weitere Maßnahmen zwischen Produktionssystemen und dem DR-Standort zu ermöglichen.

Data Replication liefert aus RPO-Sicht relativ effektive Werte, denn das Zielsystem repräsentiert exakt das gespiegelte Image der Quelle. Der jeweilige RPO-Wert hängt davon ab, wie schnell die Änderungen übernommen werden können und ob asynchron oder synchron gespiegelt wird. Ein Nachteil aus Betriebs- und Kostengesichtspunkten: DR benötigt meist eine separate IT-Umgebung, bei der alle wichtigen Bereiche der Produktivlandschaft berücksichtigt sind (Hardware, Software, Netzwerkanbindung, Sicherheit etc.). Mit ein Grund, weshalb kleinere Unternehmen mit weniger Standortorten / Personal / IT-Know-how dazu übergehen, Anwendungen und Daten an einen externen Dienstleister bzw. die Cloud zu verlagern (DRaaS, BaaS etc.). Daraus ergeben sich jedoch neue Abhängigkeiten und Prozeduren (vertragsrechtliche Aspekte, SLA/SLO-Definitionen), die mitunter nicht zu unterschätzen sind.

Die allgemeine Bedeutung eines DR-Plans besteht darin, Risiken und Ausfallzeiten zu minimieren, die Einhaltung erarbeiteter Policies einzuhalten und letztlich Ausfälle möglichst ganz zu vermeiden. Backups sind wie gesehen nur ein Teilaspekt dieser Strategie und beziehen sich auf Wiederherstellung bestimmter Daten. Recovery Time Objective (RTO) und Recovery Point Objective (RPO) - Werte stehen also bei jeder Initiative zur Aufrechterhaltung des Geschäftsbetriebes im Mittelpunkt der Überlegungen; dies gilt für on-premise wie (hybrid) Clouds.

Recovery Point Objective: Definiert die Zeitspanne, die im Business Continuity Plan den gerade noch zulässigen Grenzwert darstellt. Beispiel: Wenn die letzte intakte Kopie von Daten 12 Stunden alt ist, während die RPO dafür 18 Stunden beträgt, dann entspricht der RPO-Parameter dem des Business Continuity Plans.
Recovery Time Objective: Definiert die Zeit die benötigt wird, um den Geschäftsprozess nach einem Ausfall im Rahmen der SLA-Vorgaben wieder zu produktiv werden zu lassen. RTO gibt damit eine Antwort auf die Frage, wieviel Zeit zum Recovery nach einer Geschäftsprozessunterbrechung zur Problembeseitigung zur Verfügung steht.

Fazit: RTO und RPO als zentrale Paramenter mit weiteren Analysen zum Einfluss von Ausfällen auf den Geschäftsbetrieb liefern eine fundierte Grundlage zum Aufbau einer praxistauglichen Strategie im Rahmen von Business Continuity- und Disaster Recovery Planungen. Backup ist und bleibt extrem wichtig, ist jedoch nur ein Teilaspekt eines weitaus umfangreicheren Maßnahmenspakets.

Backup-Restore

Cloud Computing, Cloud Storage, Hybrid Cloud, Multi Cloud

Data Protection, Disaster Recovery, Backup