
Neuartige und Data-Lakehouse-spezifische Resilienzlösung zur Sicherung umfangreicher Datensätze. Ziel ist es, die sichere Wiederherstellung kritischer KI- und Analyse-Workloads in großem Maßstab zu beschleunigen…
Hintergrund
Moderne Data Lakehouses auf Basis von Apache Iceberg eignen sich für aufwendige KI- und andere (Big-Data)Analysen. Ihnen fehlt jedoch eine robuste, native Datenresilienz. Dadurch sind sie anfälliger für Datenverluste sowie Ransomware-Angriffe.
Commvault bietet mit Clumio (Clumio = a Commvault company) für Apache Iceberg auf AWS jetzt eine neue und laut Anbieter bislang branchenweit erste Lösung, die automatisierte und reale Air-Gap-Cyberresilienz für Apache Iceberg unterstützt. Unternehmen sollen damit die Wiederherstellung ihrer kritischen KI- und Analyse-Workloads in großem Maßstab beschleunigen können.
Clumio für Apache Iceberg ist laut Anbieter ab sofort auf dem AWS Marketplace verfügbar (1) und soll damit einen neuen Standard schaffen, Informationen im Data Lakehouse zu sichern.
Ankündigungsübersicht
Data Lakehouse Umgebungen auf Basis von Apache Iceberg eignen sich für aufwendige KI- und andere Datenanalysen. Ihnen fehlt jedoch eine robuste, native Datenresilienz. Dadurch sind sie anfälliger für Datenverluste, Ransomware-Angriffe und Compliance-Risiken.
Native Snapshots sind ein erster Schritt, um hier Abhilfe zu schaffen. Sie sind aber in der Regel an den Source Account gebunden. Ihnen fehlt zudem eine über Air Gap wirklich isolierte Kopie.
Auch eignen sich Snapshots schlecht für Point-in-Time-Wiederherstellungen in großem Maßstab. Dazu müssen Backup-Verantwortliche oft manuell komplexe Tabellen neu verknüpfen und konfigurieren, wenn Sicherungen nicht für Iceberg-Anforderungen ausgelegt sind. Die Folge können längere Ausfallzeiten und ein hohes Risiko inkonsistenter Daten sein.
Clumio für Apache Iceberg auf AWS wurde laut Commvault jetzt auf den Markt gebraucht, um diese Sicherungslücken nativer und herkömmlicher Backup-Tools zu schließen. Die Lösung unterstützt laut Anbieter die Notwendigkeiten von Unternehmen in puncto Datensicherheit, Compliance und Wiederherstellung. Hier die wichtigsten Funktionen von Clumio für Apache Iceberg auf AWS in der Übersicht (Quelle, Anbieter):
„Datenresilienz für Iceberg: Mit dem Dienst legen Nutzer schnell und transaktionskonsistent Backups an, welche den vollständigen Datenzustand und damit die Iceberg-Tabellenstrukturen in ihrer tatsächlichen Beschaffenheit erfassen.
Der neue Resilienzansatz wurde laut Anbieter entwickelt, um manuelle und fehleranfällige Wiederherstellungen zu vermeiden und eine Reihe von Recovery-Optionen zu unterstützen. Zu diesen gehören Point-in-Time-, Snapshot-, regions- und kontoübergreifende sowie In-Place-Wiederherstellungen.
Unveränderliche, Air-Gapped-Kopien für Cyberresilienz: Im Gegensatz zu nativen Snapshots sind die Backups in einer isolierten, sicheren Umgebung geschützt. Dies schützt unternehmenskritische Daten vor Angriffen durch Ransomware, dem unerlaubten Zugriff über kompromittierte Nutzerkonten oder dem böswilligen Löschen der Informationen.
Automatisierte Compliance und Governance: Die Commvault-Lösung hält Snapshots unbegrenzt und langfristig vor - ohne die Leistung des Live-Data-Lake zu beeinträchtigen. Vorgaben zu Compliance und Governance werden kosteneffizient unterstützt.
Optimierte Speicherkosten und -bedarf: Die Dauer der Backup-Fenster und die Höhe der Speicherkosten sinken, indem nach dem ersten vollständigen Backup nur noch Veränderungen erfasst werden.

Abb.: Backup-Statusübersicht in Clumio für Apache Iceberg auf AWS (Bildquelle: Commvault).
„Die Daten, die KI und Analytik antreiben, gehören zu den wertvollsten in einem Unternehmen, sind aber oft am stärksten gefährdet“, so Woon Jung, Chief Technology Officer, Cloud Native, Commvault.
Fazit
Clumio für Apache Iceberg repräsentiert die Strategie des Anbieters, eine möglichst umfassende Resilienz für die gesamte AWS-Datenpipeline zu schaffen und Daten in jeder Phase des Lebenszyklus zu sichern und zu schützen. Nach der Einführung von Resilienzfunktionen für Amazon S3 und DynamoDB bietet Commvault damit tiefergreifende Möglichkeiten auf Data-Lakehouse-Ebene.
Steigende Verbreitung von Apache Iceberg
Unternehmen nutzen verstärkt Apache Iceberg und darunter befinden sich Technologiekonzerne wie Netflix, Apple oder Airbnb **. Laut dem ‚State of The Data Lakehouse-Report‘ von Dremio erwarten über 70 Prozent der IT- und Datenexperten, dass sich Data Lakehouses innerhalb der kommenden drei Jahre als primäre Architektur für KI-Analysen etablieren werden. Externer Link ** https://medium.com/airbnb-engineering/upgrading-data-warehouse-infrastructure-at-airbnb-a4e18f09b6d5
(1) Zur Verfügbarkeit: Clumio für Apache Iceberg ist laut Anbieter ab sofort im AWS Marketplace verfügbar und unterstützt sowohl selbstverwaltete Tabellen über den AWS Glue Data Catalog als auch vollständig verwaltete Tabellen über Amazon S3 Tables. Externer Link > https://aws.amazon.com/marketplace/pp/prodview-hdul2n6jr5dou
Hinweis: Commvault wird auf der SHIFT 2025 vom 11. bis 12. November in New York seine neuesten Lösungen und zukünftige Entwicklungen der Cyberresilienz vorstellen. Zudem können sich Interessenten auf der SHIFT Virtual am 19. November 2025 auch online informieren.
Querverweis:
Unser Beitrag > Daten am Edge und vor-Ort schützen: Commvault erweitert HyperScale Edge und HyperScale Flex
Unser Blogpost > NIS-2 Richtlinie und Datenspeicher: Auf was Unternehmen achten sollten
Unser Beitrag > Resilienz gegen Cyberangriffe: Backup-Verfahren als Teil einer übergeordneten Datenschutzstrategie