Debezium als Public Preview für Managed Apache Cassandra von Instaclustr verfügbar

Mönchengladbach, Starnberg, 18. Aug. 2023 - Herkömmliche ETL (Extract, Transform, Load)-Ansätze sind mit Apache Cassandra schwer durchführbar; Overheads reduzieren...

Zur Ankündigung: Instaclustr bietet ab sofort einen verwalteten Debezium-Konnektor für Apache Cassandra (Open Source NoSQL Database) als Public Preview an. Debezium ist eine verteilte Open-Source-Plattform für die Erfassung von Datenänderungen. Mit ihm können Nutzer Änderungs-Streams der Daten eines Cassandra-Clusters über einen Apache Kafka - Cluster zu einem beliebigen zentralisierten Speicher exportieren. Dieses Vorgehen kann im Vergleich zur separaten Analyse getrennter Systeme tiefere Einblicke in die Daten ermöglichen. Auch entsteht keine Bindung an einen Cloud-Anbieter und damit kein Vendor Lock-in.

 

Debezium ist eine Plattform für Change Data Capture (CDC) und soll ein zentrales Problem lösen, das Administratoren häufig begegnet: Zwar speichert Cassandra große Datenmengen, verfügt aber nativ nicht über tiefgreifende Analysemöglichkeiten. Daher müssen Nutzer ihre Daten erst auf einen anderen Speicher auslagern. Change Data Capture ist ein Prozess, um Datenbewegungen zu überwachen und Daten zu extrahieren, sobald sie sich ändern. Dieser Vorgang läuft bei CDC kontinuierlich und in kleinen Batches ab, wodurch Unternehmen nahezu in Echtzeit Einblicke in ihr Geschäft erhalten.


Herkömmliche ETL ( Extract, Transform, Load)-Ansätze sind mit Apache Cassandra schwer durchführbar, da das Tool in der Regel große Mengen an Batch-Daten verarbeitet. Debezium benötigt hingegen weniger Systemressourcen. Somit erlaubt die Plattform die Extrahierung geänderter Daten aus Cassandra für eine nachgelagerte Analyse, ohne dass ein unangemessener Overhead entsteht.


Der Managed Debezium Connector for Cassandra von Instaclustr bietet laut Anbieter die folgenden Vorteile:

  • Skalierbarkeit für große Datenmengen und Streaming kleinerer Daten-Batches nahezu in Echtzeit
  • Einen reinen Open-Source-Ansatz unter der Apache-2.0-Lizenz
  • Keine Bindung an einen Cloud-Anbieter und somit auch kein Vendor Lock-in
  • Ausführung auf dem eigenen oder auf einem von Instaclustr bereitgestellten Cloud-Provider-Account
  • Vollständiges Management und Hosting durch Instaclustr mit Rund-um-die-Uhr-Support für Managed Apache Cassandra, Managed Apache Kafka und Managed Debezium
  • Zusätzliche Metriken über die Konsole von Instaclustr und ein API für das Monitoring via Prometheus.


Bildquelle: Instaclustr

Link > Weitere Informationen über den Debezium Connector for Cassandra finden sich im zugehörigen Blog von Instaclustr unter https://www.instaclustr.com/blog/change-data-capture-cdc-with-kafka-and-debezium/

 

Querverweis:

Unser Beitrag > Workflows von Microservices mit Open Source Cadence orchestrieren und optimieren

Unser Beitrag > DoubleCloud sieht Konsolidierungs-Trends bei Datenbanken und Cloud Data Management

Unser Beitrag > Capgemini IT-Trends-Studie 2023: viele Datensilos und noch wenig cloudnative Anwendungen