Cloudera DataFlow für die Public Cloud: neuer Cloud-nativer Service für NiFi auf Kubernetes

München, Starnberg, 07. Sept. 2021 - Weitere Funktionen der Cloudera Data Platform angekündigt, um Cloud-native Datenflüsse über Kubernetes zu automatisieren-/verwalten...

Zur Ankündigung: Cloudera kündigt die Verfügbarkeit von Cloudera DataFlow für die Public Cloud an. Dabei handelt es sich um einen Cloud-nativen Datenfluss-Service zur Verarbeitung hybrider Streaming-Workloads auf der Cloudera Data Platform (CDP). Mit Cloudera DataFlow für die Public Cloud können Anwender komplexe Datenflussvorgänge automatisieren, die betriebliche Effizienz von Streaming-Datenflüssen mit automatischen Skalierungsfunktionen steigern und Cloud-Kosten senken, indem die Dimensionierung der Infrastruktur nicht länger aus dem Bauchgefühl heraus erfolgen muss.

Laut IDC's Worldwide Global DataSphere IoT Device and Data Forecast, 2021-2025 soll ein exponentielles Wachstum des Data-in-Motion-Volumens von bis zu 79 ZB über alle Branchen hinweg erwartet werden. Viele Unternehmen nutzen bereits Apache NiFi, um Daten über hybride Cloud-Architekturen durch die visuelle Gestaltung von No-Code-Datenflüssen zu erfassen und zu verarbeiten.

Auch wenn die Cloud eine einfache Möglichkeit zur Verarbeitung oder Speicherung großer Datenmengen bietet, gibt es mehrere Herausforderungen, die es zu bewältigen gilt. Die Bereitstellung zahlreicher anspruchsvoller Datenströme in einem einzigen Cluster kann Betriebs- und Monitoring-Probleme verursachen. Wenn mehrere NiFi-Flows um dieselben Ressourcen konkurrieren, kann dies zu Leistungsproblemen führen. IT-Administratoren entscheiden sich oft aus Vorsicht für größere Infrastrukturen, was zu einer unzureichenden Nutzung und hohen Kosten führt. Schließlich setzen Unternehmen auf ein Pay-as-you-go-Modell, um nicht für ungenutzte Ressourcen zahlen zu müssen.

Cloudera DataFlow für die Public Cloud ist ein Cloud-nativer Service für NiFi auf Kubernetes und umfasst wichtige Betriebs- und Monitoring-Funktionen, die diese Herausforderungen meistern und bei herkömmlichen Datenfluss-Services nicht verfügbar sind. Im einzelnen:

  • Zentraler Datenfluss-Katalog für Verwaltbarkeit, Erkennung und Versionskontrolle

  • Zentrales Dashboard für Monitoring, zur Fehlerbehebung und zur Leistungsoptimierung von Datenströmen über mehrere Cloud-Cluster hinweg

  • Einfacher Bereitstellungsassistent und robuste APIs für die automatische Skalierung von Datenflüssen auf Kubernetes, die von der Cloudera Data Platform (CDP) verwaltet werden

  • Vordefinierte Abläufe, so genannte "ReadyFlows", für einige der gängigsten Streaming-Anwendungsfälle.


Bildquelle: Cloudera

Cloudera DataFlow für die Public Cloud ist laut Anbieter ab sofort auf AWS verfügbar. Weitere Informationen finden Sie unter > http://cloudera.com/cdfx


Querverweis: