Cloudera bietet on-premise Open Data Lakehouse für vertrauenswürdige Unternehmens-KI

München, Starnberg, 04. Juli 2023 - Neues Private Cloud-Angebot Cloudera ‘Iceberg Everywhere’; Erweiterungen für Apache Iceberg in Kürze auch in der Private Cloud...

Zur Ankündigung: Cloudera hat die Erweiterung seines Open-Data-Lakehouse-Angebots vorgestellt, mit dem eine vollständige Grundlage für Analyse- und KI-Funktionen für alle Daten geschaffen werden soll – in der Cloud, und jetzt auch On-Premises. Cloudera ist ein Befürworter des Open-Source-Projekts Apache Iceberg und hat im vergangenen Jahr die Unterstützung in der Cloudera Data Platform (CDP) in der Public Cloud sowie kürzlich die Unterstützung für Iceberg v2 eingeführt.

Jetzt hat das Unternehmen den Support von Apache Iceberg für CDP in der Private Cloud angekündigt, die ab sofort als Tech-Preview und später in diesem Sommer allgemein verfügbar sein soll. Cloudera stellt Iceberg dort zur Verfügung, wo sich die Daten der Kunden befinden. CDP bietet laut Anbieter einen sicheren und schnellen Weg zu vertrauenswürdiger Künstlicher Intelligenz (KI) in Unternehmen, basierend auf den aktuellen Open Data Lakehouse Funktionalitäten. Das soll den Einsatz neuer KI-Modelle mit Daten aus jeder Umgebung ermöglichen. Cloudera möchte damit neue Technologien wie Large Language Models (LLM) und Self-Service-Analysen in Echtzeit im großen Maßstab für alle seine Kunden leichter zugänglich machen.

 

Bildquelle: https://blog.cloudera.com/

Anmerkung: Iceberg ist ein Hochleistungsformat für große analytische Tabellen. Iceberg bietet laut Community die Zuverlässigkeit und Einfachheit von SQL-Tabellen für Big Data und ermöglicht es Engines wie Spark, Trino, Flink, Presto, Hive und Impala, sicher und gleichzeitig mit denselben Tabellen zu arbeiten (Quelle > https://iceberg.apache.org/ ).

 

Cloudera bietet ein offenes Data Lakehouse, welches über mehrere Public-Cloud-Umgebungen und in eigenen Rechenzentren der Kunden (On-Premises) funktioniert. So können Unternehmensdaten am bisherigen Speicherort verbleiben. CDP bietet einheitliche Sicherheit und Governance für alle Daten –  sowohl für strukturierte als auch für unstrukturierte – und gewährleistet laut Entwickler einen einfachen Zugriff mit einem einheitlichen Anwendererlebnis unabhängig vom Speicherort.

Apache Iceberg ist ein Baustein des Open Data Lakehouse. Mit dieser Erweiterung können LLMs dann Petabytes an Daten nutzen, die von Cloudera verwaltet werden. Das bedeutet, dass mehr Nutzer im gesamten Unternehmen auf mehr Daten zugreifen können, und das auf mehrere Arten.


Querverweis:

Unser Blogpost > Speicheranforderungen bei KI-Anwendungen: Randbedingungen und Einsatzkriterien

Unser Beitrag > Wie Green IT der Schlüssel zur Wettbewerbsfähigkeit werden kann

Unser Beitrag > Capgemini IT-Trends-Studie 2023: viele Datensilos und noch wenig cloudnative Anwendungen