
Vertrauenswürdige offene Dateninfrastrukturen für leistungsfähige KI im großen Maßstab. Vorstellung einer gemeinsamen Innovations-Roadmap auf Basis von offenen Standards…
Hintergrund
Die Datenarchitektur ist zu einem entscheidenden Faktor dafür geworden, wie schnell Unternehmen ihre KI skalieren können. Und der Erfolg von KI wird dabei zunehmend durch die Qualität und Vertrauenswürdigkeit der zugrunde liegenden Daten definiert. Erfolgreich bedeutet in diesem Zusammenhang auch, dass Agenten vertrauenswürdig handeln können und dazu gehören hochwertige Tools sowie offene Standards auf der Infrastrukturebene.
Ankündigungsübersicht
Fivetran hat am 1. Juni jetzt den Abschluss der Fusion mit dbt Labs bekannt gegeben.
dbt Labs ist der Entwickler von dbt für KI-fähige, strukturierte Daten. Das fusionierte Unternehmen firmiert zunächst unter dem Namen Fivetran + dbt Labs. George Fraser von Fivetran wird danach weiterhin als CEO fungieren und Tristan Handy von dbt Labs übernimmt die Position des Präsidenten.
Zusammen unterstützen Fivetran + dbt Labs nach diesen Angaben eine globale Community von >100.000 Datenteams, die in den Bereichen Analytics, Data Engineering und bei KI-Initiativen tätig sind. Zu den Kunden zählen "einige der bekanntesten Marken der Welt, darunter OpenAI, Zendesk, Coupa, HubSpot sowie führende Unternehmen aus den Branchen Finanzdienstleistungen, Einzelhandel, Fertigung und Gesundheitswesen."
Neues Fundament für agentische KI
KI-Agenten entwickeln sich zu den Hauptnutzern von Unternehmensdaten, jedoch verhalten sie sich anders als menschliche Analysten, für deren Unterstützung der heutige Data-Stack primär konzipiert wurde.
Agenten arbeiten kontinuierlich, zeitgleich und mit maschineller Geschwindigkeit. Die meisten KI-Agenten sollen zudem autonom agieren - ohne menschliches Eingreifen. Dieser Wandel erhöht die Anforderungen an die zugrunde liegenden Daten weiter: sie müssen zuverlässig, aktuell, geregelt und systemübergreifend zugänglich sein.
Datengrundlage für agentenbasierte KI
Zusammen adressieren beide Unternehmen die Dateninfrastruktur, die Agenten vertrauenswürdig machen soll – vom Data Movement über Datentransformation bis hin zum geregelten Kontext für Schlussfolgerungen und Aktionen.
- Fivetran soll sicherstellen, dass Agenten mit vollständigen, kontinuierlich synchronisierten und verlässlichen Daten arbeiten
- dbt stellt Funktionen bereit, damit Daten durch eine definierte und getestete Business-Logik, gemeinsame semantische Kontexte und Best Practices aus der Softwareentwicklung vertrauenswürdig sind.
Auf offenen Standards basierend soll diese Grundlage laut Entwickler über jede Cloud, jede Engine und jedes Tool hinweg arbeiten können. Vorteil: Betreiber sind dann in der Lage, ihre Architektur ohne Lock-in weiterzuentwickeln und gleichzeitig die Portabilität der Geschäftslogik und Kontrolle zu behalten.

Ecosystem integrations and commitment to open standards... Integrations, Interoperable by design (Bildquelle: dbt Labs).
Kommentarauszug George Fraser, CEO und Mitgründer von Fivetran + dbt Labs: „Gemeinsam erschaffen Fivetran und dbt Labs die Infrastruktur, mit deren Hilfe Unternehmen kontrollierte, hochwertige und semantisch reichhaltige Daten bereitstellen können. So können sie vertrauenswürdige KI-Agenten in großem Maßstab betreiben...“
Gemeinsame Innovations-Roadmap
Die ersten kombinierten Neuerungen aus der Fusion beider Anbieter umfassen derzeit sowohl agentische Entwicklungs-Workflows, die intelligente Orchestrierung als auch weitere Investitionen in Open-Source-Lösungen. Dazu gehört die Erweiterung der dbt-Funktionen für die Open-Source-Nutzer von dbt Core. Die wichtigsten Neuerungen betreffen (Quelle, Anbieter):
dbt Core 2.0 (Alpha)
„Die Open-Source-Veröffentlichung der dbt Fusion-Engine-Laufzeitumgebung als dbt Core v2.0 unter Apache-2.0-Lizenz. Entwickler erhalten damit die ihnen vertraute dbt-Erfahrung auf einer schnelleren, leistungsfähigeren Basis. Die lokal installierbare Distribution von dbt soll Entwicklern freien Zugriff auf die gesamte Bandbreite der Fusion-Funktionen geben können – Kernmerkmale der Programmiersprache und Warehouse-Adapter – mit der Möglichkeit, zusätzliche Plattformfunktionen nahtlos durch direkte Anmeldung über das Terminal freizuschalten.
dbt State (Preview)
dbt State fungiert als Caching-Ebene für Datenpipelines. Es übernimmt nur die geänderten Daten und überspringt die unveränderten. Dadurch sollen die zugrundeliegenden Infrastrukturkosten um 30 % oder mehr reduziert werden können.
dbt Wizard (Beta)
Der dbt Wizard bietet eine automatisierte Assistenz beim Erstellen, Refaktorisieren und Debuggen von Modellen, basierend auf dem vollständigen dbt-Projektkontext, einschließlich Datenherkunft, Tests, Verträgen und definierten Metriken. Im Ergebnis stehen regelkonforme Empfehlungen und eine zuverlässigere SQL-Generierung, die die tatsächliche Struktur und Definition der Unternehmensdaten widerspiegeln soll.
Agents Schema
Open-Source-Standard für agentischen Kontext, der ein einzelnes Schema im Data Warehouse oder Data Lake als gemeinsame Kontext-Ebene für KI-Agenten festlegt. Metrikdefinitionen, semantische Modelle, dbt-Lineage und Geschäftsdokumentation werden dazu in einfachen SQL-Tabellen gespeichert. Sie können aus bestehenden Systemen über Tools wie GitHub Actions, Metadaten-Konnektoren oder kundenspezifische Integrationen veröffentlicht werden.
Agents Schema ist laut Anbieter mit jedem Data Warehouse, Data Lake, Ingestion-Tool oder SQL-fähigen Agenten kompatibel. Dies soll Betrieben eine kundeneigene Kontext-Ebene liefern, die im Rahmen bestehender Sicherheits- und Governance-Richtlinien funktioniert, Token-Effizienz durch reichhaltigeren Kontext verbessert und neue Infrastruktur oder Anbieter-spezifische Agentensysteme überflüssig macht."
Querverweis:
Unser Beitrag > Agentic AI Automation: UiPath bringt erste unternehmensweite Plattform auf den Markt
Unser Beitrag > Confluent mit Databricks Kooperation zur Integration von Echzeitdaten im KI-Stack
Unser Beitrag > VAST Catalog: vereinfachtes Datenmanagement von KI und Big-Data-Analytics Anwendungen
Unser Beitrag > KI und Graphdatenbanken: Integration von Neo4j Graph Analytics in Snowflake AI Data Cloud