Neo4j-Graphdatenbank Parallel Runtime ermöglicht bis zu 100-mal höhere Analytik-Performance

München, Starnberg, 31. Okt. 2023 - Mit Parallel Runtime und Native Change Data Capture (CDC) die Verarbeitung von Workloads in Enterprise-Umgebungen beschleunigen…

Zur Ankündigung: Neo4jⓇ - Anbieter von Graphdatenbanken und Graph Analytics - stellt neue Features für Anwender in der Cloud sowie Selbstverwaltet vor. Damit soll laut Entwickler die Performance rund um operative wie analytische Workloads deutlich steigen können. Anwender können Abfragen (Queries) schneller durchführen, transaktionale und analytische Prozesse in einer Datenbank zentral verarbeiten und Datenänderungen in Echtzeit nachverfolgen. Unternehmen sollen so schneller kritische Entscheidungen treffen und dank der höheren Geschwindigkeit, Performance und Agilität bei Datenanalyse ihren Wettbewerbsvorteil ausbauen können. (1)

 

Die neuen Features im Kurzüberblick:

Mit der Parallel Runtime ermöglicht Neo4j laut Anbieter eine bis zu 100-mal höhere Performance, indem Threads nun gleichzeitig über mehrere CPU-Kerne zur Ausführung analytischer Abfragen laufen. (2) Dabei nutzt die Graphdatenbank eine Technologie namens Morsel Based Parallelism, um die Skalierbarkeit zu erhöhen, die Ressourcennutzung zu verbessern und ein nahtloses Multitasking sicherzustellen.

Über die neue Datenänderungserfassung, native Change Data Capture (CDC), lässt sich nachverfolgen, wann Änderungen stattgefunden haben. Dritt-Systeme und Services, die auf diese Änderungen reagieren müssen, erhalten automatisch entsprechende Benachrichtigungen. CDC ist im Neo4j Connector for Kafka und Confluent integriert, um diese Änderungen unterschiedlichen Systemen und Datenbanken verfügbar zu machen.

Neue Embeddings erlauben Anwendern ein leichteres Erstellen von Knowledge Graphen. Die Modelle können bislang fehlende Datenbeziehungen aufzeigen sowie neue Datenbeziehungen im Wissensgraphen prädiktiv ableiten und so den semantischen Kontext für Abfragen erweitern.

Die Graphdatenbank erhält neue Algorithmen für Pfadsuchen, um höhere Effizienz bei komplexen Abfragen zu ermöglichen. Die Algorithmen ermitteln die optimale Sequenz und identifizieren den relevantesten Pfad zwischen einzelnen Knoten im Graphen.Anwender können die neuen Features ab sofort sowohl in der Neo4j Graphdatenbank als auch in der Cloud Version (Neo4j AuraDB) nutzen. Change Data Capture (CDC) ist zunächst als öffentliche Beta-Version des EAP verfügbar.

Anmerkung: Neo4j erweiterte im August 2023 die Kernfunktionen der Graphdatenbank um native Vektorsuche. Die Integration liefert genaue, erklärbare und transparente Ergebnisse für Large Language Models (LLMs) und andere generative KI-Anwendungen. Das Unternehmen wurde 2023 von Google Cloud als Technologiepartner des Jahres in der Kategorie Datenmanagement ausgezeichnet. Aktuell nutzen laut dem Anbieter bereits rund 75% der Fortune-100-Unternehmen die Neo4j Graphdatenbank.

 


 
(1) Abb: Neo4j Unveils Parallel Runtime and CDC. CDC im Neo4j Connector for Kafka und Confluent (Bildquelle: Neo4j)

(2) Quelle / Externer Link > https://neo4j.com/blog/neo4j-unveils-parallel-runtime-cdc/

 

Kommentarauszug Sudhir Hasbe, Chief Product Officer, Neo4j: „Mit den neuen Funktionen rund um Parallel Runtime und Change Data Capture steigt die Performance der Neo4j Graphdatenbank erheblich. Anwender erhalten in Echtzeit tiefe Einblicke in ihre Daten und können Analysen schneller durchführen. Das optimierte Datenmanagement sowie die vereinfachte Architektur sorgen für einen zusätzlichen Effizienz-Boost“.

 

Die Performance steigt proportional zur Anzahl der CPUs

Das genannte Ergebnis basiert auf einem Benchmark-Test, der eine Leistungsverbesserung für eine analytische Abfrage auf einem Stackoverflow-Datensatz mit 50 Mio. Knoten und 124 Mio. Beziehungen zeigt. Der Server (32 CPUs, 128G Speicher) ist über diesen externen Link öffentlich zugänglich > https://demo.neo4jlabs.com:7473/browser/

 

Querverweis:

Unser Beitrag > TigerGraph bei Lippen Digital im Einsatz, einem deutschen Vorreiter für Digitale Inhalte

Unser Beitrag > MongoDB mit neuen generativen KI-Funktionen, schnellerer Vektorsuche und Atlas for the Edge