Schwalbach, Starnberg, 28. Febr. 2013 - Neue HAWQ-Technologie verbessert Performance bei SQL-Abfragen und hoher Transaktionslast bis um den Faktor 100…
Zum Hintergrund: EMC stellt mit Pivotal HD eine neue Big-Data-Analyseplattform unter Open-Source-Lizenz vor. Die Leistungsfähigkeit dieser Apache-Hadoop-Distribution beruht auf der nativen Integration von EMCs Greenplum Massively-Parallel-Processing (MPP)-Datenbank und der neuen HAWQ-Technologie, die Pivotal HD laut Anbietet zur bislang leistungsfähigsten Hadoop-Distribution macht. Bei Pivotal HD werden SQL-Abfragen hundertmal schneller ausgeführt als bei SQL-ähnlichen Abfragen anderer Distributionen.
Mit echter SQL-Unterstützung beseitigt die Lösung eine Hürde, die der Verbreitung von Hadoop als einzigem Daten-Repository in Unternehmen bisher im Wege stand. Die neue SQL-Schnittstelle erlaubt die Verwendung von professionellen Business-Intelligence-Lösungen und Data-Mining-Komponenten – eine entsprechende Voraussetzung für die unternehmensweite Datenanalyse und den Aufbau eines datenbasierten Unternehmens.
- Die Vorteile der SQL-Unterstützung zeigen sich beim Arbeitsaufwand für die Entwicklung. Unternehmen benötigen nicht mehr so viele Entwickler für die Anpassungen, um z.B. ein Dashboard oder einen Report zu erzeugen. Pivotal HD vermeidet die Verschiebung von Daten zwischen Systemen und deren doppelte Speicherung. Zu den Besonderheiten der Technologie HAWQ zählen Dynamic Pipelining, ein Abfrageoptimierer, horizontale Skalierung, SQL-Konformität, interaktive Abfragen, tiefe Analyse und Unterstützung für Hadoop-Formate.
- Mit der Managementoberfläche „Command Center“ können Administratoren und Entwickler auf einfache Weise eine große Anzahl von interaktiven Web-Benutzerschnittstellen anlegen und verwalten. Per Kommandozeile können Skripte ausgeführt und mit einer programmierfreundlichen Web-Services-API komplexe Automatisierungsaufgaben gelöst werden. Command Center unterstützt außerdem die Verwaltung großer Cluster, die Definition von Services und Rollen, die Verwaltung von Diensten sowie die Überwachung von HDFS-Jobs und ‑Aufgaben. Pivotal HD wird voraussichtlich Ende des ersten Quartals dieses Jahres als reine Software und Appliance-basierte Lösung erhältlich sein. Nutzer profitieren von EMCs weltweiter 24x7 Support-Infrastruktur.
Anwenderzitat NYSE Euronext Steven Hirsch, Chief Data Officer, SVP Global Data Services: „Mit Pivotal HD werden viele Punkte auf unserer Hadoop-Wunschliste erfüllt, z.B. Unterstützung für die gängigsten Werkzeuge, verbesserte Datenverwaltung und größere Elastizität in Bezug auf die Speicherung und die Rechenleistung. Vor allem aber bietet es eine echte SQL-Schnittstelle - nicht eine oberflächliche Umsetzung, die heute so verbreitet ist, sondern eine native Implementierung für eine echte SQL-Verarbeitung und -Optimierung. Wenn nur noch eine einzige Hadoop-Infrastruktur für Big-Data-Analysen benötigt wird, verändert dies alles. Auch die um den Faktor 100 schnelleren SQL-Abfragen sind ein enormer Zugewinn. Wir bei NYSE Euronext sind begeistert davon.“
Weitere Informationen:
Pivotal HD > http://www.greenplum.com/products/pivotal-hd
Blog von Greenplum Solutions Architect Donald Miner - Introducing Pivotal HD
http://www.greenplum.com/blog/topics/hadoop/introducing-pivotal-hd

Bildquelle: Datastream - The official Greenplum Blog - Pivotal HD, 2/13