All Flash Spezialist Pure Storage führt „Data Hub“-Architektur ein

München, Starnberg, 14. Sept. 2018 - Einheitliche Sicht auf alle Daten; Data Lakes und Silos für KI, Analytik und Cloud-native Anwendungen sollen damit überflüssig werden...

Zum Hintergrund: Folgt man Pure Storage, ist die Speicherung von Daten in Data Lakes und Silos-Architekturen inzwischen veraltet. Um in der heutigen Wirtschaft wettbewerbsfähig zu sein, sollten Unternehmen ihre Daten stattdessen vereinheitlichen und sie dann intelligent auf ihren (geschäftlichen) Nutzen hin analysieren können. Dafür hat Pure Storage nun seinen Data Hub vorgestellt. Dieser repräsentiert ein Konzept zur Modernisierung der Speicherarchitektur für unstrukturierte, datenintensive Workloads. Viele Unternehmen verlassen sich derzeit auf vier inhärente, in Silos vorgehaltene Analytiklösungen:

  • Data Warehouse
  • Data Lake
  • Streaming Analytics
  • KI-Cluster

Ein Data Hub integriert laut Anbieter die wichtigsten Merkmale dieser vier Silos und vereinheitlicht sie innerhalb einer Plattform. Data Hub basiert auf Pure Storage FlashBlade und ist konzipiert als datenzentrische Lösung (siehe Abb. unten). Um in einer Geschäftsumgebung, die zunehmend datengesteuert ist, innovativ zu sein und sich zu behaupten, müssen Unternehmen ihre Infrastruktur ebenso datenorientiert gestalten und vollständigen Zugriff in Echtzeit auf diese Daten haben. Ein Data Hub muss hierzu vier Schlüsselmerkmale aufweisen:

  1. Hoher Durchsatz bei der Speicherung von Dateien und Objekten: Backup- und Data-Warehouse-Appliances erfordern einen massiven Durchsatz für Mainstream-, dateibasierte Workloads und Cloud-native, objektbasierte Anwendungen.

  2. Echtes Scale-Out-Design: Die Stärke eines „re-designed“ Data Lakes ist jetzt seine native, skalierbare Architektur, die es Batch-Jobs ermöglicht, grenzenlos zu skalieren, da Software – und nicht der Benutzer – die Ausfallsicherheit und Performance verwaltet.

  3. Mehrdimensionale Performance: Daten sind unvorhersehbar und können mit unterschiedlicher Geschwindigkeit ankommen. Daher benötigen Unternehmen eine Plattform, die jeden Datentyp mit jedem Zugriffsmuster verarbeiten kann. Erforderlich ist damit ein Speichersystem, dass in der Lage ist, beliebige Datenströme, ob klein oder groß, mit beliebigen I/O-Pattern (random, sequential etc.) zu steuern.

  4. Massiv parallele Architektur: In der IT hat es mit Themen wie KI einen drastischen Wandel von seriellen zu parallelen Technologien gegeben. KI-Cluster mit 1000 Kernen und GPUs benötigen einen hierfür optimierte Speicherarchitektur, die ebenfalls massiv parallel zu sein hat.


Abb. 1: Pure Storage Data Hub Architekturübersicht (Bildquelle: Pure Storage)


Kommentarauszug von Jean-Francois Gagne, Gründer und CEO von ElementAI, Anbieter einer Plattform zur Entwicklung von KI-Lösungen für Unternehmen: „Um leistungsfähigere Produkte und Ergebnisse zu erzielen, müssen Daten vereinheitlicht und bereitgestellt werden, anstatt sie einfach zu erfassen und zu speichern. Data Hub ist die Vision für eine neue Speicherarchitektur, die für diese Entwicklung und speziell für die nächste Generation von KI-Produkten konzipiert wurde.“

Anwenderzitat (Auszug) Jérôme Bélan, EMEA CEO bei PNY Technologies, Anbieter von Technologien für High Performance Computing, Grafikvirtualisierung und Deep Learning: „Die größte Herausforderung für unsere Kunden ist, wie sie Daten intelligent machen können. Derzeit ist es mit Daten, die in Silos liegen, nicht möglich, deren wahren Wert zu erschließen. Wir begrüßen den Aufruf von Pure Storage nach einer modernen Architektur, um dieses Problem anzugehen und sicherzustellen, dass Unternehmen das Beste aus ihrem wichtigsten Vermögen machen können..."

Jum McHugh, Vice President und General Manager Deep Learning Systems bei NVIDIA: “Unternehmen in allen Branchen arbeiten daran Wege zu finden, wie sie zukünftige künstliche Intelligenz sinnvoll nutzen können. NVIDIA hat große Schritte getan, um durch Rechenleistung und Innovation künstliche Intelligenz voranzubringen. Daten sind der Treibstoff für künstliche Intelligenz und die Storage-Industrie ist aufgerufen Lösungen zu bringen, die mit dieser Entwicklung schritt halten. Die Data Hub-Architektur kann Unternehmen dabei unterstützen ihre Storage-Infrastruktur so zu gestalten, dass diese Daten so schnell bereitstellt, wie sie von Systemen für künstliche Intelligenz benötigt werden.“

Link > Pure Storage Blog