Künstliche Intelligenz und komplexe Analytik profitieren von neuen Speicherlösungen

München/Wien/Zürich, 18. Okt. 2017 - Pure Storage FlashBlade Arrays beschleunigen Hadoop, Spark sowie HPC Anwendungen; lineare Skalierung und Performance...

Zum Hintergrund: Moderne Analytik hängt maßgeblich von Daten und deren Verarbeitung ab. Großen Datenvolumina müssen parallelen Prozessoren (Multicore CPUs und GPUs) zur Verfügung gestellt werden – bei höchstmöglicher Geschwindigkeit. Nur so entsteht durch Maschinelles Lernen und die schnelle Ausführung von Algorithmen ein messbarer Mehrwert in Form von besserer Datenqualität. Pure Storage hat hierzu zwischenzeitlich erste erfolgreiche Kundenlösungen und Implementierungen seiner FlashBlade Speicherlösung bekanntgegeben. Das Unternehmen hatte FlashBlade als erstes System, das speziell für moderne Analytik entwickelt wurde, zu Beginn des Jahres weltweit verfügbar gemacht. Seither kommen die Systeme nach Angaben des Herstellers vor allem dort zum Einsatz, wo anspruchsvolle Datenvolumen beispielsweise für moderne Analytik, Künstliche Intelligenz und Maschinelles Lernen verarbeitet werden müssen.

Anfangs erfolgte der Einsatz von Maschinellem Lernen hauptsächlich bei Hyperscalern und großen Webscale-Unternehmen. Mittlerweile aber hält Maschinelles Lernen aber massiv Einzug in einer Vielzahl an Industrien. In der Automobilbranche im Bereich des Autonomen Fahren übernimmt Maschinelles Lernen eine zentrale Aufgabe. Im Finanzbereich dienen Künstliche Intelligenz sowie Maschinelles Lernen der Risikoanalyse sowie der Automatisierung von Kapitalflüssen und Investments. Die Auswertung von MRI-Aufnahmen, wobei mit Hilfe von Genanalysen beispielsweise Tumore früh erkannt werden, ist auf die schnelle Auswertung komplexer Daten angewiesen, um rasch zuverlässige Diagnosen zu stellen.

Zu einem der ersten Nutzer von FlashBlade gehört demnach Zenuity, eine Unternehmung des Premium PKW-Herstellers Volvo Cars und Autoliv, dem weltweit führenden Anbieter von Sicherheitssystemen für Autos. Hier kommen FlashBlade und NVIDIA DGX-1 als Grundlage für ein Projekt rund um Maschinelles Lernen zum Einsatz. Ziel ist es laut Herstellerangaben dabei, in den kommenden vier Jahren das sicherste autonome Fahrzeug zur Marktreife zu bringen.

Die Fahrzeuge selbst verfügen über Sensoren wie LIDARs und Kameras um sichere Navigation zu ermöglichen. Millionen von Daten werden dabei erfasst und dienen dazu das neurale Netz zu trainieren, das dann genutzt werden soll, um die Software zu betreiben, auf deren Basis die Flotte an selbstfahrenden PKW von Zenuity operiert. Anwenderzitat Samuel Scheidegger, Machine Learning-Experte bei Zenuity: “FlashBlade bietet die Skalierbarkeit, die wir für solch ein umfassendes Projekt, das auf Maschinelles Lernen setzt, benötigen. Mit der Fähigkeit der linearen Skalierung wird uns FlashBlade in die Lage versetzen unsere Plattform für Maschinelles Lernen auch für zukünftige Anforderungen aufzurüsten.“

Ebenfalls genutzt wird FlashBlade von der Berkeley Universität: Das Berkeley AMPLab hat mit Apache Spark die führende Analytics-Engine für superschnelle Datenanalysen in Echtzeit entwickelt. Der Lehrstuhl für Genomik hat Apache Spark mit FlashBlade verknüpft und konnte so die Sequenzierung von Genomen sprunghaft beschleunigen.

In London setzt Man AHL, ein Vorreiter im Bereich systematischer, quantitativer Investments ebenfalls auf den Einsatz von Apache Spark in Zusammenarbeit mit FlashBlade um Computermodelle zu entwickeln und auszuführen, die Investmententscheidungen beschleunigen und verbessern. Rund 50 Analysten und 60 Techniker arbeiten hier zusammen um neue Investmentmodelle und Strategien zu entwickeln, die von Computern umgesetzt werden können. Das Unternehmen nutz FlashBlade um die immensen Datenmengen zu verarbeiten, die auch bei anspruchsvollsten Simulationen benötigt werden. Kommentar Gary Collier, Co-CTO bei Man AHL: „Der Datendurchsatz von Spark-Workloads konnte um das 10- bis 20-fache gesteigert werden. Dieser Vorteil kann für uns noch von immenser Bedeutung werden, wenn es darum geht, mit den Modellen am Markt frühestmöglich aktiv zu werden.“

Pure Storage selbst nutzt Künstliche Intelligenz und FlashBlade als Schlüsselkomponenten seiner internen Technologieplattform. Pure1 META stellt weltweit prognostizierende Intelligenz zur Verfügung, indem Daten gesammelt und analysiert werden, die von täglich über einer Billion Telemetriepunkten der von Kunden genutzten Arrays geliefert werden. Mit META hat Pure Storage selbst Künstliche Intelligenz implementiert, die Kunden dabei hilft mögliche Engpässe in ihren Systemen vorherzusagen und zu rechtzeitig zu identifizieren.


Abb. 1: Pure1 META AI Engine, Übersicht (Bildquelle: Pure Storage)


Zitat Par Botes, Vice President Products, bei Pure Storage: „Durch das Konzept von FlashBlade gibt es im Storage Array wesentlich weniger Flaschenhälse als bei herkömmlichen Lösungen. Somit kann mehr Arbeit schneller erledigt werden, denn die Workloads werden nicht nacheinander aufgereiht, sondern parallel erledigt. Viele konventionelle Systeme wurden für individuelle, spezifische Workloads entwickelt, was sie in ihrer Flexibilität einschränkt. FlashBlade hingegen wurde wesentlich breiter aufgestellt um sämtliche, aufwändige Prozesse mit hoher Effizienz parallel abzuwickeln. Den Nutzern entstehen so große Effizienzgewinne.“ 

Abb. 2: Pure Storage FlashBlade (Bildquelle: Pure Storage)