Neuen Speicherarchitektur-Design im Petabyte-Filebereich aus der IBM Forschung

New Orleans, Starnberg, 19. Nov. 2010 - Auf der (US-)Supercomputing 2010 - Konferenz hat IBM mehr Details zum neuen Speicherarchitektur-Design aus der IBM Forschung vorgestellt, das sehr große Datenmengen doppelt so schnell wie bisher analysieren kann...

Zielapplikationen sind Cloud-Computing-Anwendungen und rechenintensive Workloads wie Digital Media, Finanzanalytik oder Data Mining. Anwender können durch die neue Architektur  Berechnungszeiten bei komplexen Compute-Jobs einsparen, ohne daß hierfür extrem große Infrastruktur-Investitionen getätigt werden müssen.

Analytik-Apps über extrem große Datenbestände laufen zu lassen, wird für wettbewerbsintensive Unternehmen wichtiger, d.h. gefordert sind flexibel skalierbare Lösungen, um die Herausforderungen im Datenwachstum, bei steigendem Flexibilitätsbedarf von Workloads und im schnellem Bereitstellen von Systemressourcen für die unterschiedlichen Workloads dieser Anwendungen zu bewältigen.

Die neue IBM General Parallel File System, GPFS-SNC (“Shared Nothing Cluster"-Architektur) wurde entwickelt, um hohe Verfügbarkeiten durch neue Clustering-Technologien, dynamisches File-System-Management und effiziente Datenreplizierungsverfahren zu bieten. Mit "Shared Nothing-Clustern" läßt sich nach Herstellerangaben ein deutliches Mehr an Verfügbarkeit, Leistung und Skalierbarkeit erzielen (GPFS-SNC ist eine verteilte Computing-Architektur, in der jeder Knoten "autark" ist; Aufgaben werden zwischen diesen unabhängigen Systemen verteilt und kein Knoten muß auf den anderen warten).

Die existierende IBM GPFS-Technologie ist bereits ein Kernbestandteil von IBM’s HPC-Systemen, dem IBM Information Archive, IBM Scale-Out NAS (SONAS) und der IBM Smart Business Compute Cloud. Weiterentwicklungen wie GPFS-SNC erlauben eine weitere Ausdehnung des Portfolios auf künftige, sehr große Herausforderungen im Datenbereich. Beispielsweise setzen Finanzinstitute komplexe Algorithmen zur Risikoanalyse ein. Sie stützen sich dabei auf die Auswertung von Datenbeständen in Petabyte-Bereich.
Die Files sind hier jedoch typischerweise über mehrere IT-Plattformen und verschiedene Speichersystem rund um die Welt verteilt und erfordern deshalb signifikante IT-Ressourcen (Kosten, Zeit, Manpower...). Mit Hilfe des neuen GPFS-SNC-Designs läßt sich ein gemeinsames Dateisystem mit einem gemeinsamen (globalen) Namespace über verschiedene Plattformen bereitstellt. Damit kann der Verarbeitungsprozess vereinfacht und der Speicherbedarf weiter reduziert werden.

Weitere Informationen über die IBM Forschung finden Sie unter 

http://www.ibm.com/research