EMC DSSD D5 - Flash Performance Overkill oder Storage-Zukunft ?

München, Starnberg, 3. März 2016 - PCIe NVMe Low-Latency application-aware Flash-Storage für datenintensive Anwendungen; EMC VMAX als All-Flash-Array angekündigt...

Zum Hintergrund: moderne, nicht für klassisches Client-/Server-Computing und Festplatten(-restriktionen) hin entwickelte Hochleistungs-Anwendungen benötigen leistungsoptimierte Storageoptionen... Wenn man die Daten nun möglichst nahe beim CPU-Kernel placiert, lässt sich der Zugriff darauf extrem verkürzen und Latenzen von bislang Millisekunden (HDD, Flash) sogar auf Nanosekunden reduzieren; zudem können pro Zeiteinheit viel mehr Informationen verarbeitet werden (big data, simulationen). Die Applikation spricht also idealerweise direkt mit dem Speicher...

Soviel zur Theorie und hinlänglich bekannt. Jedoch liegen die Problem in der Praxis dann bei der Anwendungs-Programmierung selbst, den Kosten (DRAM-Pricing, Lizenzkosten), der Skalierbarkeit (Kapazität, Durchsatz, PCIe Konfig.) oder auch Verfügbarkeitsapekten (Serverausfälle etc.). Bei gängigen Verfahren wie über PCIe angeschlossene Flash Cards wirken sich insbesondere die mangelnde Verfügbarkeit sowie Schwierigkeiten bei der Skalierung, Erweiterung und übergreifenden Nutzung negativ aus. In der Praxis bildet jede PCIe-Flash-Karte somit eine individuell verwaltete und nicht-redundante Storage-Insel. In-Memory-Computing adressiert diese Anforderungen für spezifische Anwendungen, ist aber natürlich kein shared-Storage Konzept, das sich analog zu einem schnellen Flash Array auf ein breiteres Anwendungsfeld kosteneffizient übertragen lässt. Traditionelle Shared Flash Storage Arrays (Storage SANs) wiederum sehen sich bei extrem latenz-empfindliche Applikationen mit vielen potentiellen Engpässe im gesamten I/O-Stack von der NAND-Zelle bis zum HBA und Server-/Anwendung konfrontiert, um Performanceseitig alle Halbleiterstorage-Vorteile verlustfrei ausspielen zu können.

  • Application-aware Storage ist eine Antwort, bislang für low-latency mit Hilfe von Server-based SANs oder hyperkonvergenten Lösungen realisiert. In Verbindung mit nicht-flüchtigem NAND Storage, PCIe Flash, multi-core x86 Server-CPUs und Funktionen wie Atomic Database Writes / NVM lassen sich vor allem die Writes auf Flash massiv reduzieren-/beschleunigen. MySQL Varianten von Oracle, Pecona oder auch MariaDB unterstützen zwischenzeitlich sowohl NVM-Compression als auch Atomic writes (Flash Aware Apps). Traditionalle SAN Controller-Architekturen wurden dafür nicht entwickelt (HDD-Latency) und direct-attached-Storage besitzt andere Limitationen. Mehr zum Thema NVMe und I/O-Management finden Sie auch in diesem Blogbeitrag...

Eine hochverfügbare Kombination aus very-low Latency Flash und shared PCIe (server-class) Storage liefert nun die aktuelle Ankündigung der EMC DSSD D5 mittels eigener, hochintegrierter PCIe / NVMe NAND Dies PCIe Flash Fabric (Server-class Storage) Architektur.

A) Ankündigung EMC DSSD D5

Das Start-Up DSSD hat diese Thematik schon im Jahr 2013 mit einer neuen Entwicklung adressiert und wurde 2014 von EMC übernommen (Chairman von DSSD war zuletzt Andreas von Bechtolsheim, einer der vier Gründer von Sun Microsystems). Das damals von Grund auf neu entwickelte System mit ZFS-Wurzeln - jetzt als EMC DSSD D5 Produkt redesigned und im Rahmen einer Gesamtlösung gestern angekündigt - unterscheidet sich im Aufbau von anderen Flash-Array-Angeboten durch folgende Merkmale:

  • High-Performance-Flash-Speicher (3-D Intel-/Micron) wird hochverfügbar mit extrem niedriger Latenz in dicht gepackter Form (keine einzelnen SATA-/SAS SSD-Drives, sondern 18.000 NAND Dies) für bis zu 48 Server als PCIe / NVMe Storagepool bereitgestellt.
  • DSSD D5 ist via PCIe Gen3 und die treiberlose Technologie NVMe (Non-Volatile Memory Express) mit jedem Speicherknoten verbunden (interne PCIe switched fabric) – womit die hohe Performance des PCIe-verbundenen NAND-Storage erreicht wird (intern gibt EMC Latenzzeiten von 200ns in der Fabric an).
  • Im Gegensatz zu einer normalen PCIe-Flash Lösung im Hostsystem ist DSSD D5 aber ein separates und von Rechnereinheiten getrenntes Stand-Alone-Storage-System, das die Vorteile einer gemeinsam nutzbaren (shared) Storagelösung bietet.

Leistungswerte der neuen Lösung (Quelle EMC):

  • All-Flash für speicherintensive Echtzeit-Anwendungen mit bis zu 10 Mio. IOPS, 65K queue depth (!), 100-Mikrosekunden-Latenz und 144 Terabyte Bruttokapazität pro fünf Rack-Unit hohes Chassis (5U), 100 Gigabit-Bandbreite
  • Deutlich verbesserte Hadoop-HBase-Leistung im Vergleich zu herkömmlichen Hadoop-Anwendungen mit Direct Attached Storage (DAS).
  • DSSD D5 soll Teil der VCE Converged Infrastructure werden

Weitere technische Details:

In das 5U Rack-Units hohe Chassis passen max. 36 Flash-Module mit 144 Terabyte Bruttokapazität (100 Terabyte Nutzkapazität). Neben einer redundanter Serveranbindung liefert die DSSD D5 Hochverfügbarkeits-Funktionen und Storage-Administrations-Funktionen. Dazu zählen: Dual-Port-Client-Cards, doppelte High-Availability-Controller, redundante Komponenten, Cubic RAID für höhere Flash-Zuverlässigkeit von 3D-Speicherzellen sowie Dynamic Wear Levelling, physische Flash-Kontrolle und Space-Time Garbage Collection.

Anwendungsszenarien:

Die optimale Leistung wird das neue System natürlich in Verbindung mit hierfür über APIs optimierten Anwendungen ausspielen können (z.B. SAP, SAS, No-SQL-Apps etc...). Das interne Betriebssystem der DSSD stellt hierzu Libraries (libflood) zur Verfügung. Die Flood API ist Object Storage based. Das System spricht Block-, Hadoop HFS und über die Flood API mit hierfür optimierten Anwendungen.

  • DSSD D5 beschleunigt jedoch auch bereits bestehende Datenbank- und Data-Warehouse-Lösungen. Gemessen an der schnellsten bislang bekannten DBMS-Lösung soll die DSSD D5 laut EMC mit einem Fünftel der Rack-Fläche dreimal niedrigere Latenzwerte und eine TCO-Einsparung von 68 Prozent erzielen können (Quelle EMC).
  • Mit DSSD D5 lassen sich verschiedene Anwendungen auf einer gemeinsamen High-Performance-Plattform konsolidieren. Stichwort: Data Warehousing. Mehrfach-Kopien und komplexe Indexierung können entfallen wie auch komplizierte Partitionierungen.
  • Im Vergleich zu einer traditionellen DAS-Infrastruktur beschleunigt DSSD D5 operative Analysen von Hadoop Workloads deutlich. Vorteil hier: Storage- und Rechenkapazitäten lassen sich unabhängig voneinander skalieren; es muss nur noch eine einzige Datenkopie auf Flash gespeichert zu werden – unabhängig davon, wie der Replikationsfaktor im Hadoop-Filesystem eingestellt wurde.

Erste Anwenderzitate von US-Test-Sites: „Bei uns laufen bereits einige der komplexesten Workloads der Welt, aber traditionelle Flashs konnten uns bisher nicht die Performance oder Bandbreite bieten, die wir gerne gehabt hätten. DSSD D5 hat unser Geschäft grundlegend verändert. Da die Lösung ohne unnötige Software, Hardware und Batch-Jobs auskommt, können wir unsere Anwendungen mit noch nie dagewesener Geschwindigkeit betreiben. Deshalb haben wir den Sprung in diese neue Flash-Generation gewagt – und wir bereuen es nicht.“ Brian Dougherty, Chief Technical Architect, CMA

Doug Babb, Chief IT Systems Architect, Systems Implementers Inc. (u.a. Vertragspartner der US Air Force und Project BonFire): „Wir waren Pionieranwender sowohl für Direct-Attached Server-Flash als auch für Hundertprozent-Flash-Storage-Area-Networks und Hyper-konvergente Flash-Appliances. Trotz dieser Vor-Erfahrungen hat uns die Leistung von DSSD D5 überrascht und die Erwartungen übertroffen. Wir sind zwar davon ausgegangen, dass die Lösung die Leistung unserer bestehenden Analytics-Plattform um das zehnfache übertreffen würde. Aber DSSD D5 hat meiner Meinung nach auch unseren Anstrengungen zur Applikationskonsolidierung einen Schub gegeben und es uns zugleich ermöglicht, unseren Footprint sowie unsere Hardware- und Lizenzkosten zu reduzieren – und uns gleichzeitig ermöglicht, Kunden einen Echtzeit-Return-on-Information sowie Echtzeit-Security bieten zu können.“

EMC Link zur Ankündigung


Unser FAZIT zur neuen DSSD D5:

Apps-aware Storage auf Basis von NVM/PCIe Fabrics ist in der Lage, den Storage - sprich die Datenverarbeitung - näher an die CPU zu rücken. Aus Betreibersicht dürfte es müßig sein darüber zu diskutieren, ob dieser Architekturansatz künftig als Server-based Storage oder Storage-based Computing vermarktet wird. Jedenfalls steht mit der Verbreitung von NVMe und PCIe im Rahmen scale-out Flash Fabrics und zukünftig weiterer Varianten von Storage Class Memory (z.B. PCM) neben leistungsfähigen FC-SAN-Fabrics (s.a. die aktuelle Ankündigung des Brocade G620 Switch) damit eine weitere skalierbare Speicher-Netzwerklösung zur Verfügung, die extrem daten-intensive Workloads im Rahmen von neuen Applikations-Designs im kompakten Formfaktor bedienen kann.

Aktuell wir DSSD wohl überwiegend als Nischenlösung für ganz spezifische und leistungshungrige Anwendungsfelder gefahren werden, da gängige C/S - Anwendungen die Performance nicht benötigen und der Preispunkt zu hoch sein dürfte. Einschränkend kann sein, dass (aus technischen Gründen) eigene PCIe-Cards (EMC-sourced) zum Einsatz kommen und das System die volle Leistungsfähigkeit natürlich erst in Verbindung mit entsprechenden Applikations-APIs ausspielen kann.

Es wird jedenfalls im Zuge der neuen Dell-EMC spannend zu sehen sein, wie sich DSSD hinsichtlich bereits vorhandener Lösungen (Scale IO, X-treme IO, VMAX Flash, Dell Flash, VCE Converged, Dell Converged  (Nutanix etc.) positioniert und letztlich von Kundenseite hier angenommen wird (Preis; Anwendungsszenarien).


Abb. 1: Bildquelle EMC DSSD D5, I/O-Stack

Abb. 2. Bildquelle EMC, DSSD D5


B) Weitere Ankündigung: EMC VMAX All Flash 450 / 850

EMC hat seine Enterprise-Storage-Plattform grundlegend überarbeitet und bietet VMAX ab sofort auch als All-Flash-Array-Lösung an. Damit steht eine Lösung zur Verfügung, die Block- und File-Storage, Open-Systems sowie Mainframes nativ unterstützt und auf bis zu vier Petabyte skaliert. Alle EMC VMAX Data Services sollen auch mit der Flash-Lösung nutzbar sein. Darüber hinaus vereinfacht das Appliance-ähnliche Konzept der aus Hard- und Software bestehenden Paketlösung das Speichermanagement im Rechenzentrum. Zitat Reimund Willig, CTO EMC Deutschland: VMAX All Flash ist ein Quantensprung in Sachen Performance, Leistungsfähigkeit und Kosteneffizienz – doch das ist erst der Anfang der All-Flash-Zukunft von EMC“.

VMAX All Flash verbindet das Performance-Potenzial von Flash mit den wirtschaftlichen Vorteilen moderner Hochkapazitäts-SSDs – wobei neue Technologien wie Write-Folding die Lebensdauer der eingesetzten Flash-Medien verlängern hilft. Die modulare V-Brick-Architektur von VMAX All Flash erlaubt eine mehrdimensionale Skalierbarkeit von Ports und Speicherkapazität: Jeder V-Brick-Baustein enthält eine VMAX-Engine, die bei 53 Terabyte Nutzkapazität startet und in 13-Terabyte-Schritten bis auf 500 Terabyte skalierbar ist. VMAX All Flash 450 lässt sich mit maximal vier und VMAX All Flash 850 mit bis zu acht V-Brick-Bausteinen konfigurieren. Beide Modellreihen, VMAX All Flash 450 und 850, sind in den Varianten F und FX erhältlich.

Die Basisvariante (Modell F) umfasst:

  • Thin Provisioning
  • Quality of Service
  • Die eingebettete Software EMC Unisphere
  • Virtual Volumes (VVOL) sowie EMC SnapVX
  • Die Datensicherungssoftware EMC AppSync für Copy-Data-Management (CDM)

Die Modellvariante FX enthält zusätzlich:

  • Komplette EMC-SRDF-Suite als Remote-Replikationslösung
  • Controller-gesteuerte Data-at-Rest-Verschlüsselung (D@RE)
  • EMC ViPR für automatischen Einsatz, Management und Monitoring von Software-Defined-Storage entweder per Controller oder per Storage-Resource-Management (SRM)
  • EMC-CloudArray-Software als Link zwischen VMAX All Flash und Cloud-Speicherdiensten für nicht-kritische Daten
  • EMC eNAS zur Unterstützung von File-Storage
  • Die neue Software EMC Unisphere 360 für ein vereinfachtes, konsolidiertes Speichermanagement von bis zu 200 VMAX-Arrays in einem Rechenzentrum
  • Für eine direkte Datensicherung auf EMC Data Domain können Anwender die Software EMC ProtectPoint mit jeder beliebigen Konfiguration von VMAX All Flash einsetzen –traditionelle Backup-Infrastrukturen sind dafür nicht mehr nötig (direkte Datensicherung).