Blog: Leistungs-Engpässe beim Storage vermeiden und die Betriebssicherheit erhöhen

Starnberg, 29. Juni 2016 - QoS und robuster Betrieb des Storage sind so wichtig wie die I/O-Leistung...

Um was geht es: Heute gibt es IO-Leistung im Überfluss... Hersteller überschlagen sich geradezu mit Ankündigungen zu Performancewerten. Millionen von IOPS sind heute bei Flash die Regel als denn die Ausnahme. Nur: welche Anwendungen brauchen das wirklich und ist meine gesamte IT-Infrastruktur darauf (end-to-end) vorbereitet? Richtig ist: Die IT muss auf das schnelle Wachstum von virtuellen Maschinen zwar mit einem leistungsfähigen, aber auch möglichst robusten Stack aus Gründen der Betriebssicherheit reagieren. Immer besteht dabei die Gefahr, dass komplexe Infrastrukturen zudem nicht optimal mit den geschäftlichen Anforderungen zusammenspielen und schwierig zu automatisieren und zu erweitern sind.

  • Hochintegrierter Flash Storage für virtualisierte Anwendungen ist in Verbindung mit hochgradiger Automatisierung - ausgeführt als Software Defined Storage (SDS) durchaus sinnvoll. SDS entkoppelt die Data Plane von der Control-Ebene und schafft damit eine zentrale Verwaltungsinstanz, um die darunterliegende Physik zu abstrahieren (Virtualisierung). Aber ist dieser Lösungsansatz immer der richtige und reduziert er die Komplexität und damit Fehleranfälligkeit?

  • Auch hier gilt: es gibt aus meiner Sicht derzeit nicht die eine Speicherlösung für alle Anwendungsfälle bzw. Unternehmensanforderungen. Betreiber sollten möglichst genau ihre Applikationsprofile hinsichtlich Verfügbarkeit und IOPS-Leistung kennen. Erst dann ist möglich, die Vorteile moderner Speicherlösungen wie Flash, konvergente Systeme oder SDS im Kontext der Applikationsanforderungen richtig zu beschaffen, aufzusetzen und zu betreiben.

Flash Storage sollte möglichst nahtlos und hochverfügbar in die virtualisierte Infrastruktur einzubinden sein; dies gilt besonders im Zusammenhang mit der Ausfallsicherheit und Verfügbarkeit von Anwendungen bei 24 x 7 Workloads. Ein Beispiel: Wenn viele VMs gleichzeitig um die I/O- Ressourcen des Speichers konkurrieren, wird die Skalierbarkeit und damit Leistung der Speicher I/O sowie Netzwerk-Infrastruktur (X-rate / IOPS) entscheidend und nicht primär die Kapazität. Ein Manko, dass in der Vergangenheit beim Einsatz von vielen verteilten Festplatten gerne auftrat: Viele I/Os bedeuten mehr Laufwerke, die wiederum angeschlossen (HBA, Driver), verwaltet und ggf. optimiert werden müssen (OPEX). Damit leidet natürlich potentiell auch die Verfügbarkeit.

QoS ist ein weiteres Schlagwort: Wenn mit All-Flash die Applikationsdaten auf einem granular skalierbaren NAND-Speicherpool abgelegt sind, müssen Administratoren nicht ständig aktiv eingreifen und virtualisierte Applikationen überwachen. Intelligente scale-out Storage Filesysteme erlauben den Betrieb verschiedenster Anwendungen gleichzeitig, ohne das Noisy-Neighbour Problem zu ignorieren. Eine Vielzahl verschiedenster Applikationen können damit auf einer integrierten Plattform mit garantierten SLAs betrieben werden (Multi Tenant); Kapazität und Quality of Service lassen sich über die gesamte Infrastruktur individuell auf minimales, maximales oder Burst-Performance-Level festlegen. Entwicklungen im Bereich 3D-NAND (gestapelter high-density Aufbau) optimieren zudem im Controller das Wear-out der NAND-Zellen; die Haltbarkeit des Speichermediums und damit dessen Zuverlässigkeit wird erhöht.

Hybride Arrays hingegen verfügen meist über Auto-Tiering Software im Controller bzw. Server (SDS-Ansatz), um Hot-Files oder gesamte Anwendungsdaten nach Bedarf auf schnellen Flash Storage zu migrieren. Bei einem Cache-Miss (Hot Data nicht mehr im Flash) sind allerdings gerne negative Auswirkungen auf die Anwendungsleistung sichtbar; insbesondere wenn anstelle von schnellen SAS Drives aus Kostengründen SATA Laufwerke mit hoher Kapazität zum Einsatz kommen.

Flash mit Software Defined Storage (SDS)

  • Der Einsatz von Flash-Ressourcen beim Hypervisor erzeugt keine zusätzliche Latenzen wie beim Durchlaufen des I/Os im Speichernetzwerk (externes SAN). Wenn Flash in bestimmten Konfigurationen allerdings nur selten benötigt wird, ist eine Aufteilung der Flash-Ressourcen über alle beteiligten Server wahrscheinlich sinnvoller, um eine gleichmäßige Auslastung der Ressourcen zu erreichen.

  • Software Defined Storage beim Hypervisor, das den I/O-Stream zwischen VMs und den Backend-Speicher-Arrays kontrolliert und die am häufigsten zugegriffenen Daten auf den lokalen Flash-Systemen speichert, entkoppelt jedoch in jedem Fall die Speicherleistung (virtualisiert) von der Kapazität: I/O-kritische Read-/Writes werden über den lokalen Flash Cache ausgeführt (Performance- Pool), während HDD Storage Arrays (Capacity-Pool) mit kostenoptimierten SAS Drives für nicht-zugriffskritische I/O’s verwendet werden können. Nicht immer ist dann ein (noch) teurerer All-Flash-Storagepool die beste Lösung, wenngleich bei der Preisentwicklung der Trend klar in diese Richtung geht.

Fazit: Es müssen in jedem Fall auch alle anderen kritischen IT-Infrastrukturelemente in das Sizing einbezogen werden, namentlich Netzwerkkomponenten wie Switches, HBAs, Treiber und Server. Sonst verlagern wir nur einen Engpass auf eine andere Stelle und immer ist die Kette nur so stark wie das schwächste Glied (end-to-end).