Software Defined Storage (SDS) – Nur eine Definitionsfrage?

Starnberg, 11. April 2014 - Mit VMware Virtual SAN erhält der Begriff Software Defined Storage in Breite mehr Aufmerksamkeit; Zeichen für eine höhere Akzeptanz von SDS ?

Um was es hier geht: VMware beschreitet neue Wege... mit Virtual SAN vom Server direkt zum angeschlossenen Speicher und liefert mit vSAN einen in den Hypervisor hochintegrierten Software-definierte Storage Stack für Block-Storage. Die Software ist - so wie sie ist - ausschließlich für vSphere Anwender konzipiert. Auch Newcomer wie Maxta oder bekannte Anbieter wie HP sind VM-nah aktiv, aber all die Angebote in dieser Form zeigen jedenfalls aus meiner Sicht, dass SDS derzeit noch nicht in Breite (abgesehen von speziellen Anwendungen) in großen Rechenzentren gegen herkömmliche Enterprise Storage Systeme positioniert ist. Die Anforderungen an Leistung, robuste und spezifische Services wie Thin Provisoning, Deduplizierung, Performance Snaphots, Caching, End-to-End Data Integrity, Höchstverfügbarkeit etc. sind je nach Applikation doch sehr spezifisch.

Durch VMware Virtual SAN erhält der Begriff Software Defined Storage (SDS) aber zweifelsfrei im Markt und in der Breite mehr Aufmerksamkeit. Erweitert SDS damit aber auch die Leistungsgrenzen bisheriger Speichervirtualisierungs-Systeme? Die „klassische“ Speichervirtualisierung (meist Appliance-basiert) wird bislang nicht so häufig wie die Servervirtualisierung eingesetzt. SDS wird sich jedoch nach meiner Einschätzung aber deutlich schneller entwickeln... und dafür gibt es gute Gründe.

Siehe hierzu auch den Blog: „Speichervirtualisierung – worin liegt der Mehrwert“

http://www.storageconsortium.de/content/content/speichervirtualisierung-worin-liegt-der-mehrwert

Software Defined Storage und die Abgrenzung zu existierenden Lösungen:

Alle Speicheranbieter verwenden Software Intelligenz in ihren Speichersystemen, sei es als Firmware bei Dual-Controller-Konfigurationen oder hochfunktional als eigenes Storage File- und/oder Block-Betriebssystem (O/S) bei komplexeren Arrays oder n-Node Cluster Storage Implementierungen. Meist besteht die zugrunde liegende Hardware aus FPGAs, Vendor-spezifischen Chip Sets bzw. mehr und mehr Standard INTEL CPUs, auf denen entweder das herstellereigene Storage-Betriebssystem (Hardware-nah wie EMC, HDS, NetApp, IBM, HP, DELL u.a.) oder als separat erhältliche Storage Software (auf Standard-Hardware wie Intel CPUs / Windows oder Linux O/S; Storage Array-agnostisch) abläuft.

Im letzteren Fall wird dann eigentlich auf der Speicher-Array-Seite keine besondere Intelligenz mehr benötigt (JBODs) da die Storage Services wie RAID, Replikation, Thin Provisioning etc. über die Software auf einem dedizierten Storageserver im Array ausgeführt werden. Typische Vertreter dieses Ansatzes sind Lösungen von FalconStor, IBM SVC, DataCore, Red Hat Storage Server, HP Nexenta (ZFS) usw.

Schon aus Marketinggründen positionieren sich aus Herstellersicht die letztgenannten Lösungen als „Software Defined Storage“, auch wenn (mit Ausnahme von open Source Lösungen) die Präferenz gerne bei bestimmten HW-Konfigurationen – sprich hierfür optimalen Appliances liegt. Software benötigt nun mal die zugrunde liegende Hardware... das gilt eben auch für hersteller-spezifische Arrays, zumal auch diese meist in der Lage sind, auch andere Festplattensysteme über ihre Virtualisierung mit einzubinden (z.B. für Migrations-Zwecke).

Daneben sind der Vollständigkeit halber auch noch die konvergenten Infrastrukturangebote zu erwähnen, also komplett integrierte Stacks (Server, Storage, Netzwerk, Hypervisor, Verwaltungssoftware, Anwendung = RZ in a Box), die bereits eine virtualisierte Umgebung - meist optimiert für bestimmte Applikationen (VMware, Citrix, Hyper-V, Oracle DBMS, SAP HANA) - bereitstellen. Hier treffen Newcomer wie Tintri, SimpliVity oder Nutanix auf etablierte Anbieter wie VCE vBlock, FlexPod, Cisco UCS, HP, Dell oder IBM. Letztlich werden auch hier Software Defined Storage - Funktionalitäten mit angeboten.

Was unterscheidet VMware Virtual SAN von anderen SDS-Varianten?

Mit VMware Virtual SAN (Virsto Hintergrund) tritt ein „neuer“ Anbieter von „Software Defined Storage“ auf, der das Konzept von SDS aus Serversicht konsequent weiterführt. Ein anderer ist HP mit StoreVirtual VSA, während weitere Unternehmen noch der Start-Up Szene zuzurechnen sind.

Das entscheidende Kriterium lautet VM-aware und bei VMware ist es letztlich die eigene Verwaltungsplattform (VMware VSAN = Software Defined Storage für vSphere). Ähnliches gilt für Microsoft im Bereich Hyper-V. Abgesehen von diesen Plattform-spezifischen Einschränkungen (Hypervisor-Bindung) weisen diese Angebote jedoch einige interessante Leistungsmerkmale auf:

Durch die direkte Verbindung von Server mit Storage wird ein End-to-End Data Management erzielt, auf das gut der Begriff „Applikations-zentrierter Storage“ passt. Während klassische Arrays über API’s wie VASA, VAAI etc. mit VM-Konfigurationen kommunizieren, läuft die virtuelle Storage Appliance als Software im virtuellen Server oder Kernel ab; die Trennung von Server und Speicher wird aus Administrationssicht aufgehoben.

Die Vorteile dieser SDS-Implementierung liegen aus Admin-Sicht auf der Hand: das SAN-Management wird in die Virtual Machine - Verwaltung integriert und erlaubt zudem eine Mobilität von Daten genauso wie auf der Serverseite. Volumes / LUNs sind VM-aware und werden nicht mehr separat verwaltet. Damit entsteht mit SDN, SDS und VM’s ein komplett Software Definierter Infrastruktur-Stack (Software defined DataCenter). Soviel zur Theorie....

Wo liegen derzeit die Grenzen dieses konsequent virtuellen Stacks?

VMware vSAN liefert bislang nur die Aggregation von Server-Side-Storage (gemeinsamer, hochverfügbaren Speicherpool). VSAN - obwohl Kernel-Implementiert - stützt sich auf VMFS für Cloning und Snapshots. VMFS Snapshots (Erstellen, Löschen) skalieren performance-seitig weniger als Storage-Services, die auf einer hierzu optimierten Hardware Plattform ausgeführt werden. Native Kapazitätsoptimierungen wie intelligente Kompression und Deduplizierung sind nicht verfügbar. Ganz allgemein kann damit gesagt werden, dass VMware Virtual SAN bei kleineren bis mittleren Umgebungen z.B. im Windows-Serverumfeld eine alternative Storagelösung darstellt; nicht ganz dazu passt andererseit die Empfehlung, 10GBE NICs zu verwenden, die gegenüber FC keinen großen Preisvorteil bieten. Auf Grund der Skalierbarkeit (max. 8 Node Storage Cluster / Kapazität, Performance) ist vSAN derzeit nicht für sehr große und anspruchsvolle Enterprise-Storage-Umgebungen vorgesehen. 

Fazit: SDS geht Hand in Hand mit SDN - sprich verlangt flexible und leistungsfähige Netzwerke - und hat viele Facetten. Aus technologischer Sicht hängt es aber sehr stark von der Umgebung und beteiligten Anwendungsprofilen ab, welche Variante (Software- only; Appliance; Storage Subsystem) im Einzelfall zum Einsatz kommen soll. Neben wirtschaftlichen Überlegungen (CAPEX, OPEX) sind natürlich je nach Betriebsanforderung weitere Kriterien wie globale Herstellerpräsenz mit Support vor-Ort, Reaktionszeiten, Verfügbarkeitszahlen etc. entscheidend. Aber eines ist klar: der Weg zum Software Definierten Datacenter ist vorgezeichnet...