Blogpost Teil 3: Einsatzkriterien und Leistungsmerkmale von Objekt Storage - Kritische Beschaffungsmerkmale

Starnberg, 30. Juni 2020 - Wichtige Randbedingungen und Leistungsmerkmale, auf die Anwender bei der Evaluierung von Objektspeicherlösungen besonders achten sollten...

Um was es hier geht: Nach Teil 2 meines Blogposts zum Thema „Einsatzkriterien und Leistungmerkmale von Objekt Storage“ - Warum verwendet Object Storage beim Datenschutz Erasure Coding und/oder RAIN und nicht RAID - möchte ich im dritten und letzten Teil dieser Blogpost-Serie auf einige kritische Beschaffungsmerkmale hinweisen, die Anwender bei der Evaluierung von Objektspeicherlösungen beachten sollten. Katalysatoren für den Einsatz von Objekt-Speichersystemen sind zur Zeit verstärkte Investitionen in hybride Cloud - Speicherkapazitäten, um Flexibilität, Kostenvorteile über pay as you use sowie skalierbare Leistung von Cloud Services zu nutzen. Auch das Interesse von Entwicklern an neuen Anwendungen im Zuge der Digitalisierung nimmt zu. Die Teams sind, getrieben durch das Business, zunehmend auf der Suche nach agilen IT-Infrastrukturen, die sich auf die Public Cloud über hybride Deployments ausdehnen lassen.

1. Unternehmen benötigen weiterhin Dateiprotokolle wie NFS und SMB - Die Unterstützung hierzu variiert von keinerlei support bis hin zu nativen, plattform-integrierten Funktionen. Falls über ein Gateway implementiert wird - im Vergleich zu einem nativen Protokoll ohne Single-Point-of-Failure - stellt das einen potentiellen Ausfallpunkt dar und ist mit Mehrkosten verbunden (Capex, Opex). Traditionelle Dateisysteme mit NFS und CIFS können hier eine entscheidende Rolle spielen, um Objektstorage zu nutzen ohne Anwendungen zu modifizieren, die im Zusammenhang mit CIFS- oder NFS-Zugriffen entwickelt wurden. Clustered scale-out Filesysteme in Verbindung mit einem objektbasierten Speichersystem können Object-Storage zudem dabei unterstützen, Daten auf die eine nicht-native Anwendung zugreifen muss, schneller zugreifbar zu machen.

2. Hybride Cloud-Speicherfunktionen, die als Brücke zwischen firmeninternen (on-premise) und öffentlichen Cloud-Umgebungen fungieren. Hier bestehen teils deutliche Unterschiede zwischen den verschiedenen Anbieterlösungen.

3. Robuste Metadaten-Implementierung - eine der zentralen Komponenten, die in einem verteilten System entsprechend performant und sicher skalieren muss.

4. Weitere Beschaffungskriterien für eine Enterprise Object Storage Architektur betreffen:

  • Hohe horizontale Skalierung (Hunderte PBs und Knoten, Milliarden Objekte, Proxy, Balancer usw.)
  • Preisgünstige Speicherkosten aufgrund von x86 Infrastruktur mit hochkapazitativen Laufwerken
  • Synchrone und asynchrone Replikation über dediziertes VLAN
  • Speicherung über Geo-Infrastrukturen hinweg bis auf Namespaceebene
  • Selbst-optimierendes (self-healing) System mit Encryption, Deduplizierung und
  • Compression auf Namespaceebene
  • Integrierte HSM Funktionalität (NFS, S3, LTFS/Tape)
  • Optional als virtuelles System verfügbar
  • VLAN und IPv6 Unterstützung.

5. Kritische Punkte, die aus Praxissicht bei der Implementierung von Object Storage beachten werden sollten: 

  • Objektspeicher verlangt nach Spezialisten im Web-Umfeld, die speicherspezifische Thematiken hinreichend verstehen, also z.B. DNS, HTTP, Squid, Loadbalancer, Cacheengines, Webserver und HTTP-Transaktionen
  • Komplexe Multi-Layerarchitekturen machen eine mögliche Fehleranalyse schwierig
  • Sicherheitsaspekte sind extrem wichtig, also das Wissen um Intrusion-Detection, Zertifikatsmanagement, WAF‘s, HIDS’s etc. unabdingbar.
  • S3 Implementierungen. Achtung: AmazonS3 ist kein offengelegtes Format, nur kann es jeder im Prinzip implementieren. Zu beachten ist, das manche Anwendungen nur mit spezifischen Erweiterungen robust und fehlerfrei arbeiten (Beispiel Hadoop)
  • SWIFT basiert auf der jeweiligen OpenStack Implementierung –manche Java Libraries benötigen hierzu spezielle SWIFT Implementierungen
  • HTTP ist nicht HTTP... URL-Hiding, HTTP Traversals etc. sind Funktionen die manche Lösungen nicht oder nur teilweise unterstützen.
  • Der Archivspeicher muss mit dem jeweiligen Objektstorage kompatibel sein –teilweise sind Zertifizierungen erforderlich.

Fazit: IT-Teams und Verantwortliche, die hoch skalierbare, nach Möglichkeit selbstheilende und kostenoptimierte Speicherplattformen für große Mengen an unstrukturierten Daten benötigen, sollten sich Objekt-Speicherplattformen in jeden Fall genauer ansehen. Um die geeigneten Produkte für ihre Anwendungsfälle zu identifizieren, ist es allerdings unabdingbar, seine Anforderungen an die Systeme vorher genau zu kennen. Dies betrifft natürlich besonders die Anwendungsseite.


Querverweise: