Energieeffiziente Datenspeicherung im Rechenzentrum. Auf was ist zu achten?

Starnberg, 07. März 2023 - Künftig nur mehr FLAPE (Flash und Tape)? Wo positioniert sich die Festplatte? Einige Aspekte zu Randbedingungen und Einsatzsszenarien...

Zum Hintergrund: Unternehmen stehen inzwischen vor der Herausforderung, ihre Rechenzentren nicht nur kostengünstiger, sondern auch nachhaltiger zu gestalten, ohne jedoch Abstriche bei der Leistung und Verfügbarkeit ihrer Dienste zu machen. Energieeffizienz heißt denn heute auch das Zauberwort, dem sich immer mehr Anbieter und Anwender verpflichtet sehen. Die Server-Hardware verbraucht aktuell mit 40% immer noch den Hauptteil der Energie im Datacenter, während die Unternehmensspeicher (ohne Kühlung) bei rund 18% Verbrauch angesiedelt sind (Quelle: Emerging Technologies, Enterprise Storage / Gartner 2021). Auf Grund des starken Datenwachstums - vorwiegend im unstrukturierten Bereich - stehen jedoch weltweit gesehen die Speichersysteme auch für einen immer größer werdenden Anteil am gesamt verfügbaren Stromverbrauch.

 

Leistungsverbrauch (W)

Auch wenn in Rechenzentren der prozentuale Anteil an Flash Storage langsam aber kontinuierlich wächst, entfallen derzeit noch über 80 Prozent aller Speicherkapazitäten auf HDDs (Quelle: IDC / Share WW Byte Shipments into the Enterprise). Der Leistungsverbrauch eines Standard-Festplattenlaufwerks mit 18 TB Kapazität liegt aktuell zwischen 4.2 Watt bis 5.0 Watt (idle), also 0,2 bis 0,3 W pro TB. Die Kapazitätsleistungseffizienz  oder Speicherleistung pro Watt ist auf Grund der Stromkosten eine relevante Kennzahl zur Senkung der Gesamtbetriebskosten (TCO). Die Zahl bedeutet auch, dass man für die verbrauchte Energie mehr oder weniger I/O-Performance erhält. Bei einer heutigen Festplatte also z.B. rund 350- 400 IOPS pro Laufwerk.

 

Performance (IOPS)

Flash Drives liegen schon seit Längerem bei rund 6 W/Drive, jedoch ist der Energieverbrauch pro Terabyte (TB) bei HD-Architekturen niedriger (ca. 1 W/TB); NAND Flash ist bei höheren Kapazitäten bzw. Packungsdichten also energieeffizienter im Betrieb. Zudem erzielen Hochleistungs-NVMe-Laufwerke eine Leistung 80.000-90.000 IOPS/Watt bei 4K Random Reads, mit Latenzzeiten zwischen 70μs - 10μs bei 1.5 Mio. IOPS pro Drive. NAND-Flash ist der Festplatte in Bezug auf die Parameter wie I/O-Leistung, robuster Betrieb, Ausfallsicherheit und Energieeffizienz klar überlegen.

 

Abb.: NAND Flash Density Growth, Trend (Quelle: IBM Storage).

 

Kapazitäten (TB, PB)

Neben HDDs und QLC Flash (künftig PLC-NAND) mit hochkapazitativen SSDs für schnellen File- & Objektspeicher, rückt Tape Storage als stromloses Medium für große Archiv-Umgebungen von kalten Daten wieder stärker in den Mittelpunkt (noch kann die DNA-Speicherung als eine künftige Alternative diese Rolle ja nicht übernehmen...). Neue Entwicklungen bei der Haltbarkeit sowie Kapazität von Medien spielen für die CO2-Reduktion neben den niedrigen Speicherkosten jedenfalls eine zentrale Rolle. Daneben sind Software-Verwaltungswerkzeuge für File- und S3 Objektdatenformate (scale-out file- und object storage) ein Schlüssel zum energieeffizienten Umgang mit großen, sowie inaktiven Datenmengen (cold data).

 

TAPE vs. HDD

LTO-Tapes in Form von vollautomatisierten Robotik-Bandbibliotheken verbrauchen gegenüber HDDs bekanntlich nur dann Energie, wenn sie online sind, also wenn Daten darauf geschrieben oder für bestimmte Zwecke abgerufen werden. Bei bis zu 40c/kWh in Deutschland ist das ein Kriterium und es sieht auch nicht so aus als würden die Strompreise in nächster Zeit sinken. Durch die Migration von kalten und wenig aktiven Daten auf Band können Unternehmen im Vergleich zu Festplattenlaufwerken ihre CO2-Emissionen erheblich reduzieren (Faktor 5-6). Tape-Medien sind zudem zwischen 10 und 20 Jahren einsetzbar, je nach Nutzungsintensität;

Festplattenlaufwerke dagegen werden meistens nach spätestens fünf Jahren ausgetauscht. Ein typischer Aktualisierungszyklus für Bandspeichersysteme beträgt 10-15 Jahre, was auch aus Nachhaltigkeitsgründen für die Technologie spricht. Die Tape-Medien-Haltbarkeit selbst wird mit bis zu 50 Jahren spezifiziert (siehe auch: lto.org/tco-calculator > Link > https://www.lto.org/).

 

Abb: TCO, Energy and Carbon Emissions Reduced With Tape (Bildquelle: Brad Johns Consulting, LLC, July 2021 “Improving Information Technology Sustainability with Modern Tape Storage”). Tape Storage Council Market Outlook 2022.

 

Flashspeicher (NAND)

Flash bietet sich als energieeffizientes Medium (falls nicht überwiegend darauf geschrieben wird) mit QLC (PLC benötigt noch Zeit) für Workloads im Bereich von File- und Object auch bei „warmen“ Daten an (laut IDC rund 30% aller Daten). Ein Punkt aus TCO-Sicht betrifft die möglichst gemeinsame Verwaltung von File- und Objektdaten und den optimierten Zugriff darauf, sei es für den Datenschutz (Backup), Analytics-Zwecke (KI, ML, Big Data) oder auch eine weitergehende regelkonforme Archivierung. Die technologische Herausforderung eines integrativen (software-definierten) Ansatzes von File mit Object besteht darin, jeweils unterschiedliche User- und Applikationsanforderungen über verschiedenen Protokolle (file-, block-, s3 object) und Schnittstellen (NFS, SMB) als integrierte Lösung skalierbar und zu vertretbaren Kosten (TCO) abzubilden.

Insbesondere für cold data und weniger aktive Objektspeicherdaten (ca. 60% aller Daten sind laut IDC inaktiv, d.h. auf sie wird kaum mehr zugegriffen) ist Flash aus Kapazitäts- und Kostengründen für große Datenmengen im Petabyte-Bereich derzeit die Ausnahme. Festplatten mit 20+ TB und speziell bei großen Backup-/Archivumgebungen natürlich Tape-Libraries mit 4-8 $/TB pro LTO-9 Medium (compressed-/unkomprimiert) oder auch zum Beispiel 35$ pro TB p.a. für eine BaaS-Lösung auf Basis von LTO-Tapestorage sind hier im Vorteil.

 

Festplatten (HDDs)

In der Theorie scheint die Entscheidung zwischen HDD und SSD klar zu sein: SSDs weisen eine höhere Performance und Energieeffizienz auf und sind reinen Festplattensystemen überlegen. In der Praxis und bei den meisten Anwendungen kommt es jedoch auf ein möglichst optimales Gleichgewicht aus Gesamtkapazität, Performance und Kosten an. Die genannten Vorteile einer SSD-Umgebung sind zum Beispiel bei dauerhaft vielen Schreiboperationen weniger gravierend. Hier fallen die Vorteile oft nur sehr gering aus oder können sogar negativ werden. SSDs verbrauchen im Gegensatz zu Read-Operationen mehr Strom, falls überwiegend auf sie geschrieben wird. Ferner gilt es Faktoren wie ein beschleunigtes NAND wear-out (Zuverlässigkeit) für den Subsystem-Anbieter zu berücksichtigen.

Parameter wie Filegrößen haben ebenso einen Einfluss auf die E/A-Durchsatzleistung (X-rate). Kleine Dateien sind ideal für eine SSD, sehr große Files je nach Anwendungsprofil weniger. Ähnliches gilt für die Blockgröße und Random I/O-Workloads: bei kleinen Blockgrößen zwischen 4kB und 32kB und viel Lesen wird die SDD ihre Vorteile ausspielen; ab vorwiegend 64kB-, 256kB- und 2MB-Blöcken in einem gemischten Verhältnis können HDD-Systeme jedoch bislang durchaus noch mit SSD-Laufwerken konkurrieren. Auch in Bezug auf den Energieverbrauch sind die Unterschiede dann nicht mehr deutlich.

 

In Bezug auf die Gesamtbetriebskosten (TCO) und die Speichereffizienz spielen wie gesehen derzeit verschiedene Faktoren eine Rolle. Darunter sind auch Tools zur Datenklassifizierung, Migration und Datenreduktion wie Deduplizierung, Kompression, Thin Provisioning und Erasure Coding (anstelle RAID) zu nennen, und natürlich das richtige Verständnis der jeweiligen I/O-Workload-Profile. Optimal kombiniert und eingesetzt, können über das Jahr gerechnet daraus Stromkosteneinsparungen pro KWh pro Anwendung und Speicher resultieren.

 

Querverweise:

Areal Density Chart - INSIC, Information Storage Industry Consortium > https://insic.org/areal-density-chart/

Unser Beitrag  > Toshiba Roadmap im Bereich von Nearline-HDD-Kapazitäten für Rechenzentren

Unser Beitrag  > Western Digital stellt erste 22 TB CMR- und 26 TB Ultra SMR-Festplatten für die Cloud vor

Unser Beitrag  > Nachhaltigkeit im Rechenzentrum oder wie "grün“ ist Tape?