Böblingen, Starnberg, 14. Okt. 2024 - Neues 5U-Servergehäuse verwendet 8-Knoten-pro-Rack, um die Dichte für 8-Wege-GPU-Systeme zu maximieren; Liquid Cooling möglich…
Zur Ankündigungsübersicht: Hewlett Packard Enterprise (HPE) hat den HPE ProLiant Compute XD685 für das Training großer, komplexer KI-Modelle angekündigt. Er unterstützt acht AMD-Instinct-Beschleuniger des Typs MI325X sowie zwei AMD-EPYC-Prozessoren der 5. Generation. Das System ist laut Anbieter mit Luftkühlung oder direkter Flüssigkeitskühlung verfügbar. Es soll sich beispielsweise für das Training großer Sprachmodelle oder multimodaler Modelle eignen; die Zielgruppe sind KI-Dienstanbieter, Modell-Entwickler sowie große Unternehmen und Behörden. Der HPE ProLiant Compute XD685 kann laut Hersteller ab sofort bestellt werden und soll im ersten Quartal des Jahres 2025 verfügbar sein.
Abb.: HPE ProLiant Compute XD685 (Bildquelle: HPE).
Anmerkung: HPE hat für den XD685 ein neues modulares Gehäuse mit fünf Höheneinheiten entwickelt. Es verwendet eine kompakte Anordnung von acht Knoten pro Rack, um die Dichte für Acht-Wege-GPU-Systeme zu maximieren. Zudem soll es die Flexibilität haben, eine breite Palette von GPUs, CPUs, Komponenten, Software und Kühlmethoden zu verwenden. HPE hat gestern zudem seine erste komplett lüfterlose Architektur für direkte Flüssigkeitskühlung angekündigt. (1)
Folgende Vorteile können sich beim Einsatz der neuen Lösung erzielen lassen (Quelle / Anbieter):
1. Größte KI-Modelle mit weniger GPUs ausführen:
Die auf der AMD CDNA™ 3 Architektur basierenden AMD Instinct™ MI325X Beschleuniger bieten höchste KI-Leistung und Effizienz für Trainings- und Inferenzaufgaben. Die MI325X-Beschleuniger verfügen über HBM3E-Speicherkapazitäten mit einer Speicherbandbreite von 6 TB/s, was die Leistung optimiert und die TCO senkt.
2. Mehr Effizienz mit optionaler direkter Flüssigkeitskühlung:
Kann Unternehmen helfen, die steigenden Energieanforderungen zu erfüllen, Nachhaltigkeitsziele zu erreichen und Betriebskosten zu senken.
3. Bereitstellung und den Betrieb beschleunigen:
HPE Services für das gesamte Spektrum an Services zur Installation und Bereitstellung großer KI-Cluster mit Experten-Services erstellen, integrieren, validieren, testen und Lösungen im Werk anpassen.
4. Sicherheitsbedrohungen minimieren:
HPE ProLiant Compute XD685 Systeme mit HPE iLO sicherer verwalten; zentrales Management mit integrierten Sicherheitsinnovationen.
5. Rack-Dichte optimieren:
Das von HPE neu entwickelte 5U-Servergehäuse verwendet eine 8-Knoten-pro-Rack-Anordnung, um die Rack-Dichte für 8-Wege-GPU-Systeme zu maximieren. Der HPE ProLiant Compute XD685 unterstützt acht AMD Instinct™ MI325X- oder AMD Instinct™ MI300X-Beschleuniger, zwei der neuesten AMD EPYC™ 9005 Series-Prozessoren und Luft- oder direkte Flüssigkeitskühlung.
6. Vereinfachte Verwaltung von großen KI-Clustern:
Der HPE Performance Cluster Manager ist eine integrierte Systemverwaltungssoftware. Komplexe Systeme mit automatischer Einrichtung von Bare Metal sollen damit schneller und vereinfacht betrieben werden können.
Abb.: HPE Liquid Cooling Vorteile (Bildquelle: HPE).
(1) Quelle / externer Link > https://www.hpe.com/us/en/newsroom/blog-post/2024/08/liquid-cooling-a-cool-approach-for-ai.html
Querverweis:
Unser Beitrag > GenAI für Unternehmen: HPE und NVIDIA bringen „NVIDIA AI Computing by HPE“ auf den Markt
Unser Beitrag > Einheitliches IT- und Speichermanagement: Neuerungen zu HPE Alletra und HPE GreenLake
Unser Beitrag > Beispiele wie Unternehmen die digitale Transformation umsetzen können