Supermicro bietet neues Hochleistungs-Plug-and-Play SuperCluster für NVIDIA Omniverse

München, Starnberg, 05. Aug. 2024 - Rack-Lösung mit bis zu 256 modernster NVIDIA PCIe-GPUs pro skalierbarer Einheit; maximale Leistung für 3D- und KI-Workloads…

Zur Ankündigung: Supermicro, Inc. - Anbieter von IT-Komplettlösungen für KI, Cloud, Storage und 5G/Edge, - kündigt eine Ergänzung seines SuperCluster-Portfolios von Plug-and-Play-KI-Infrastrukturlösungen für die NVIDIA Omniverse™-Plattform an. Dieser neue SuperCluster ist mit den neuesten Supermicro NVIDIA OVX™ Systemen ausgestattet und soll Unternehmen eine einfache Skalierung bei steigenden Workloads bieten. (1) Der SuperCluster für NVIDIA Omniverse erweitert das Angebot von Supermicro im Bereich der anwendungsoptimierten KI-Rack-Lösungen.

 

Die Anwendungsfälle für die neue Plattform können vom Produktdesign bis hin zu industriellen digitalen Zwillingen reichen. Generative KI hat die bestehenden 3D-Workflows erweitert und eine neue Ära von Anwendungen eingeleitet. SuperCluster für NVIDIA Omniverse vereinfacht die Bereitstellung einer Scale-out-Infrastruktur für die Multi-Workload-Anforderungen von 3D und KI. Supermicro NVIDIA OVX-Systeme legen hierfür das Fundament für die Rechenleistung des Clusters.

 

Hier die Zusammenfassung der Neuerungen (Quelle / Supermicro):

"Jeder Systemknoten hostet bis zu 8 der neuesten NVIDIA PCIe-GPUs, die eine Kombination aus maximaler 3D-Performance und generativer KI-Performance über Tensor Cores und Transformer Engine-Unterstützung liefern. Die Systeme werden von vier 2700-Watt-Netzteilen der Titanium-Stufe versorgt, die in einem Gehäuse mit hoher Luftzirkulation betrieben werden, um die Stabilität in Szenarien mit hoher Auslastung zu gewährleisten. Bis zu vier BlueField®-3 SuperNICs oder vier NVIDIA ConnectX®-7 NICs pro System bieten eine Netzwerkgeschwindigkeit von 400 Gbit/s.

 

Die 4HE PCIe GPU-Systeme von Supermicro sind laut Anbieter vollständig NVIDIA-zertifiziert für NVIDIA Omniverse und durchlaufen einen rigorosen Validierungsprozess, der Leistung, Zuverlässigkeit, Skalierbarkeit und Sicherheit prüft. Unternehmen können die Leistung über die verschiedenen Workloads der NVIDIA Omniverse-Entwicklungsplattform maximieren, einschließlich des weltumspannenden OpenUSD-Ökosystems und generativer KI-Technologien über Omniverse Cloud APIs.

 

SuperCluster für NVIDIA Omniverse ist eine miteinander verbundene Infrastrukturlösung, die Zugriff auf GPU-Computing der höchsten Leistungsebene bietet, mit nahtlosem Zugriff auf virtuelle GPUs oder Bare-Metal-Zugriff auf komplette Systemknoten. Über die 400-Gbit/s-Hochleistungsnetzwerkstruktur, die NVIDIA Spectrum™-X Ethernet unterstützt, können Unternehmen, die benutzerdefinierte große Sprachmodelle entwickeln, auf einen kombinierten Pool von GPU-Speicher über Systemknoten hinweg zugreifen, um das Training großer KI-Modelle zu ermöglichen.

 

(1) Bildquelle: Supermicro.

Die validierten Rack-Lösungen von Supermicro reichen von 4 GPUs bis zu einer 256 GPU Scalable Unit, die weiter vervielfacht werden kann, um die Anforderungen von Unternehmen jeder Größe zu erfüllen. Kunden sollen validierte Plug-and-Play-Racks erhalten, die auf L12-Niveau getestet und vom ersten Tag an einsatzbereit sind.

 

Supermicro SuperCluster für NVIDIA Omniverse sollen je nach den Anforderungen des Kunden aus einer Bandbreite von Größen und Optionen zusammengestellt werden können. Die Systemknoten sind entweder mit 4 oder mit 8 GPUs pro System ausgestattet. Die Bereitstellung kann von einem einzelnen Rack mit 4 Systemen bis hin zu einer skalierbaren Einheit mit 32 Systemen in 5 Racks erfolgen. Umfangreichere Bereitstellungen können über skalierbare Einheiten weiter vergrößert werden, um Cluster von praktisch jeder Größe zu konfigurieren. Ein SuperCluster für die NVIDIA Omniverse Scalable Unit enthält:

 

  • 32 Supermicro SYS-421GE-TNRT (Dual-Root) oder SYS-421GE-TNRT3 (Direct-Connect) PCIe GPU-Systemknoten
  • 256 oder 128 NVIDIA L40S-GPUs
  • 3 Supermicro SYS-121H-TNR Hyper-Systemsteuerungsknoten
  • 3 400G NVIDIA Spectrum™ SN5600 Ethernet Compute Fabric Switches mit 64 Anschlüssen
  • 2 400G NVIDIA Spectrum SN5600 Ethernet-Speicher-/Steuerungs-Fabric-Switches mit 64 Anschlüssen
  • 2 NVIDIA Spectrum SN2201 Ethernet-Management-Switch mit 1G und 48 Anschlüssen
  • NN NVIDIA BlueField-3 SuperNICs oder NVIDIA ConnectX-7 NICs
  • 5 Racks: 48HE 750 mm x 1200 mm.

 
Das Angebot kann für kleine Bereitstellungen auch mit nur einem Rack konfiguriert werden. Die Einzelrack-Konfiguration enthält:

  • 4 Supermicro SYS-421GE-TNRT oder SYS-421GE-TNRT3 PCIe GPU-Systemknoten
  • 16 oder 8 NVIDIA L40S-GPUs
  • 2 Supermicro SYS-121H-TNR Hyper-Systemsteuerungsknoten
  • 1 400G NVIDIA Spectrum SN5600 Ethernet Compute Fabric Switches mit 64 Anschlüssen.“
  • 1 400G NVIDIA Spectrum SN5600 Ethernet-Speicher-/Steuerungs-Fabric-Switches mit 64 Anschlüssen
  • 1 NVIDIA Spectrum SN2201 Ethernet-Management-Switch mit 1G und 48 Anschlüssen
  • NN NVIDIA BlueField-3 SuperNICs oder NVIDIA ConnectX-7 NICs
  • 1 Rack: 48HE 750 mm x 1200 mm“.

 

Querverweis:

Unser Beitrag > Northern Data Group erwirbt NVIDIA H200-GPUs

Unser Beitrag > Autonomes Fahren mit KI: Sieg für KI-Racer der TUM auf Formel 1-Strecke in Abu Dhabi