Die voll ausgestatteten Blackwell B200-GPUs von NVIDIA verbrauchen bis zu 1200 W, eine völlig andere Architektur als Hopper


Die Blackwell B200-GPUs von NVIDIA verfügen im Vergleich zu Hopper über eine völlig neue Architektur, verbrauchen aber auch fast doppelt so viel Strom.

NVIDIA Blackwell-GPUs haben eine Nennleistung von bis zu 1200 W, verschiedene Konfigurationen und alle eine brandneue Architektur

Als Jensen Huang, CEO von NVIDIA, Blackwell während der Keynote zur GTC 2024 ankündigte, fehlten der Enthüllung viele technische und architektonische Informationen. Aber in den nächsten Tagen der GTC teilte NVIDIA etwas mehr Details mit, ohne jedoch zu sehr darauf einzugehen technische Deep-Dives worauf wir alle warten. Die neuen Details wurden von Jonah Albe (NVIDIA SVP & GPU Architect) und Ian Buck (NVIDIA VP of Hyperscale & HPC) enthüllt.

Blackwell GPU – Entwickelt für das KI-Zeitalter mit einer brandneuen Architektur

Zunächst wussten wir alle, dass Blackwell eine große architektonische Verbesserung gegenüber Hopper darstellen würde, und es sieht so aus, als wäre es mehr als das, da Jonah angibt, dass Blackwell eine völlig andere Mikroarchitektur als Hopper verwendet.

Bildquelle: NVIDIA

Was wir über Blackwell wissen, ist, dass es die 2. Generation der Transformer Engine-Technologie enthält, die die Rechenformate FP4 und FP6 hinzufügt. Diese Formate und neue Softwareoptimierungen machen Blackwell zum schnellsten KI-Chip seiner Art auf dem Planeten, aber das hat seinen Tribut an seine Standard-FP64-Rechenleistung gefordert, die im Vergleich zum Hopper nur um 32 % gestiegen ist. Die Begründung ist schlicht und einfach: Blackwell ist in erster Linie ein KI-Chip und das ist sein Hauptzielmarkt. FP64 ist aus KI-Sicht nicht so wichtig und je tiefer man geht, desto schneller sind die Inferenz- und Trainingsfunktionen.

Der Grund für den Chiplet-Weg (MCM) ist außerdem die Notwendigkeit, die Gesamtleistung zu verbessern, und nicht die Ausbeute. Es wird interessant sein zu sehen, wie NVIDIAs erster MCM-Ansatz in der Praxis funktioniert, da es sich um zwei GPUs handelt, die auf demselben Paket laufen. Es wird erwähnt, dass CUDA bei der Handhabung der beiden GPUs und der unterschiedlichen Architektur recht gute Arbeit leistet und für Programmierer keine größeren Änderungen erforderlich sind.

Die GB200-GPU entspricht den vollständigen Blackwell-Spezifikationen, 500 W mehr Leistung als Hopper

Beim Launch herrschte besonders große Verwirrung rund um alle Blackwell-GPU- und Plattformvarianten. Jensen erklärte, dass Blackwell keine GPU, sondern eine komplette Plattform sei und die Plattform über eine Reihe von Produkten verfüge, diese jedoch immer noch auf GPUs basieren. Derzeit hat NVIDIA drei offizielle Blackwell-GPU-Varianten angekündigt.

Dazu gehören das Flaggschiff und der voll ausgestattete B200, der von den GB200-Superchip-Plattformen verwendet wird. Dieser Chip verfügt über die am höchsten bewerteten Rechenkapazitäten und hat eine maximale TDP von 1200 W. Das sind 500 Watt mehr als beim Hopper H100 mit einer TDP von 700 W. Der gesamte Superchip ist mit zwei dieser B200-GPUs und einer Grace-CPU für bis zu 2700 W Leistung ausgestattet (1200 W x 2 für B200 + 300 W CPU/IO).

Bildquelle: NVIDIA

Als nächstes kommt der Blackwell B200, der von den DGX- und HGX-Plattformen verwendet wird. Er ist auf etwa 1000 W optimiert und bietet fast 90 % der Leistung der voll ausgestatteten Variante. Es ist nicht bekannt, ob diese Variante nur eine geringere TDP hat oder im Vergleich zur Vollkonfiguration mit reduzierten Spezifikationen ausgestattet ist. Schließlich gibt es noch den Blackwell B100, eine weiter getunte Variante mit einer TDP von 700 W. Diese Variante bietet etwa 80 % Leistung des B200 (1000 W) und 70 % Leistung des B200 (1200 W).

Es besteht die Möglichkeit einer Single-Die-Blackwell-GPU-Variante, insbesondere für zukünftige PCIe-Plattformen. Die Blackwell-GPU-Architektur wird bereits in RTX- und KI-Plattformen für Verbraucher wie Drive Thor und der zukünftigen GeForce-Reihe integriert. Die Blackwell GB200-GPUs von NVIDIA werden später in diesem Jahr an die ersten großen KI-Kunden ausgeliefert, gefolgt von einem späteren Volumenanstieg.

Teilen Sie diese Geschichte

Facebook

Twitter

source-99

Leave a Reply