NVIDIAs Flaggschiff-GPU GeForce RTX 5090 wird Berichten zufolge über einen massiven und monolithischen GB202-„Blackwell“-Chip verfügen Kopite7kimi.
NVIDIAs Flaggschiff GeForce RTX 5090 soll mit einem monolithischen GB202-„Blackwell“-Chip ausgestattet sein, aber es könnte eine Wendung geben
Nach allem, was wir bisher wissen, wird die NVIDIA GB202 „Blackwell“-GPU die Flaggschiff-Grafikkarte GeForce RTX 5090 antreiben. Vorläufige Spezifikationen haben bis zu 192 SMs ergeben, die bis zu 24.567 CUDA-Kerne ergeben, wenn der Chip das 128-Kerne-pro-SM-Design der AD102 „Ada“-Chips beibehält. Aus einem neuen Tweet des Insiders Kopite7kimi geht nun hervor, dass die GPU ein monolithisches Design verwenden wird.
physisch monolithisch
— kopite7kimi (@kopite7kimi) 23. Mai 2024
Während NVIDIA für seine HPC/AI-Chips wie B100 und B200 auf ein Chiplet-Design umgestiegen ist, scheint das Unternehmen bei seinen verbraucherorientierten GPU-Chips weiterhin monolithische Gehäuse beizubehalten. Es heißt, dass die GB202 „Blackwell“-GPU physisch monolithisch aufgebaut sein wird, und aus früheren Berichten wissen wir, dass sie voraussichtlich die doppelte Anzahl an SMs und Kernen aufweisen wird wie GB203, was ein abgespeckterer Chip für die GeForce RTX 5080 ist. Das wird einen großen Leistungsunterschied zwischen den beiden Karten bedeuten, aber die RTX 5090 entwickelt sich zu einem echten Biest.
Wir werden uns in Kürze näher mit der NVIDIA GeForce RTX 5090 befassen, aber vorher wollen wir noch etwas mehr über die GB202 „Blackwell“-GPU selbst sprechen. Es sieht also so aus, als hätten wir es mit einem monolithischen Design zu tun, aber wir können auch die Möglichkeit eines Chiplet-ähnlichen Designs unter der Haube nicht ausschließen.
NVIDIA könnte im Wesentlichen zwei GB203-Chips auf einem monolithischen Gehäuse unterbringen, ohne dass es wie ein Chiplet-Design aussieht. Dies würde eine bessere Kommunikation zwischen den Chips ermöglichen, anstatt die mit ordnungsgemäßen Chiplet-Implementierungen verbundenen Kommunikationsengpässe außerhalb der Chips. NVIDIA hat zwar Lösungen zur Überwindung der Engpässe wie NVLINK und andere Verbindungen, diese könnten jedoch etwas teuer werden, da sie die Komplexität der GPU erhöhen.
Vor vier Jahren haben wir GA100 in zwei Hälften geteilt, die über eine Verbindung kommunizieren. Das war ein großer Schritt – und doch hat es dank der großartigen Arbeit von CUDA und dem GPU-Team kaum jemand bemerkt.
Heute trägt diese Arbeit mit der Markteinführung von Blackwell Früchte. Zwei Chips. Eine fantastische GPU. https://t.co/XuaUQPskkM pic.twitter.com/svRKhwPYEn
— Bryan Catanzaro (@ctnzr) 18. März 2024
NVIDIA hat jedoch bereits eine Lösung auf dem Markt, und zwar in Form des GA100 und GH100. Dabei handelt es sich im Wesentlichen um zwei Hälften eines kleineren Chips, die über eine Verbindung verbunden sind und über einen geteilten L2-Cache kommunizieren. NVIDIAs Bryan Catanzaro erklärte, dass diese Implementierung die Skalierbarkeit verbessert und dass der anfängliche Übergang zu diesem Design reibungslos verlief. Der Chip soll außerdem auf dem TSMC 4NP-Prozessknoten (5 nm) basieren, der die Dichte um 30 % (Transistor) verbessert, sodass neben der Architekturverbesserung auch eine nette Verbesserung zu erwarten ist.
Nun wird NVIDIA das Gleiche wahrscheinlich auch im Gaming-Bereich tun, was bedeutet, dass wir, wenn sich das Ganze auszahlt, in Zukunft mit einem Chiplet-Angebot im B100/B200-Stil rechnen können.
Zurück zur NVIDIA GeForce RTX 5090: Es gibt mittlerweile mehrere Berichte, dass wir beim Flaggschiff der nächsten Generation möglicherweise eine 512-Bit-Schnittstelle bekommen, und es gibt bereits Informationen zu einer brandneuen Kühl- und PCB-Lösung, die für dieses Kartenmonster in Arbeit ist.
In Anbetracht der Gerüchte, dass AMD sich mit seiner RDNA 4-Reihe aus dem Ultra-High-End-Grafikleistungssegment zurückzieht, sieht es so aus, als könnte NVIDIA seine Führung im Gaming-Segment mit Blackwell-GPUs weiter ausbauen, sobald diese auf den Markt kommen. Die NVIDIA GeForce RTX 5090 wird voraussichtlich einige Wochen nach der RTX 5080 auf den Markt kommen, die Gerüchten zufolge die erste Blackwell-Gaming-GPU in den Regalen sein soll.
NVIDIA Blackwell „GB202“-GPU-Spezifikationen „vorläufig“:
GPU-Name | GB202 | AD102 |
---|---|---|
GPC | 12 (pro GPU)? | 12 (pro GPU) |
TPC | 8 (laut GPC)? | 6 (laut GPC) |
SM | 2 (pro TPC)? | 2 (Pro TPC) |
SMs insgesamt | 192? | 144 |
Unterkern | Wird noch bekannt gegeben | 4 (pro SM) |
FP32 | 128 (pro SM)? | 128 (pro SM) |
FP32+INT32 | Wird noch bekannt gegeben | 128 (pro SM) |
CUDA-Kerne | 24.567? | 18.432 |
Warps | Wird noch bekannt gegeben | 64 (pro SM) |
Themen | Wird noch bekannt gegeben | 2048 (pro SM) |
L1-Cache | Wird noch bekannt gegeben | 192 KB (pro SM) |
L2-Cache | Wird noch bekannt gegeben | 96 MB (pro GPU) |
ROPs | Wird noch bekannt gegeben | 32 (laut GPC) |
Speicherstandard | GDDR7 | GDDR6X |
Maximaler Speicherbus | 512 Bit | 384 Bit |
Maximale Speicherbeschränkung | 48 GB? | 24 GB |