NVIDIA GeForce RTX 5090 GPU mit massivem monolithischem GB202-„Blackwell“-Chip


NVIDIAs Flaggschiff-GPU GeForce RTX 5090 wird Berichten zufolge über einen massiven und monolithischen GB202-„Blackwell“-Chip verfügen Kopite7kimi.

NVIDIAs Flaggschiff GeForce RTX 5090 soll mit einem monolithischen GB202-„Blackwell“-Chip ausgestattet sein, aber es könnte eine Wendung geben

Nach allem, was wir bisher wissen, wird die NVIDIA GB202 „Blackwell“-GPU die Flaggschiff-Grafikkarte GeForce RTX 5090 antreiben. Vorläufige Spezifikationen haben bis zu 192 SMs ergeben, die bis zu 24.567 CUDA-Kerne ergeben, wenn der Chip das 128-Kerne-pro-SM-Design der AD102 „Ada“-Chips beibehält. Aus einem neuen Tweet des Insiders Kopite7kimi geht nun hervor, dass die GPU ein monolithisches Design verwenden wird.

Während NVIDIA für seine HPC/AI-Chips wie B100 und B200 auf ein Chiplet-Design umgestiegen ist, scheint das Unternehmen bei seinen verbraucherorientierten GPU-Chips weiterhin monolithische Gehäuse beizubehalten. Es heißt, dass die GB202 „Blackwell“-GPU physisch monolithisch aufgebaut sein wird, und aus früheren Berichten wissen wir, dass sie voraussichtlich die doppelte Anzahl an SMs und Kernen aufweisen wird wie GB203, was ein abgespeckterer Chip für die GeForce RTX 5080 ist. Das wird einen großen Leistungsunterschied zwischen den beiden Karten bedeuten, aber die RTX 5090 entwickelt sich zu einem echten Biest.

Wir werden uns in Kürze näher mit der NVIDIA GeForce RTX 5090 befassen, aber vorher wollen wir noch etwas mehr über die GB202 „Blackwell“-GPU selbst sprechen. Es sieht also so aus, als hätten wir es mit einem monolithischen Design zu tun, aber wir können auch die Möglichkeit eines Chiplet-ähnlichen Designs unter der Haube nicht ausschließen.

NVIDIA könnte im Wesentlichen zwei GB203-Chips auf einem monolithischen Gehäuse unterbringen, ohne dass es wie ein Chiplet-Design aussieht. Dies würde eine bessere Kommunikation zwischen den Chips ermöglichen, anstatt die mit ordnungsgemäßen Chiplet-Implementierungen verbundenen Kommunikationsengpässe außerhalb der Chips. NVIDIA hat zwar Lösungen zur Überwindung der Engpässe wie NVLINK und andere Verbindungen, diese könnten jedoch etwas teuer werden, da sie die Komplexität der GPU erhöhen.

NVIDIA hat jedoch bereits eine Lösung auf dem Markt, und zwar in Form des GA100 und GH100. Dabei handelt es sich im Wesentlichen um zwei Hälften eines kleineren Chips, die über eine Verbindung verbunden sind und über einen geteilten L2-Cache kommunizieren. NVIDIAs Bryan Catanzaro erklärte, dass diese Implementierung die Skalierbarkeit verbessert und dass der anfängliche Übergang zu diesem Design reibungslos verlief. Der Chip soll außerdem auf dem TSMC 4NP-Prozessknoten (5 nm) basieren, der die Dichte um 30 % (Transistor) verbessert, sodass neben der Architekturverbesserung auch eine nette Verbesserung zu erwarten ist.

Nun wird NVIDIA das Gleiche wahrscheinlich auch im Gaming-Bereich tun, was bedeutet, dass wir, wenn sich das Ganze auszahlt, in Zukunft mit einem Chiplet-Angebot im B100/B200-Stil rechnen können.

Zurück zur NVIDIA GeForce RTX 5090: Es gibt mittlerweile mehrere Berichte, dass wir beim Flaggschiff der nächsten Generation möglicherweise eine 512-Bit-Schnittstelle bekommen, und es gibt bereits Informationen zu einer brandneuen Kühl- und PCB-Lösung, die für dieses Kartenmonster in Arbeit ist.

In Anbetracht der Gerüchte, dass AMD sich mit seiner RDNA 4-Reihe aus dem Ultra-High-End-Grafikleistungssegment zurückzieht, sieht es so aus, als könnte NVIDIA seine Führung im Gaming-Segment mit Blackwell-GPUs weiter ausbauen, sobald diese auf den Markt kommen. Die NVIDIA GeForce RTX 5090 wird voraussichtlich einige Wochen nach der RTX 5080 auf den Markt kommen, die Gerüchten zufolge die erste Blackwell-Gaming-GPU in den Regalen sein soll.

NVIDIA Blackwell „GB202“-GPU-Spezifikationen „vorläufig“:

GPU-Name GB202 AD102
GPC 12 (pro GPU)? 12 (pro GPU)
TPC 8 (laut GPC)? 6 (laut GPC)
SM 2 (pro TPC)? 2 (Pro TPC)
SMs insgesamt 192? 144
Unterkern Wird noch bekannt gegeben 4 (pro SM)
FP32 128 (pro SM)? 128 (pro SM)
FP32+INT32 Wird noch bekannt gegeben 128 (pro SM)
CUDA-Kerne 24.567? 18.432
Warps Wird noch bekannt gegeben 64 (pro SM)
Themen Wird noch bekannt gegeben 2048 (pro SM)
L1-Cache Wird noch bekannt gegeben 192 KB (pro SM)
L2-Cache Wird noch bekannt gegeben 96 MB (pro GPU)
ROPs Wird noch bekannt gegeben 32 (laut GPC)
Speicherstandard GDDR7 GDDR6X
Maximaler Speicherbus 512 Bit 384 Bit
Maximale Speicherbeschränkung 48 GB? 24 GB

Auf welche NVIDIA GeForce RTX 50 GPU freuen Sie sich am meisten?

Diesen Artikel teilen

Facebook

Þjórsárden



source-99

Leave a Reply