Nvidia enthüllt GPU-Geheimnisse von Ada Lovelace: Extreme Transistorzahlen bei hohen Taktraten


Als Nvidia Anfang dieser Woche seine Ada Lovelace-Familie von Grafikprozessoren vorstellte, konzentrierte es sich hauptsächlich auf seine AD102-GPU der Spitzenklasse und seine Flaggschiff-Grafikkarte GeForce RTX 4090. Es hat nicht zu viele Details über seine AD103- und AD104-Grafikchips veröffentlicht. Glücklicherweise hat Nvidia heute sein Whitepaper Ada Lovelace hochgeladen, das jede Menge Daten über die neuen GPUs enthält und viele Lücken füllt. Wir haben die GPUs der RTX 40-Serie mit allem, was wir wissen, mit den neuen Details aktualisiert, aber hier ist die Übersicht der neuen und interessanten Informationen.

Große GPUs für großes Gaming

Wir wissen bereits, dass Nvidias Spitzenreiter AD102 eine 608-mm^2-GPU ist, die 76,3 Milliarden Transistoren, 18.432 CUDA-Kerne und 96 MB L2-Cache enthält. Wir wissen jetzt auch, dass AD103 ein 378,6 mm² großer Grafikprozessor mit 45,9 Milliarden Transistoren, 10.240 CUDA-Kernen und 64 MB L2-Cache ist. Der AD104 hat eine Chipgröße von 294,5 mm^2, 35,8 Milliarden Transistoren, 7680 CUDA-Kerne und 48 MB L2.

Nvidia Ada-Spezifikationen vs. Ampere
GPU/Grafikkarte Vollständig AD102 RTX4090 RTX4080 16GB RTX4080 12GB RTX 3090Ti
Die Architektur AD102 AD102 AD103 AD104 GA102
Verfahrenstechnik TSMC4N TSMC4N TSMC4N TSMC4N Samsung 8LPP
Transistoren (Milliarden) 76.3 76.3 45.9 35.8 28.3
Die Größe (mm^2) 608 608 378.6 294.5 628.4
Streaming-Multiprozessoren 144 128 76 60 84
GPU-Kerne (Shader) 18432 16384 9728 7680 10752
Tensor-Kerne 576 512 320 240 336
Raytracing-Kerne 144 144 80 60 84
TMUs 512 512 304? 240 336
ROPs 192 192 112 80 112
L2-Cache (MB) 96 96 64 48 6
Boost-Takt (MHz) ? 2520 2505 2600 1860
TFLOPS FP32 (Boost) ? 82.6 48.7 40.1 40.0
TFLOPSFP16 (FP8) ? 661 (1321) 390 (780) 319 (639) 320 (nicht zutreffend)
TFLOPS-Raytracing ? 191 113 82 78.1
Speicherschnittstelle (Bit) 384 384 256 192 384
Speichergeschwindigkeit (GT/s) ? 21 22.4 21 21
Bandbreite (GBps) ? 1008 736 504 1008
TDP (Watt) ? 450 320 285 450
Erscheinungsdatum ? 12. Oktober 2022 November 2022? November 2022? März 2022
Einführungspreis ? 1.599 $ 1.199 $ $899 1.999 $

Eines der interessanten Dinge, die Nvidia in seinem Whitepaper mitteilt, ist, dass Ada Lovelace-GPUs Hochgeschwindigkeitstransistoren in kritischen Pfaden verwenden, um die maximalen Taktraten zu erhöhen. Infolgedessen ist seine voll aktivierte AD102-GPU mit 18.432 CUDA-Kernen „in der Lage, mit Taktraten über 2,5 GHz zu laufen, während die gleiche 450-W-TGP beibehalten wird“. Vor diesem Hintergrund überrascht es uns nicht, dass das Unternehmen von 3,0-GHz-Taktraten für die GeForce RTX 4090 (mit 16.384 CUDA-Kernen) spricht, die in seinen Labors erreicht wurden. Mit 3,0 GHz wird die GeForce RTX 4090 unsere Liste der besten Grafikkarten absolut anführen.

(Bildnachweis: Nvidia)

Neben hohen Taktraten bietet die Ada Lovelace-GPU von Nvidia auch massive L2-Caches, die die Leistung bei rechenintensiven Workloads (z. B. Raytracing, Pathtracing, Simulationen usw.) verbessern und die Anforderungen an die Speicherbandbreite reduzieren. Im Wesentlichen nehmen die Ada-GPUs von Nvidia hier eine Seite aus dem Buch von RDNA 2 Infinity Cache, obwohl wir glauben, dass allgemeine Ziele für die neue Architektur lange vor der Einführung der Produkte der Radeon RX 6000-Serie von AMD im Jahr 2020 festgelegt wurden.

source-109

Leave a Reply