Nvidias GeForce RTX 4090 sieht vielleicht unglaublich stark aus und wird bei ihrem Debüt sicherlich als die schnellste Option auf unserer Liste der besten Grafikkarten gelten (zumindest bis die RDNA 3-GPUs von AMD eintreffen), aber der abgespeckte AD102 stirbt in der RTX 4090 nicht nicht annähernd das volle Potenzial von AD102 mit all seinen Kernen und aktiviertem Cache zu zeigen. Dies könnte in Kombination mit zusätzlichen Verbesserungen auf eine zukünftige RTX 4090 Ti hindeuten, die viel schneller – und vielleicht sogar teurer – sein wird.
Die Spezifikationen für die Nvidia RTX 40-Serie und Ada Lovelace-GPUs, aber diese zeigen nur die angekündigten und gemunkelten Karten. Der vollständige AD102-Die von Nvidia ist mit 144 SMs, 18.432 CUDA-Kernen, 96 MB L2-Cache und 192 ROPs ausgestattet. Dies bedeutet 12 % mehr CUDA-Kerne und satte 33 % mehr L2-Cache-Kapazität im Vergleich zum RTX 4090, den wir heute haben. Der voll aktivierte AD102-Die enthält dank der zusätzlichen SMs auch 9 % mehr ROPS und 12 % mehr Texture Mapping Units.
Aber das ist noch nicht alles, was für den zukünftigen 4090 Ti getan werden könnte. Micron hat neue 24-Gbit/s-GDDR6X-Speichermodule in Arbeit, eine weitere Steigerung von 14 % gegenüber den 21-Gbit/s-Modulen der RTX 4090 und immer noch schneller als die 22,4-Gbit/s-Module der RTX 4080 mit 16 GB, von denen Nvidia behauptet, dass sie derzeit die schnellsten der Welt sind. Das würde die hypothetische (aber sehr wahrscheinliche) RTX 4090 Ti auf bis zu 1152 MB/s Bandbreite bringen.
Ein schnellerer Speicher würde jedoch mit einem höheren Stromverbrauch einhergehen, und wir vermuten, dass Nvidia die volle Taktrate und das Leistungspotenzial von AD102 ernsthaft zurückhält. All diese Gerüchte über Grafikkarten der 600-W-RTX-40-Serie? Wir wissen, dass Nvidia RTX 4090 erfolgreich auf mehr als 3,0 GHz übertaktet hat, und das würde den Stromverbrauch definitiv erhöhen.
Es sieht so aus, als ob die Ada-Architektur und der 4N-Prozess von TSMC über die Boost-Frequenz von 2520 MHz der RTX 4090 hinaus noch viel Spielraum haben. Sobald der Prozess etwas ausgereifter ist und Nvidia bereit ist, die Leistungsgrenzen zu erhöhen, wären wir nicht überrascht, einen Takt der RTX 4090 Ti näher an 2800 MHz zu sehen.
Die theoretische Leistung von AD102 mit all diesen Schnickschnack könnte satte 103 Teraflops in FP32-Workloads und 826 Teraflops in FP16-Workloads mit den Tensor-Kernen und 1652 Teraflops mit den Tensor-Kernen im FP8-Modus erreichen. Das wären gewaltige 25 % Leistungssprung im Vergleich zur RTX 4090.
Diese Gewinne würden natürlich nur in GPU-begrenzten Szenarien realisiert, also wahrscheinlich nicht bei 1080p- oder 1440p-Spielen. Anwendungen mit hoher Rechenleistung würden wahrscheinlich ebenfalls profitieren. Die Kombination aus mehr L2-Cache-Kapazität, zusätzlicher GDDR6X-Bandbreite und mehr Kernen und Takten könnte zu spürbaren Verbesserungen führen.
RTX 4090 Ti (vollständiges AD102) | RTX4090 | RTX 3090Ti | |
Verfahren | TSMC4N | TSMC4N | Samsung 8N |
Transistoren | 76.3B | 76.3B | 28.3 |
SMS | 144 | 128 | 84 |
GPU-Kerne | 18432 | 16384 | 10752 |
Tensor-Kerne | 576 | 512 | 336 |
Raytracing-Kerne | 144 | 128 | 84 |
Boost-Uhr | 2800MHz??? | 2520 MHz | 1860MHz |
VRAM-Geschwindigkeit | 24 Gbit/s? | 21 Gbit/s | 21 Gbit/s |
VRAM | 24 GB | 24 GB | 24 GB |
Busbreite | 384 | 384 | 384 |
Speicherbandbreite | 1152 GB/s | 1008 GB/s | 1008 GB/s |
L2-Cache-Kapazität | 96MB | 72 MB | Keiner |
ROPs | 192 | 176 | 112 |
TMU | 576 | 512 | 336 |
TFLOPSFP32 | 103.2 | 82.6 | 40 |
TFLOPSFP16 | 826 | 661 | N / A |
TDP | 600W?? | 450W | 450W |
Wann werden wir eine RTX 3090 Ti sehen?
Es scheint, dass Nvidia mit seinem GA102-Chip noch viel Leistungsspielraum hat, mit dem Potenzial, eine RTX 4090 Ti zu entwickeln, die theoretisch die RTX 4090 rauchen könnte. Sie würde sicherlich viel mehr Geld kosten und viel mehr Strom verbrauchen als eine RTX 4090 , aber es ist machbar.
All dies wird davon abhängen, wie stark Nvidia seinen GA102-Die vorantreiben will, und das wird mit ziemlicher Sicherheit davon abhängen, wie nahe AMD an die Leistung von Nvidia mit den kommenden RDNA-3-Chips herankommen kann. Die Ausbeute an voll funktionsfähigen AD102-GPUs würde ebenfalls eine Rolle spielen, obwohl es zweifelhaft ist, dass es sich dabei um hochvolumige Teile handelt.
Nvidia könnte jederzeit einige oder alle dieser Verbesserungen zu einer RTX 4090 Ti hinzufügen. Wir haben die RTX 3090 Ti erst 18 Monate nach dem RTX 3090-Debüt bekommen, aber es spielten viele Faktoren eine Rolle. Wahrscheinlicher ist, dass wir etwa neun bis zwölf Monate nach der ersten Salve eine Aktualisierung der RTX 40-Serie im Jahr 2023 sehen werden.
Es besteht auch die seltene Chance, dass Nvidia die RTX 4090 Ti zugunsten einer neuen Titan-Variante komplett überspringen könnte, aber wir bezweifeln, dass dies der Fall sein wird. Titan-Karten neigen dazu, die lukrativen Gewinne der professionellen RTX A-Serie zu stark zu beeinträchtigen.