Nvidias Laptops der RTX 40-Serie verheißen nichts Gutes für RTX 4060, 4050 Desktop-GPUs


Die Ada Lovelace-Architektur von Nvidia läutet ein neues Leistungsniveau an der Spitze des Stapels ein, wobei die RTX 4090 die RTX 3090 Ti der vorherigen Generation in unseren Rasterisierungs-Benchmarks um durchschnittlich 52 % und in Raytracing-Benchmarks um 70 % übertrifft – beides bei 4K , natürlich. Die 4090 sitzt jetzt bequem an der Spitze unserer GPU-Benchmark-Hierarchie und gilt als eine der besten Grafikkarten überhaupt, zumindest wenn Sie tiefe Taschen haben.

Leider ist der Schritt nach unten vom 4090 zum RTX 4080 ziemlich steil, da die Leistung um 23 % für die Rasterung und 30 % für das Raytracing sinkt. Wenn Sie eine weitere Stufe auf die neue RTX 4070 Ti herabsetzen, sinkt die Leistung im Vergleich zur 4080 um weitere 22 %. Wenn Sie den Überblick behalten – und wir zählen definitiv gerne Punkte –, bedeutet dies die Ada-Karte der dritten Reihe mit der AD104-GPU ist langsamer als die vorherige Generation 3090 Ti, ungeachtet der gegenteiligen Behauptungen von Nvidia, die sich auf Benchmarks stützen, die die Frame Generation von DLSS 3 verwenden.

Vielleicht alarmierender bei der RTX 4070 Ti ist, dass sie nur über eine 192-Bit-Speicherschnittstelle verfügt. Es hat immer noch 12 GB GDDR6X-Speicher, und der große L2-Cache bedeutet im Allgemeinen, dass der schmalere Bus kein Deal-Killer ist, aber die Dinge sehen nicht so gut aus, wenn wir zukünftige Teile der RTX 40-Serie der unteren Stufen wie die 4060 im Auge behalten und 4050.

Nvidia hat kürzlich die gesamte Reihe der Laptop-GPUs der RTX 40-Serie angekündigt, die von der mobilen RTX 4090 reichen, die die AD103-GPU (im Grunde eine mobile 4080) verwendet, bis hin zur anämisch klingenden RTX 4050. Hier ist die vollständige Liste der Spezifikationen für die mobilen Teile .

Wischen Sie, um horizontal zu scrollen
Nvidia Ada Laptop GPU-Spezifikationen
Grafikkarte RTX 4090 für Laptops RTX 4080 für Laptops RTX 4070 für Laptops RTX 4060 für Laptops RTX 4050 für Laptops
Die Architektur AD103 AD104 AD106? AD106? AD107?
Verfahrenstechnik TSMC4N TSMC4N TSMC4N TSMC4N TSMC4N
Transistoren (Milliarden) 45.9 35.8 ? ? ?
Die Größe (mm^2) 378.6 294.5 ? ? ?
SMS 76 58 36 24 20
GPU-Shader 9728 7424 4608 3072 2560
Tensor-Kerne 304 232 144 96 80
Raytracing “Kerne” 76 58 36 24 20
Boost-Takt (MHz) 1455-2040 1350-2280 1230-2175 1470-2370 1605-2370
VRAM-Geschwindigkeit (Gbit/s) 18? 18? 18? 18? 18?
VRAM (GB) 16 12 8 8 6
VRAM-Busbreite 256 192 128 128 96
L2-Cache 64 48 32 32 24
ROPs 112 80 48 32 32
TMUs 304 232 144 96 80
TFLOPS FP32 (Boost) 28.3-39.7 20.0-33.9 11.3-20.0 9.0-14.6 8.2-12.1
TFLOPSFP16 (FP8) 226-318 (453-635) 160-271 (321-542) 91-160 (181-321) 72-116 (145-233) 66-97 (131-194)
Bandbreite (GBps) 576 432 288 288 216
TDP (Watt) 80-150 60-150 35-115 35-115 35-115

Es ist ziemlich sicher, dass der Desktop-RTX 4070 denselben AD104 wie der RTX 4070 Ti verwenden wird, nur mit weniger SMs und Shadern. Desktop RTX 4060 Ti, vorausgesetzt, wir bekommen das bald, kann AD104 verwenden oder nicht; Die einzige andere Option wäre vermutlich die AD106-GPU, die im mobilen 4070/4060 verwendet wird. Und das ist ein Problem.

Die Vorgängergeneration RTX 3060 Ti war mit 8 GB GDDR6 auf einer 256-Bit-Schnittstelle ausgestattet. Wir waren nicht besonders erfreut über den Mangel an VRAM, insbesondere als AMD begann, RX 6700 XT (und später 6750 XT) mit 12 GB VRAM auszuliefern. Nvidia hat mit der RTX 3060 im Grunde eine Kurskorrektur vorgenommen und ihr 12 GB VRAM gegeben, was sie gegenüber der vorherigen RTX 2060 zu einem netten Fortschritt macht – und sogar die 2060 sah schließlich 12-GB-Modelle, obwohl die Preise sie meistens unattraktiv machten.

Jetzt sprechen wir davon, dass RTX 4060 höchstwahrscheinlich auf 8 GB zurückgeht, und das wäre scheiße. Es gibt jetzt viele Spiele, die 8 GB VRAM-Nutzung überschreiten können, und diese Zahl wird nur in den nächsten zwei Jahren steigen. Aber Nvidia hat nicht viele andere Optionen, da die Speicherkapazitäten von GDDR6 und GDDR6X bei 2 GB pro 32-Bit-Kanal liegen.

Es besteht die Möglichkeit, den „Clamshell“-Modus mit zwei Speicherchips pro Kanal auszuführen, einen auf jeder Seite der Platine, aber das ist ziemlich chaotisch und etwas, das wir nicht in einer Mainstream-GPU erwarten würden. Das könnte die 128-Bit-Schnittstelle auf bis zu 16 GB VRAM bringen, was wiederum seltsam wäre, da die höherwertigen Teile wie der 4070 Ti nur 12 GB haben. Trotzdem klingt das für mich besser als ein RTX 4060 8GB-Modell!

Und was ist mit der RTX 4050? Vielleicht bleibt Nvidia bei der 128-Bit-Schnittstelle auf der AD106-GPU und überspringt einfach die Verwendung von AD107 auf einem Desktop-Teil – das ist im Grunde mit GA107 passiert, das fast ausschließlich für Laptop RTX 3050 verwendet wurde. Aber wenn es versucht, AD107 in einem zu verwenden Desktop, hätte es nur bis zu 6 GB VRAM, wobei wiederum Clamshell-VRAM ein potenzieller Ausgang wäre.

Das Blockdiagramm des AD104

Die gleiche AD104-GPU sitzt in Nvidias RTX 4070 Ti-Desktop-Karte sowie in der kommenden RTX 4080-Laptop-Lösung. (Bildnachweis: Toms Hardware)

Nicht nur die Speicherkapazitäten geben Anlass zur Sorge. Wir sagten im RTX 4070 Ti-Test, dass die Leistung nicht schlecht, aber auch nicht überragend war. Es ist im Grunde eine billigere Variante einer RTX 3090 mit halb so viel VRAM und geringerem Stromverbrauch. Die 4070 Ti kommt mit 60 Streaming-Multiprozessoren (SMs) und 7680 CUDA-Kernen (GPU-Shadern) aus, etwas mehr als die scheidende RTX 3070 Ti. Aber AD106 könnte mit nur 40 SMs, vielleicht sogar 36 SMs, die Spitze erreichen, was es in Bezug auf die Kernzahlen in ein ähnliches Gebiet wie die RTX 3060 Ti bringen würde, wobei nur GPU-Takte als Leistungssteigerung übrig bleiben würden.

Wenn man diese beiden Dinge zusammenfasst – unzureichender VRAM und relativ geringfügige Erhöhungen der Anzahl der GPU-Shader – und wir sehen wahrscheinlich bescheidene Leistungsverbesserungen im Vergleich zu den GPUs der vorherigen Ampere-Generation.

Nvidia wird dann DLSS 3-Leistungsverbesserungen herausbringen, die nur für eine Teilmenge von Spielen gelten und auch keine echten Leistungssteigerungen bieten, und die Dinge fangen an, noch schlechter zu klingen. Ein Teil des Vorteils einer GPU, die heute Spiele mit 120 fps ausführen kann, besteht darin, dass sie in einigen Jahren immer noch 60 fps in den meisten Spielen leisten kann, wenn die Spiele anspruchsvoller werden. Aber was passiert, wenn das nicht der Fall ist? real Bildraten?

Nvidia-Treiber DLSS3-Spiele

(Bildnachweis: Nvidia)

Nehmen wir an, ein Spiel läuft dank der Frame-Generation-Technologie von DLSS 3 mit 120 fps und einer Basisleistung von 70 fps. Im Moment ist alles gut und schön, aber später wird die Basisleistung unter 40 fps fallen, wenn die Spiele anspruchsvoller werden, und schließlich wird sie unter 30 fps fallen. Was wir erlebt haben, ist, dass sich Frame Generation mit einer Basis-Framerate von weniger als 30 fps immer noch wie unter 30 fps anfühlt, selbst wenn der Monitor doppelt so viele Frame-Updates pro Sekunde erhält.

Dieselbe Logik gilt auch für höhere Bildraten, sodass sich DLSS 3 bei 120 fps mit einer Basis von 70 fps immer noch wie 70 fps anfühlt, auch wenn es für das Auge etwas flüssiger aussieht. Die meisten Menschen werden den Unterschied zwischen Eingaberaten bei 70 Samples pro Sekunde und Eingaben bei 120 Samples pro Sekunde nicht erkennen können. Aber wenn Sie anfangen, unter 40 zu fallen, werden selbst Laienspieler den Unterschied spüren.

Oder um es deutlicher auszudrücken: DLSS 3 und Frame Generation sind kein Allheilmittel. Sie können helfen, die Grafik zu glätten und vielleicht das Spielgefühl ein wenig zu verbessern, aber der Vorteil wird nicht so deutlich sein wie bei tatsächlichen vollständig gerenderten Frames mit neuen Benutzereingaben, insbesondere wenn die Leistung unter 60 fps fällt.

Das soll nicht heißen, dass es eine schlechte Technologie ist – sie ist eigentlich ziemlich clever – und es macht uns nichts aus, dass sie existiert. Aber Nvidia muss aufhören, DLSS-3-Ergebnisse mit Nicht-DLSS-3-Ergebnissen zu vergleichen und so zu tun, als wären sie dasselbe. Nehmen Sie die Basis-Framerate vor der Frame-Generierung und fügen Sie vielleicht 10–20 Prozent hinzu, und so fühlt sich ein Spiel an, nicht die 60–100 Prozent höheren fps, die Benchmarks zeigen werden.

Zurück zum eigentlichen Thema: Die zukünftigen Mainstream- und Budget-GPUs der RTX 40-Serie werden die bestehenden Modelle zweifellos in reiner Leistung schlagen und auch DLSS 3-Unterstützung bieten. Hoffentlich kehrt Nvidia jedoch zu Preisen zurück, die näher an der vorherigen Generation liegen, denn wenn die RTX 4060 499 US-Dollar und die RTX 4050 399 US-Dollar kostet, werden sie im Vergleich zu den bestehenden Karten zu diesen Preisen nur geringfügige Upgrades sein.

source-109

Leave a Reply