NVIDIA Details Ada Lovelace GPU-Blockdiagramm, Streaming-Multiprozessor, DLSS 3 und GeForce RTX 40 Founders Edition-Kühler


Während seines Presse-Tech-Gesprächs hat NVIDIA gesprochen über verschiedene Technologien rund um die kommenden GeForce RTX 40-Grafikkarten auf Basis der Ada Lovelace-GPUs. Einige der hervorgehobenen Technologien waren die Ada Lovelace GPU selbst, die neueste DLSS 3-Technologie und Kühler, die in den brandneuen Founders Edition-Modellen enthalten sind.

NVIDIA Weitere Details Ada Lovelace GPUs, DLSS 3, GeForce RTX 40 Grafikkarten und mehr

NVIDIA wird seine erste Grafikkarte der GeForce RTX 40-Serie, die RTX 4090, am 12. Oktober auf den Markt bringen, gefolgt von der RTX 4080-Serie im November. Es gibt viel zu besprechen, also fangen wir an.

NVIDIAs AD102 „Ada Lovelace“ GPU – Das Kraftpaket der nächsten Generation

Das Herzstück der NVIDIA GeForce RTX 4090 Grafikkarte ist die Ada Lovelace AD102 GPU. Die GPU misst 608,4 mm2 und wird den TSMC 4N-Prozessknoten verwenden, der eine optimierte Version des 5-nm-Knotens (N5) von TSMC ist, der für das grüne Team entwickelt wurde. Die GPU verfügt über wahnsinnige 76,3 Milliarden Transistoren.

Die NVIDIA Ada Lovelace AD102 GPU verfügt über bis zu 12 GPC (Graphics Processing Clusters). Das sind 5 SM mehr im Vergleich zu den Ampere GA102 GPUs. Jede GPU besteht aus 6 TPCs und 2 SMs, was der gleichen Konfiguration wie der vorhandene Chip entspricht. Jeder SM (Streaming Multiprocessor) wird vier Unterkerne beherbergen, was auch der GA102-GPU entspricht. Was sich geändert hat, ist die FP32- und die INT32-Kernkonfiguration. Jeder Sub-Core enthält 64 FP32-Einheiten, aber kombinierte FP32+INT32-Einheiten werden bis zu 128 betragen. Dies liegt daran, dass die Hälfte der FP32-Einheiten nicht denselben Sub-Core wie die IN32-Einheiten teilen. Die 64 FP32-Kerne sind von den 128 INT32-Kernen getrennt.

Insgesamt besteht also jeder Sub-Core aus 16 FP32 plus 16 INT32-Einheiten für insgesamt 32 Einheiten. Jedes SM verfügt über insgesamt 64 FP32-Einheiten plus 64 INT32-Einheiten für insgesamt 128 Einheiten. Und da es insgesamt 144 SM-Einheiten (12 pro GPC) gibt, sehen wir uns insgesamt 18.432 Kerne an. Jeder SM wird auch zwei Wrap-Zeitpläne (32 Threads/CLK) für 64 Wraps pro SM und ihren eigenen L0-i-Cache enthalten. Dies ist eine 33-prozentige Steigerung der Wraps/Threads im Vergleich zur GA102-GPU. Die Größe der Registerdatei beträgt 16.384 über eine 32-Bit-Spur. Jedes SM trägt auch seinen eigenen 128 KB L1-Daten-Cache und gemeinsam genutzten Speicher, also 18 MB L1-Cache.

Wenn wir zum Cache übergehen, ist dies ein weiteres Segment, in dem NVIDIA den vorhandenen Ampere-GPUs einen großen Schub gegeben hat. Der L2-Cache wird wie in den Leaks erwähnt auf 96 MB erhöht. Dies ist eine 16-fache Steigerung gegenüber der Ampere-GPU, die nur 6 MB L2-Cache hostet. Der Cache wird über die GPU geteilt. Die GPU wird auch bis zu 192 ROPs für den Full-Die bieten.

Es wird auch die neuesten Tensor- und RT-Kerne der 3. Generation (Raytracing) der 4. Generation in die Ada Lovelace-GPUs geben, die dazu beitragen werden, die DLSS- und Raytracing-Leistung auf die nächste Stufe zu heben. Insgesamt bietet die Ada Lovelace AD102 GPU:

  • 71 % mehr GPCs (im Vergleich zu Ampere)
  • 71 % mehr Kerne (im Vergleich zu Ampere)
  • 50 % mehr L1-Cache (gegenüber Ampere)
  • 16x mehr L2-Cache (im Vergleich zu Ampere)
  • 71 % mehr ROPs (im Vergleich zu Ampere)
  • Tensor-Kerne der 4. Generation und RT-Kerne der 3. Generation

Der vollständige Chip wurde bisher auf keiner GPU vorgestellt, nicht einmal auf dem L40, bei dem 2 SMs deaktiviert sind. Es ist wahrscheinlich, dass wir mit fortschreitenden Ausbeuten irgendwann ein Gaming- und Workstation-Produkt sehen werden, das den vollwertigen AD102 verwendet. Bis dahin ist die RTX 4090 die Top-Gaming-Grafikkarte, während die RTX 6000 Ada die Top-Workstation-Lösung ist.

NVIDIA AD102 ‘Ada Lovelace’ Gaming-GPU-Blockdiagramm:

NVIDIA AD102 ‘Ada Lovelace’ Gaming GPU ‘SM’ Blockdiagramm:

NVIDIA Founders Edition wurde entwickelt, um bis zu 600 W Leistung für eine höhere Übertaktung zu nutzen

Für seine brandneuen Founders Edition-Karten, die GeForce RTX 4090 24 GB und RTX 4080 16 GB, hat NVIDIA ein kompaktes PCB hergestellt, ähnlich dem, das wir bei der vorherigen Generation gesehen haben, und das Design eines PCB wie diesem trägt zur Verbesserung des Luftstroms und der Kühlleistung bei .

NVIDIA sagt, dass sie das Dual Axial Flow Through-System weiter optimiert haben, indem sie die Lüftergröße und das Rippenvolumen um 10 % erhöht haben, einen 20 % höheren Luftstrom bieten und auf ein 23-Phasen-Netzteil aufrüsten (20+3 Phasen für RTX 4090). . Die Speichertemperaturen werden gesenkt und die neuen, wesentlich leistungsstärkeren Ada-GPUs werden in belüfteten Gehäusen kühl gehalten, was Gamern einen hervorragenden Übertaktungsspielraum bietet. NVIDIA hat ein strenges Testverfahren durchlaufen und angeblich bis zu 50 Lüfterdesigns bewertet, bevor dasjenige fertiggestellt wurde, das wir für die neuen Karten erhalten. Der Kühler wird verwendet, um Wärme von der Kühlkörperbaugruppe abzuleiten, die eine Dampfkammer umfasst, auch ein großer Sprung gegenüber dem vorherigen Design.

Die NVIDIA GeForce RTX 4080 verwendet auch den gleichen Kühler wie die RTX 4090 Founders Edition und da sie eine niedrigere TDP hat, sollte sie eine noch bessere thermische Leistung liefern.

Jede GeForce RTX 40 Series Founders Edition-Grafikkarte reduziert Kabelgewirr, indem sie den neuen Standard-GPU-Stromeingang von ATX 3.0-Netzteilen der nächsten Generation, den PCIe Gen-5 16-Pin-Anschluss, nutzt. Auf diese Weise können Sie Grafikkarten der GeForce RTX 40-Serie mit nur einem einzigen Kabel mit Strom versorgen, was die Ästhetik Ihres Builds verbessert. Wenn Sie ein Netzteil der vorherigen Generation verwenden, ist ein Adapterkabel im Lieferumfang enthalten, mit dem Sie drei 8-polige Stromanschlüsse anschließen können, mit einem optionalen vierten Anschluss für mehr Spielraum beim Übertakten. ATX 3.0-Netzteile sind ab Oktober bei ASUS, Cooler Master, FSP, Gigabyte, iBuyPower, MSI und ThermalTake erhältlich, weitere Modelle werden folgen.

Ein Vorteil des neuen 16-Pin-Anschlusses besteht darin, dass die Founders Edition-Karten zwar auf 450 W bzw. 320 W ausgelegt sind, aber den zusätzlichen Headroom nutzen können, der durch den neuen Anschluss für extremes Übertakten bereitgestellt wird, wobei die RTX 4090 für diese vollen 600 W sorgt Kennzeichen. Die neue Stromversorgung verleiht der RTX 40-Serie im Vergleich zur vorherigen Generation auch eine 10-fache Erhöhung der Reaktionszeit auf das Management von Leistungstransienten.

Die neuen Karten verfügen außerdem über DP 1.4a (4K 12-Bit HDR @ 240Hz) und HDMI 2.1 (4K 120Hz HDR / 8K 60Hz HDR). Alle Karten sind mit der PCIe-Gen-4-Schnittstelle auf vorhandenen Motherboards kompatibel und bieten außerdem volle Kompatibilität mit den Resizable-BAR-Technologien.

NVIDIA GeForce RTX 4090 Founders Edition-PCB:

Micron GDDR6X-Dies der nächsten Generation laufen dank neuem Prozessknoten um 10 °C kühler

NVIDIA hat auch die neuesten GDDR6X-Speicherchips von Micron für seine GeForce RTX 40-Grafikkarten eingesetzt, die 10 °C kühler laufen, energieeffizienter sind und da es sich bei allen um 16-Gb-DRAM-Chips handelt, können sie auf einer Seite der Leiterplatte verschmolzen werden, um besser gekühlt zu werden als bei zwei -seitige Erinnerung.

NVIDIA DLSS 3: Kompatibilität, Funktionsumfang, Spieleleistung und mehr

Lassen Sie uns nun in die technologischen Fortschritte eintauchen, die diese unglaublichen Errungenschaften ermöglichen. Zunächst begannen die NVIDIA-Ingenieure mit DLSS Super Resolution und fügten etwas namens Optical Multi Frame Generation hinzu, das auf Adas Optical Flow Accelerator basiert. Dieser Beschleuniger analysiert zwei aufeinanderfolgende Frames aus einem bestimmten Spiel und erfasst Pixeldetails wie Partikel, Reflexionen, Beleuchtung und Schatten.

Darüber hinaus berücksichtigt NVIDIA DLSS 3 auch herkömmliche Game-Engine-Informationen wie Bewegungsvektoren. Das Faltungs-Autoencoder-Netzwerk der DLSS Frame Generation AI entscheidet dann, wie jeder der vier Eingänge (aktuelle und frühere Frames, optisches Flussfeld und Bewegungsvektoren) verwendet wird, um Zwischenframes auf die bestmögliche Weise neu zu erstellen.

NVIDIA DLSS 3 soll 3/4 des ersten Frames mit DLSS Super Resolution und den vollen zweiten Frame mit Hilfe der oben erwähnten DLSS Frame Generation rekonstruieren. Insgesamt rekonstruiert NVIDIA DLSS 3 7/8 der beiden insgesamt angezeigten Frames, was die massive Leistungssteigerung erklärt.

Darüber hinaus enthält die neue Version der Bildrekonstruktionstechnik Deep Learning Super Sampling auch die latenzsenkende NVIDIA Reflex-Technologie.

Apropos DLSS-GPU-Unterstützung: Die Technologie wird die vollständige DLSS-Frame-Generierung für alle GPUs der RTX 40-Serie bieten. Für die ältere RTX 20- und RTX 30-Serie wird die Technologie als DLSS Super Resolution Suite (auch auf RTX 40) verfügbar sein. Schließlich wird NVIDIA Reflex von der GeForce 900-Serie und höher unterstützt.

Cyberpunk 2077 wurde mit NVIDIA DLSS 3, dem brandneuen Ray Tracing Overdrive und NVIDIA Reflex mit bis zu 4x verbesserter Leistung und bis zu 2x reduzierter Latenz gezeigt. Damit nicht genug, NVIDIA verspricht sogar Vorteile für CPU-lastige Spiele, die mit DLSS 2.0 in der Regel nicht viel schneller liefen. Beispielsweise erhält der notorisch CPU-lastige Microsoft Flight Simulator mit dem neuen DLSS eine bis zu 2x verbesserte Leistung. Insgesamt sagte NVIDIA, dass die folgenden über 35 Spiele und Apps bereits Unterstützung für NVIDIA DLSS 3 zugesagt haben.

  • Eine Seuchengeschichte: Requiem
  • Atomares Herz
  • Schwarzer Mythos: Wukong
  • Helle Erinnerung: Unendlich
  • Tschernobyl
  • Erobererklinge
  • Cyberpunk 2077
  • Rallye Dakar
  • Liefere uns den Mars
  • Vernichte alle Menschen! 2 – Erneute Sondierung
  • Dying Light 2 Bleib menschlich
  • F1 22
  • FIST: Im Schatten geschmiedete Fackel
  • Frostbite-Engine
  • Hitman 3
  • Hogwarts-Erbe
  • IKARUS
  • Jurassic World Evolution 2
  • Gerechtigkeit
  • Loopmancer
  • Plünderer
  • Microsoft Flugsimulator
  • Mitternachts-Geisterjagd
  • Mount & Blade II: Bannerlord
  • Naraka: Klingenspitze
  • NVIDIA Omniversum
  • NVIDIA Racer RTX
  • VERENDEN
  • Portal mit RTX
  • Herausreißen
  • STALKER 2: Herz von Tschernobyl
  • Scath
  • Schwert und Fee 7
  • SYNCHRONISIERT
  • Der Herr der Ringe: Gollum
  • The Witcher 3: Wilde Jagd
  • THRON UND FREIHEIT
  • Turm der Fantasie
  • Einheit
  • Unreal-Engine 4 & 5
  • Warhammer 40.000: Darktide

Die Grafikkarten NVIDIA GeForce RTX 4080 16 GB und RTX 4080 12 GB werden im November auf den Markt kommen und 1199 US-Dollar bzw. 899 US-Dollar kosten.

Offizielle Spezifikationen der NVIDIA GeForce RTX 40-Serie:

Name der Grafikkarte NVIDIA GeForce RTX 4090 NVIDIA GeForce RTX 4080 16G NVIDIA GeForce RTX 4080 12G NVIDIA GeForce RTX 3090 Ti
GPU-Name Ada Lovelace AD102-300? Ada Lovelace AD103-300? Ada Lovelace AD104-400? Ampere GA102-225
Prozessknoten TSMC4N TSMC4N TSMC4N Samsung 8nm
Die Größe 608 mm2 378,6 mm2 294,5 mm2 628,4 mm2
Transistoren 76 Milliarden 45,9 Milliarden 35,8 Milliarden 28 Milliarden
CUDA-Kerne 16384 9728 7680 10240
TMUs / ROPs 512 / 176 320 / 112 240 / 80 320 / 112
Tensor / RT-Kerne 512 / 128 304 / 76 240 / 60 320 / 80
Basisuhr 2230 MHz 2210MHz 2310MHz 1365MHz
Boost-Uhr 2520 MHz 2510MHz 2610 MHz 1665MHz
FP32-Berechnung 83 TFLOPs 49 TFLOPs 40 TFLOPs 40 TFLOPs
RT-TFLOPs 191 TFLOPs 113 TFLOPs 82 TFLOPs 78 TFLOPs
Tensor-TOPs 1321 TOPS 780 TOP 641 TOPS 320 TOPS
Speicherkapazität 24 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X 12 GB GDDR6X
Speicherbus 384-Bit 256-Bit 192-Bit 384-Bit
Speichergeschwindigkeit 21,0 Gbit/s 23,0 Gbit/s 21,0 Gbit/s 19 Gbit/s
Bandbreite 1008 GB/s 736 GB/s 504GB/Sek 912 Gbit/s
TBP 450W 320W 285W 350 W
Preis (UVP / FE) 1599 US-Dollar 1199 US-Dollar 899 US-Dollar $1199
Start (Verfügbarkeit) Oktober 2022 November 2022 November 2022 3. Juni 2021

Auf welche Grafikkarte der NVIDIA GeForce RTX 40-Serie freut ihr euch am meisten?

In diesem Beitrag erwähnte Produkte



source-99

Leave a Reply