2024 - NVIDIA Blackwell GB202-Gaming-GPUs nutzen TSMC 4NP-Knoten, deutliche Verbesserung des Cache- und SM-Durchsatzes

NVIDIA hat gerade seine Blackwell-GPUs für KI angekündigt und nun sind alle Augen auf seine Gaming-Teile gerichtet, die Gerüchten zufolge über denselben TSMC 4NP-Knoten verfügen.

NVIDIA Blackwell AI Tensor Core- und Gaming-GPUs teilen sich möglicherweise den gleichen TSMC 4NP-Prozessknoten, große Cache- und Durchsatzverbesserungen werden erwartet

Zuvor wurde erwartet, dass NVIDIA den TSMC 3-nm-Prozessknoten für den Gaming-Chip nutzen würde, dieser Plan hat sich jedoch offenbar geändert Kopite7kimi gibt nun an, dass sowohl Blackwell AI Tensor Core als auch Gaming-GPUs auf einem sehr ähnlichen Prozessknoten hergestellt werden. Erst vor wenigen Stunden erfuhren wir, dass NVIDIA den 4NP-Knoten von TSMC verwenden wird, eine Variante des 5-nm-Knotens, der bereits für Ada Lovelace- und Hopper-GPUs verwendet wurde.

Es wird angegeben, dass der neue Prozessknoten eine Steigerung der Transistordichte um 30 % ermöglichen wird, was zu höheren Leistungssteigerungen führen kann, die tatsächlichen Effizienzvorteile müssen jedoch noch erklärt werden. TSMC gibt den 4NP-Prozessknoten nirgends explizit an Website. Sie erwähnen nur N4P, das auch als Erweiterung der N5-Plattform mit einer Leistungssteigerung von 11 % gegenüber N5 und einer Leistungssteigerung von 6 % gegenüber N4 erwähnt wird.

GB202 verwendet denselben Prozessknoten wie GB100. Ich muss noch einmal klarstellen, dass TSMC 4N(vidia) auf TSMC 5 basiert, nicht auf 4nm.
Es tut mir leid, dass ich Jensens Namensgebung nicht mit der Namensgebung von TSMC in Einklang bringen kann. Zur Bestimmung benötigen wir eine professionelle Spananalyse.
Die Dichte nimmt immerhin um 30 % zu.

— kopite7kimi (@kopite7kimi) 19. März 2024

Wir wissen, dass der zuvor verwendete 4N-Prozessknoten für Ada-GPUs einfach N5 (5 nm) war, getarnt mit einigen NVIDIA-exklusiven Optimierungen. NVIDIA gab außerdem bekannt, dass es mit TSMC und Synopsys zusammengearbeitet hat, um das zu nutzen bahnbrechende CuLitho-Technologie um sicherzustellen, dass die Produktion und Herstellung dieser Blackwell AI Tensor & Gaming GPUs der neuen Generation reibungslos verläuft, damit sie pünktlich an die Kunden geliefert werden können.

Schauen Sie sich nur den L1-Cache eines SM an. GB202 weist im Vergleich zu AD102 und GA102 (128 KB) definitiv eine deutliche Verbesserung auf. Dies bedeutet, dass sich die Laufzeit eines einzelnen SM erhöht.

— kopite7kimi (@kopite7kimi) 19. März 2024

Abgesehen vom Prozessknoten wird NVIDIA voraussichtlich auch einige große Zuwächse auf der L1-Cache-Seite erzielen. Es wird angegeben, dass GB202, die Flaggschiff-Gaming-GPU von Blackwell, im Vergleich zu AD102 und GA102 erhebliche Verbesserungen aufweisen wird, was eine Steigerung des SM-Durchsatzes ermöglichen wird. Kopite7kimi hat zuvor auch etwas Licht auf die Konfiguration der Blackwell GB202 Gaming GPU geworfen.

Er erklärte, dass der Chip 12 GPCs mit jeweils 8 TPCs bieten wird, also insgesamt 96 TPCs, und wenn wir die Ada-Struktur berücksichtigen, können wir mit bis zu 192 SMs oder 24.567 CUDA-Kernen rechnen, vorausgesetzt, es werden 128 FP32 vorhanden sein Kerne pro SM. Das sind 33 % mehr CUDA-Kerne als die vollständige AD102-GPU, die bisher noch nicht veröffentlicht wurde.

NVIDIA Blackwell „GB202“ GPU-Spezifikationen „vorläufig“:

GPU-Name	GB202	AD102
GPC	12 (pro GPU)?	12 (pro GPU)
TPC	8 (pro GPC)?	6 (pro GPC)
SM	2 (pro TPC)?	2 (pro TPC)
Insgesamt SMs	192?	144
Sub-Core	Noch offen	4 (pro SM)
FP32	128 (pro SM)?	128 (pro SM)
FP32+INT32	Noch offen	128 (pro SM)
CUDA-Kerne	24.567?	18.432
Verzerrungen	Noch offen	64 (pro SM)
Themen	Noch offen	2048 (pro SM)
L1-Cache	Noch offen	192 KB (pro SM)
L2-Cache	Noch offen	96 MB (pro GPU)
ROPs	Noch offen	32 (pro GPC)
Speicherstandard	GDDR7	GDDR6X
Maximaler Speicherbus	512-Bit	384-Bit
Maximale Speicherkapazität	48 GB?	24 GB

Wie ich bereits erwähnt habe, beträgt GA100 8*8 und GH100 8*9. GB100 wird eine Grundstruktur wie 8*10 haben. GB202 sieht aus wie 12*8.

— kopite7kimi (@kopite7kimi) 28. September 2023

Ich denke, GB203 ist die Hälfte von GB202, genau wie GB102 und GB100. Aber ich weiß nicht, ob GB202 ein Multi-Chip-Paket hat.

— kopite7kimi (@kopite7kimi) 11. März 2024

Er erwähnt auch, dass die GB203-GPU, die nächste in der Blackwell Gaming-GPU-Reihe, die Hälfte der GB202 sein wird, ähnlich wie die AD102- und AD103-GPUs. Dies wird zu einem enormen Leistungsunterschied führen, wenn NVIDIA die nächsten Karten der 90er-Serie mit GB202 und die Karten der 80er-Serie mit GB203 ausstattet. Die größte Frage ist, ob NVIDIA für seine Blackwell-Gaming-GPUs MCM-Gehäuse (Multi-Chip-Module) verwenden oder sie vorerst monolithisch belassen wird. Angesichts der steigenden Kosten und Ertragsprobleme im Zusammenhang mit der GPU-/Chip-Entwicklung ist der Chiplet-Weg tatsächlich der Weg der Zukunft und die Radeon-Abteilung von AMD hat ihn bereits angenommen.

Die Blackwell-Gaming-GPUs von NVIDIA werden im Rahmen der Familie der GeForce RTX 50-Serie mit Unterstützung von Technologien der nächsten Generation wie GDDR7-Speicher, DisplayPort 2.1 und mehr auf den Markt kommen. Wir können damit rechnen, später in diesem Jahr mehr über sie zu hören.

NVIDIA GeForce GPU-SKUs:

Generation	Blackwell	Ada Lovelace	Ampere	Turing	Pascal
Prozessknoten	TSMC 3nm?	TSMC 5nm	Samsung 8nm	TSMC 12 nm	TSMC 16 nm
Einführungsjahr	2024	2022	2020	2018	2016
Ultra-Enthusiasten-SKU	GB202	AD102	GA102	TU102	GP102
Enthusiasten-SKU	GB203	103 n. Chr	GA102	TU104	GP104
High-End-SKU	GB205	104 n. Chr	GA104	TU106	GP104
Mainstream-SKU	GB206	106 n. Chr	GA106	TU106	GP106
Einstiegs-SKU	GB207	107 n. Chr	GA107	TU116/117	GP107

Was möchten Sie von NVIDIAs RTX 50-Serie der nächsten Generation sehen?

source-99

Story-Trailer zu Elden Ring Shadow of the Erdtree veröffentlicht

BurgerFi behauptet, „die besten Hühnchen-Sandwiches“ im Fast-Food-Bereich auf den Markt zu bringen

Ich betrachtete mein abendliches Glas Wein als „Selbstfürsorge“. In Wirklichkeit hatte ich ein Alkoholproblem

Griechischer Richter weist Verfahren gegen Ägypter ab, denen Schiffbruch vorgeworfen wird, bei dem Hunderte Migranten ums Leben kamen

NVIDIA Blackwell GB202-Gaming-GPUs nutzen TSMC 4NP-Knoten, deutliche Verbesserung des Cache- und SM-Durchsatzes

NVIDIA Blackwell AI Tensor Core- und Gaming-GPUs teilen sich möglicherweise den gleichen TSMC 4NP-Prozessknoten, große Cache- und Durchsatzverbesserungen werden erwartet

NVIDIA Blackwell „GB202“ GPU-Spezifikationen „vorläufig“:

NVIDIA GeForce GPU-SKUs:

Leave a Reply Cancel reply