NVIDIA hat gerade seine Blackwell-GPUs für KI angekündigt und nun sind alle Augen auf seine Gaming-Teile gerichtet, die Gerüchten zufolge über denselben TSMC 4NP-Knoten verfügen.
NVIDIA Blackwell AI Tensor Core- und Gaming-GPUs teilen sich möglicherweise den gleichen TSMC 4NP-Prozessknoten, große Cache- und Durchsatzverbesserungen werden erwartet
Zuvor wurde erwartet, dass NVIDIA den TSMC 3-nm-Prozessknoten für den Gaming-Chip nutzen würde, dieser Plan hat sich jedoch offenbar geändert Kopite7kimi gibt nun an, dass sowohl Blackwell AI Tensor Core als auch Gaming-GPUs auf einem sehr ähnlichen Prozessknoten hergestellt werden. Erst vor wenigen Stunden erfuhren wir, dass NVIDIA den 4NP-Knoten von TSMC verwenden wird, eine Variante des 5-nm-Knotens, der bereits für Ada Lovelace- und Hopper-GPUs verwendet wurde.
Es wird angegeben, dass der neue Prozessknoten eine Steigerung der Transistordichte um 30 % ermöglichen wird, was zu höheren Leistungssteigerungen führen kann, die tatsächlichen Effizienzvorteile müssen jedoch noch erklärt werden. TSMC gibt den 4NP-Prozessknoten nirgends explizit an Website. Sie erwähnen nur N4P, das auch als Erweiterung der N5-Plattform mit einer Leistungssteigerung von 11 % gegenüber N5 und einer Leistungssteigerung von 6 % gegenüber N4 erwähnt wird.
GB202 verwendet denselben Prozessknoten wie GB100. Ich muss noch einmal klarstellen, dass TSMC 4N(vidia) auf TSMC 5 basiert, nicht auf 4nm.
Es tut mir leid, dass ich Jensens Namensgebung nicht mit der Namensgebung von TSMC in Einklang bringen kann. Zur Bestimmung benötigen wir eine professionelle Spananalyse.
Die Dichte nimmt immerhin um 30 % zu.— kopite7kimi (@kopite7kimi) 19. März 2024
Wir wissen, dass der zuvor verwendete 4N-Prozessknoten für Ada-GPUs einfach N5 (5 nm) war, getarnt mit einigen NVIDIA-exklusiven Optimierungen. NVIDIA gab außerdem bekannt, dass es mit TSMC und Synopsys zusammengearbeitet hat, um das zu nutzen bahnbrechende CuLitho-Technologie um sicherzustellen, dass die Produktion und Herstellung dieser Blackwell AI Tensor & Gaming GPUs der neuen Generation reibungslos verläuft, damit sie pünktlich an die Kunden geliefert werden können.
Schauen Sie sich nur den L1-Cache eines SM an. GB202 weist im Vergleich zu AD102 und GA102 (128 KB) definitiv eine deutliche Verbesserung auf. Dies bedeutet, dass sich die Laufzeit eines einzelnen SM erhöht.
— kopite7kimi (@kopite7kimi) 19. März 2024
Abgesehen vom Prozessknoten wird NVIDIA voraussichtlich auch einige große Zuwächse auf der L1-Cache-Seite erzielen. Es wird angegeben, dass GB202, die Flaggschiff-Gaming-GPU von Blackwell, im Vergleich zu AD102 und GA102 erhebliche Verbesserungen aufweisen wird, was eine Steigerung des SM-Durchsatzes ermöglichen wird. Kopite7kimi hat zuvor auch etwas Licht auf die Konfiguration der Blackwell GB202 Gaming GPU geworfen.
Er erklärte, dass der Chip 12 GPCs mit jeweils 8 TPCs bieten wird, also insgesamt 96 TPCs, und wenn wir die Ada-Struktur berücksichtigen, können wir mit bis zu 192 SMs oder 24.567 CUDA-Kernen rechnen, vorausgesetzt, es werden 128 FP32 vorhanden sein Kerne pro SM. Das sind 33 % mehr CUDA-Kerne als die vollständige AD102-GPU, die bisher noch nicht veröffentlicht wurde.
NVIDIA Blackwell „GB202“ GPU-Spezifikationen „vorläufig“:
GPU-Name | GB202 | AD102 |
---|---|---|
GPC | 12 (pro GPU)? | 12 (pro GPU) |
TPC | 8 (pro GPC)? | 6 (pro GPC) |
SM | 2 (pro TPC)? | 2 (pro TPC) |
Insgesamt SMs | 192? | 144 |
Sub-Core | Noch offen | 4 (pro SM) |
FP32 | 128 (pro SM)? | 128 (pro SM) |
FP32+INT32 | Noch offen | 128 (pro SM) |
CUDA-Kerne | 24.567? | 18.432 |
Verzerrungen | Noch offen | 64 (pro SM) |
Themen | Noch offen | 2048 (pro SM) |
L1-Cache | Noch offen | 192 KB (pro SM) |
L2-Cache | Noch offen | 96 MB (pro GPU) |
ROPs | Noch offen | 32 (pro GPC) |
Speicherstandard | GDDR7 | GDDR6X |
Maximaler Speicherbus | 512-Bit | 384-Bit |
Maximale Speicherkapazität | 48 GB? | 24 GB |
Wie ich bereits erwähnt habe, beträgt GA100 8*8 und GH100 8*9. GB100 wird eine Grundstruktur wie 8*10 haben. GB202 sieht aus wie 12*8.
— kopite7kimi (@kopite7kimi) 28. September 2023
Ich denke, GB203 ist die Hälfte von GB202, genau wie GB102 und GB100. Aber ich weiß nicht, ob GB202 ein Multi-Chip-Paket hat.
— kopite7kimi (@kopite7kimi) 11. März 2024
Er erwähnt auch, dass die GB203-GPU, die nächste in der Blackwell Gaming-GPU-Reihe, die Hälfte der GB202 sein wird, ähnlich wie die AD102- und AD103-GPUs. Dies wird zu einem enormen Leistungsunterschied führen, wenn NVIDIA die nächsten Karten der 90er-Serie mit GB202 und die Karten der 80er-Serie mit GB203 ausstattet. Die größte Frage ist, ob NVIDIA für seine Blackwell-Gaming-GPUs MCM-Gehäuse (Multi-Chip-Module) verwenden oder sie vorerst monolithisch belassen wird. Angesichts der steigenden Kosten und Ertragsprobleme im Zusammenhang mit der GPU-/Chip-Entwicklung ist der Chiplet-Weg tatsächlich der Weg der Zukunft und die Radeon-Abteilung von AMD hat ihn bereits angenommen.
Die Blackwell-Gaming-GPUs von NVIDIA werden im Rahmen der Familie der GeForce RTX 50-Serie mit Unterstützung von Technologien der nächsten Generation wie GDDR7-Speicher, DisplayPort 2.1 und mehr auf den Markt kommen. Wir können damit rechnen, später in diesem Jahr mehr über sie zu hören.
NVIDIA GeForce GPU-SKUs:
Generation | Blackwell | Ada Lovelace | Ampere | Turing | Pascal |
---|---|---|---|---|---|
Prozessknoten | TSMC 3nm? | TSMC 5nm | Samsung 8nm | TSMC 12 nm | TSMC 16 nm |
Einführungsjahr | 2024 | 2022 | 2020 | 2018 | 2016 |
Ultra-Enthusiasten-SKU | GB202 | AD102 | GA102 | TU102 | GP102 |
Enthusiasten-SKU | GB203 | 103 n. Chr | GA102 | TU104 | GP104 |
High-End-SKU | GB205 | 104 n. Chr | GA104 | TU106 | GP104 |
Mainstream-SKU | GB206 | 106 n. Chr | GA106 | TU106 | GP106 |
Einstiegs-SKU | GB207 | 107 n. Chr | GA107 | TU116/117 | GP107 |