„Es ist erstaunlich, wie viel Architektur auf Hotelservietten gemalt wird“, erzählt AMD-Kollege Andy Pomianowski einem Raum voller Presse bei AMDs RDNA 3-Launch-Event. Es ist mir neu. Ich war immer davon ausgegangen, dass eine großzügige Menge an Wischboard-Markern der beste Weg war, um bevorstehende Ideen zu notieren. Die Chiplet-Architektur von RDNA 3 wurde jedoch erstmals während einer Mitarbeiterbesprechung außerhalb des Standorts in einem Hotel auf ein dünnes Stück Papier geschrieben.
„Wir stehen vor Herausforderungen. Wie stellen wir unseren Kunden das beste Produkt zur Verfügung? Wir hatten viel Erfolg auf dem Server- und Desktop-Markt, und die Anwendung dieser Technologie auf GPUs war nicht offensichtlich“, Sam Naffziger , Corporate Fellow bei AMD, erzählt uns.
(öffnet in neuem Tab)
“Mike [Mantor] und Andi [Pomianowski] hatte sehr aggressive Ziele, viele Funktionen und Ziele, von denen wir wussten, dass wir sie nicht in Kombination erreichen konnten, ohne etwas anderes zu tun.”
„Also waren wir bei unseren Mitarbeitern außerhalb des Standorts und leisteten unseren Teil, taten so, als wären wir engagiert, aber nicht alle Präsentationen waren so ansprechend. Es gab eine, bei der wir da saßen und dachten, mein Verstand arbeitete hinein den Hintergrund und dachte einfach über all die technologischen Herausforderungen und die Optionen nach. Und so fing ich an, dort auf einer kleinen Hotelunterlage zu kratzen, die normalerweise niemand benutzt, aber ab und zu nützlich ist.”
Laut Naffziger hat er etwas aufgeschrieben, das jedem PC-Spieler, der heiß auf die neueste Hardware ist, jetzt ziemlich bekannt sein dürfte: den Plan für die Chiplets in den kürzlich angekündigten GPUs von RDNA 3: der RX 7900 XTX und RX 7900 XT (öffnet in neuem Tab).
„Also die GCD/MCD-Sache. Ich habe etwas Bemerkenswertes wie das herausgekratzt, was wir gestern gezeigt haben [at RDNA 3’s launch event] und es schien eine Wette zu sein. Also habe ich es Andy rübergeschoben, und er saß da und er hat eines von seinen gemacht, du weißt schon, er hat die Stirn gerunzelt und gesagt: ‘Ich denke, das kann funktionieren’.”
“Fangen Sie mit einer Serviette an. Dann ist es PowerPoint, und dann machen es die Ingenieurteams einfach”, scherzt Pomianowski.
Wenn es nur so einfach wäre. Die RDNA 3-Architektur umfasst nur zwei Chiplet-Typen – den GCD und den MCD – aber es steckt noch viel mehr dahinter, als das vermuten lässt.
(öffnet in neuem Tab)
Stellen Sie sich RDNA 3 als eine einvernehmliche Trennung für die Grafikpipeline und den größeren Teil des Speichersubsystems vor.
Auf der GCD befinden sich die eigentlichen Shader-Kerne, die in der RDNA-Architektur von AMD als Stream-Prozessoren bekannt sind. Diese sind in Dual Compute Units gruppiert, ähnlich wie RDNA 2, außer mit einer neuen und verbesserten Mehrzweck-ALU für einen besseren Befehlsdurchsatz, einer verbesserten KI-Operationseinheit mit dem neuen Matrix-Beschleuniger und einem größeren Vektor-Cache. Diese Upgrades und viele andere ermöglichen es der Dual CU von RDNA 3, eine deutlich verbesserte Takt-für-Takt-Leistung gegenüber der letzten Generation zu bieten – etwa 17,4 %.
Acht Dual Compute Units teilen sich den L1-Cache innerhalb einer Shader-Engine. Sechs Shader-Engines teilen sich den L2-Cache, einen Geometrieprozessor und einen Grafikbefehlsprozessor. All dies befindet sich in der GCD und wird durch das PCIe Gen 4-Silizium, die Multimedia-Engine und die Display-Engine der Karte ergänzt.
(öffnet in neuem Tab)
Und das schließt ungefähr ein sehr Top-Level-Aufteilung der GCD innerhalb der Navi 31-GPU. Dennoch fehlen einige Dinge: Zum einen Infinity Cache, ein Schlüsselmerkmal von RDNA, das mit RDNA 2 eingeführt wurde, aber auch eine entscheidende Möglichkeit für die GPU, mit den Speicherchips zu kommunizieren, die außerhalb des Pakets auf der Leiterplatte der Grafikkarte installiert sind. Ohne Zugriff auf einen großen Speicherpuffer kämen Sie in den neuesten Spielen nicht weit.
(öffnet in neuem Tab)
Hier verwendet AMD eine sogenannte MCD. Dies nimmt all die Dinge, die normalerweise um die Grafik-Engine herum stecken – den Infinity Cache und die GDDR6-Speicherschnittstellen – und bootet sie auf ihrem eigenen Chiplet. Jeder MCD ist viel, viel kleiner als der GCD, aber darin liegt einer der Vorteile dieses Chiplet-Systems.
Während die Navi 21-GPU im RX 6950 XT 520 mm misst2und die AD102-GPU in Nvidias RTX 4090 ist satte 608 mm groß2AMDs GCD für Navi 31 beträgt nur 300 mm2.
Jeder MCD ist nur 37 mm lang2.
Eine geringere Chipgröße sorgt für höhere Ausbeuten. Höhere Renditen dürften für ein deutlich besseres Angebotsbild sorgen.
„Je kleiner die Matrize, desto besser die Ausbeute, und so ist es, nur vom wirtschaftlichen Standpunkt aus gesehen, sind das alles sehr kleine, sehr, sehr gute Ausbeuten“, sagt mir Laura Smith, Corporate Vice President, Graphics MNC and Product Management .
„Wenn Sie sie alle in einen großen Chip stecken, werden Sie sehen, und Sie sehen es in allen möglichen Produkten, dass Sie einige redundante Fähigkeiten benötigen, weil Sie Fallout haben werden.“
(öffnet in neuem Tab)
Ich würde gerne glauben, dass dieser Chiplet-Ansatz einen wünschenswerten Effekt auf das Gesamtbild des Angebots haben und sich somit auf die Preise auswirken und uns Gamer nach dem anfänglichen Launch-Eifer tatsächlich bei den Einzelhändlern sehen wird. Ein einzelnes Chiplet, das die Die-Größe drastisch reduziert und gleichzeitig für mehrere Produkte in AMDs Produktpalette verwendet wird, könnte in dieser Hinsicht ein echter Gewinner sein, auch wenn AMD nicht auf Nvidias Top-GPU abzielt (öffnet in neuem Tab) bei der Leistung. Es hat auf jeden Fall für Ryzen funktioniert, das mit seinem cIOD einen ähnlichen Ansatz verfolgte – einem Chip, der die gesamte Uncore-Funktionalität des Prozessors unter einem Dach und auf einem älteren Prozessknoten vereinte.
Dasselbe gilt für AMDs RDNA 3-Chips in Bezug auf Prozessknoten. Die Speicherschnittstelle und der Infinity-Cache sollten nicht viel von TSMCs 5-nm-Prozessknoten profitieren, daher war es sinnvoller, sie vom Kern abzutrennen und auf dem billigeren 6-nm-Knoten herzustellen.
„Wenn wir uns das Chiplet-Design ansehen, wollen wir es maximieren, was bedeutet, dass wir die Dinge, die gut schrumpfen, unterbringen und die Vorteile der fortschrittlichen und teuren Technologieknoten in dieser Technologie und die Dinge, die nicht viel Nutzen bringen, nutzen wollen können wir auf alten Technologieknoten stehen lassen”, sagt Naffziger.
“Die richtige Technologie, der richtige Job.”
(öffnet in neuem Tab)
Ihre nächste Maschine
Bester Gaming-PC (öffnet in neuem Tab): Die Top-Baumaschinen der Profis
Bester Gaming-Laptop (öffnet in neuem Tab): Perfekte Notebooks für Mobile Gaming
Naffziger arbeitete an AMDs Ryzen-Chiplet-Ansatz – es war jahrelang sein „Baby“ – daher macht es nur Sinn, dass er derjenige ist, der sich die neue Art und Weise ausdenkt, wie diese Technologie auf eine Gaming-GPU angewendet werden könnte. Das erforderte auch eine neue Verbindung – GPUs sind Bandbreitensauger – und genau hier setzt AMDs aufregende Infinity Links an (öffnet in neuem Tab) kommt herein.
Aber wenn man bedenkt, dass das alles während eines langweiligen Meetings auf einem Zettel in einem Hotel begann. Denken Sie also das nächste Mal daran, wenn Sie in einem Meeting sitzen und jemandem zuhören, warum Ihr Unternehmen diesen Winter die gesamte Heizung im Büro abstellen muss – Sie könnten sich an Ort und Stelle Ihren nächsten großen Durchbruch ausdenken.