Vor etwas mehr als einer Woche, ein AMD-Patent mit dem Titel „Distributed Geometry“. wurde vom US-Patentamt veröffentlicht, das Patent selbst wurde im April dieses Jahres von AMD angemeldet. Das Patent beschreibt einen vollständigen Chiplet-Ansatz für GPUs, bei dem die Rendering-Arbeitslast auf eine Reihe von Chips verteilt wird, anstatt dass ein riesiger Chip die gesamte Verarbeitung übernimmt. Es gibt natürlich keine Anzeichen dafür, dass wir dies in absehbarer Zeit in einer Radeon-Grafikkarte zum Einsatz bringen werden, aber es ist die natürliche Weiterentwicklung dessen, was wir bereits in RDNA 3 gesehen haben.
Ich habe Neuigkeiten über das Patent vom YouTube-Kanal erhalten RedGamingTech und es ist eine faszinierende Lektüre. Obwohl das Dokument den Titel „Verteilte Geometrie“ trägt, geht es in Wirklichkeit um verteiltes Rendering. Nehmen Sie AMDs aktuelle Navi 31 GPU, seinen größten Grafikprozessor, wie er in der Radeon RX 7900-Serie verwendet wird. Dabei werden zwar Chiplets verwendet, diese enthalten jedoch nur zwei VRAM-Schnittstellen und einen Teil des L3 Infinity Cache; Der Rest der GPU befindet sich in einem einzelnen Block (GCD genannt, Graphics Compute Die).
Wie bei allen GPUs gibt es einen zentralen Workload-Prozessor, der Rendering-Aufgaben an einen der vielen Shader-Blöcke im Chip sendet. Jede Einheit erhält ein Stück Geometrie, das sie durchschneiden, in Pixel umwandeln und dann schattieren kann. Das wird seit Jahrzehnten so gemacht und sowohl AMD als auch Nvidia haben den Prozess in ihren GPUs nahezu perfektioniert.
Was AMDs Patent im Einzelnen beschreibt, ist ein Ansatz, bei dem der Zentralprozessor aufgegeben wird und der einzelne Siliziumblock durch eine Reihe von Chiplets ersetzt wird, von denen jeder seine eigenen Aufgaben erledigt. Rendering-Anweisungen werden in einer langen Sequenz, die als Befehlsliste bezeichnet wird, an GPUs gesendet. Darunter befinden sich sogenannte Draw-Aufrufe.
Hierbei handelt es sich um Anweisungen, wie man eine Reihe von Geometrien (z. B. Dreiecke in Form einer Ansammlung von Eckpunkten und Indizes) nimmt und dann den gesamten Prozess des Verschiebens, Änderns der Größe usw. durchläuft, bevor man sie schließlich in einen Block aus farbigen Pixeln umwandelt. im VRAM gespeichert.
Jedes Chiplet mit verteilter Geometrie im Patent ermittelt, welche Dreiecke schattiert werden müssen, und macht sich dann daran. Das Patent erklärt, dass es mehrere Möglichkeiten gibt, wie die Chiplets verfolgen können, wer welche Geometrie ausführt, wobei die einfachste Methode ein Round-Robin-Verfahren ist (dh jedes Chiplet arbeitet abwechselnd die Liste der Polygone ab).
Das hört sich so an, als würde es alles nur viel komplizierter machen. Was sind also die potenziellen Vorteile, dies zu tun? Wie wir an der erfolgreichen Umstellung von AMD auf Chiplets für seine CPUs gesehen haben, geht es vor allem darum, die Herstellungskosten für High-End-Hardware zu senken. Sehr große GPUs sind weniger kostengünstig in der Herstellung als kleinere, da jeder Siliziumwafer weniger funktionierende Chips ergibt. Die Speicherchiplets im Navi 31 sind so klein, dass ein typischer 12-Zoll-Wafer über tausend davon produzieren kann, und selbst wenn eine große Anzahl davon defekt ist, bleibt immer noch ein kleiner Berg funktionierender Chips übrig.
AMD möchte offensichtlich den gleichen Ansatz mit dem Rest der GPU verfolgen. Hochmoderne Prozessknoten sind enorm teuer. Wenn also eine High-End-GPU einfach durch Zusammenfügen eines Stapels winziger Chiplets in demselben Gehäuse hergestellt werden kann, können die Gesamtkosten für die Herstellung gesenkt werden.
Allerdings müssen ernsthafte Herausforderungen bewältigt werden, damit dies zu einer effektiven Methode zum Aufbau einer GPU wird. Der erste davon sind die internen Bandbreiten- und Latenzanforderungen. In einem normalen Grafikprozessor können pro Sekunde mehrere Terabyte an Daten zwischen den Caches gelesen und geschrieben werden, wobei jede Transaktion nur wenige Nanosekunden benötigt. Durch die Umstellung auf Chiplets muss das System, mit dem alles mit den gemeinsam genutzten Cache- und Speichercontrollern verbunden wird, wirklich leistungsstark sein.
Glücklicherweise verfügt AMD in dieser Situation bereits über reichlich Erfahrung. Die Infinity Fanout Links, die in der RX 7900-Serie verwendet werden, um den GCD mit den Speicherchiplets zu verbinden, liefern enorme Bandbreite und das Die Latenz ist nicht viel schlimmer als bei einer Full-Die-GPU wie dem Navi 21 (RX 6900 XT). Was für dieses Design mit verteilter Geometrie erforderlich wäre, ist ein ziemlicher Fortschritt, aber wenn es irgendjemand herausfinden kann, dann AMD.
Das andere Problem, das gelöst werden muss, besteht darin, sicherzustellen, dass alle Chiplets so ausgelastet wie möglich sind. Da jeder seine eigene Arbeitslast bestimmt, besteht die Gefahr, dass einige Einheiten untätig bleiben, weil die anderen schnell genug die benötigten Aufgaben erledigen können. Es gibt auch das Problem von Verarbeitungsverzögerungen, bei denen ein Chiplet eine Aufgabe nicht vollständig erledigen kann, weil es benachbarte Geometrieinformationen benötigt.
Nichts davon wird im Patent besprochen, daher bleibt uns vorerst nur übrig, über die Angelegenheit nachzudenken und uns zu fragen, wann AMD die Technologie ankündigen wird, falls dies jemals der Fall sein wird. Ich vermute, dass dies für RDNA 5 und nicht für die nächste Iteration geplant ist, aber es besteht eine kleine Chance, dass dies nicht der Fall ist. Das letzte Mal, dass ich ein radikales Technologiepatent von AMD gesehen habe, war dafür Raytracing-Textureinheiten.
Das wurde im Juni 2019 veröffentlicht, fast zwei Jahre nach der Einreichung, und die Funktion wurde in RDNA 2 implementiert. AMD begann 2020 mit der Werbung für diese Architektur und die ersten Produkte mit den schicken neuen RT-Textur-Prozessoren kamen im November desselben Jahres auf den Markt. Es besteht also die Möglichkeit, wenn auch eher gering, dass AMD uns nächstes Jahr mit RDNA 4 eine ganz neue Welt von GPU-Chiplets bescheren könnte.
Dies scheint jedoch nicht der Fall zu sein, da die allgemeinen Gerüchte alle darauf hindeuten, dass sich AMD für 2024 auf sein Mainstream-Portfolio konzentrieren wird. Ich würde viel lieber bis 2025 oder sogar 2026 warten, um dies in Aktion zu sehen, wie AMD es geben würde mehr Zeit, alle Probleme auszuräumen.
PC-Gaming braucht auf dem GPU-Markt dringend das gleiche Maß an Konkurrenz wie im CPU-Bereich, und das geht nur, wenn Radeon-Karten genauso gut sind wie GeForce-Karten, aber zu einem deutlich niedrigeren Preis.
Klar, die GPUs von AMD sind derzeit günstiger als die von Nvidia, aber sie sind immer noch enorm teuer. Erinnern Sie sich noch an die Zeit, als Zen auf den Markt kam und wir eine CPU mit acht Kernen und 16 Threads für nur 329 US-Dollar erhielten, während Intel noch Modelle mit sechs Kernen für 370 US-Dollar verkaufte? Schauen Sie sich nun an, wo AMD mit seinen Gaming-CPUs steht: Das ist es, was wir auch von seinen GPUs erwarten.