Laut NVIDIA verbessert SER die Hardware-RT-Leistung von UE5 Lumen auf GeForce RTX 4000-GPUs


Eine der wichtigsten neuen Funktionen, die mit den Grafikkarten der GeForce RTX 4000-Serie eingeführt wurden, ist SER, die Abkürzung für Shader Execution Reordering. Da Raytracing langsam aber sicher allgegenwärtiger wird, zielt SER darauf ab, die Shader-Effizienz zu verbessern, indem Ausführung und Datendivergenz verringert werden. Wie der Name schon sagt, erreicht es dieses Ergebnis, indem Threads in Echtzeit neu angeordnet werden, um die Kohärenz zu verbessern. Es entkoppelt auch Strahlschnitt- und Schattierungsoperationen.

NVIDIA bestätigte Wccftech in einem kurzen Q&A, dass SER (genau wie Opacity Micro-Maps und Displaced Micro-Mesh, die beiden anderen Leistungsverbesserungen) eine explizite Entwicklerintegration in ein Spiel erfordert und mit einer eigenen API-Erweiterung von NVAPI geliefert wird. Glücklicherweise wird der NvRTX Unreal Engine 5-Zweig bald auf Version 5.0.3 aktualisiert, die Unterstützung für SER in der beliebtesten Engine der nächsten Generation hinzufügt. Laut NvidiaShader Execution Reordering kann eine Bildratenoptimierung von bis zu 40 % bei Raytracing-Vorgängen ohne Qualitätseinbußen liefern.

Interessanterweise verbessert SER auch die Leistung von UE5 Lumen, wenn Hardware-Raytracing aktiviert ist. NVIDIA hat drei Anwendungsbeispiele bereitgestellt. Die Pfadverfolgung ist die erste und einfachste, bei der die Leistungssteigerung zwischen 20 und 50 Prozent liegen kann.

Die Pfadverfolgung stellt einen sehr unterschiedlichen Arbeitsablauf dar, was sie zu einem großartigen Kandidaten für die Anwendung von SER macht. Das Anwenden von SER ermöglicht es dem Pfadverfolger, die Divergenz in seiner Materialbewertung zu reduzieren, anstatt nur auf die Anzahl der Sprünge.

Laut NVIDIA wird diese Szene dank SER um 40 % schneller gerendert.

SER kann über die bloße Neuanordnung von Shadern hinaus nützlich sein, um die Divergenz zu reduzieren. NVIDIA sagte beispielsweise, dass die Arbeitsverdichtung bedeutende Vorteile bringen kann, wenn Lumens Hardware-Raytracing Global Illumination verwendet wird.

Bei großen Szenen, wie dem UE5 City Sample, werden Traces in das Nah- und Fernfeld gebrochen, die als separate Tracing-Durchgänge mit dazwischenliegender Verdichtung ausgeführt werden. Die mehrfachen Durchläufe und die Komprimierung können durch einen einzigen NVReorderThread-Aufruf ersetzt werden. Dadurch werden die Leerlaufblasen auf der GPU vermieden, die erforderlich sind, um die Ergebnisse der Nahfeldverfolgung zu verdichten und dann Fernfeldstrahlen zu starten.

Der Wegfall des zusätzlichen Aufwands für das Speichern, Komprimieren und erneute Starten von Arbeiten ist oft eine Einsparung von 20 % wert. Die Shader-Änderungen können aufgrund von Annahmen im ursprünglichen Code intensiver sein (Funktionen, die Makros verwenden, um Verhalten statt Argumente zu permutieren). Die logischen Änderungen beliefen sich jedoch auf das Hinzufügen von zwei Neuordnungsaufrufen mit einem einzigen booleschen Ausdruck dafür, ob eine Ablaufverfolgung getroffen oder verfehlt wurde.

Schließlich hat NVIDIA einen dritten (wenn auch komplexeren) Anwendungsfall mit Lumens Hardware-Raytracing-Reflexionen beschrieben. Hier sind normalerweise zwei verschiedene Raytracing-Pipelines am Werk, eine für die Nah- und Fernfeldverfolgung und eine andere für die Trefferbeleuchtung.

Bei aktiviertem SER können die Durchgänge kombiniert werden, da separate Verdichtungs- und Sortierphasen nicht mehr erforderlich sind. Der Pass wird grob zu einer Spur Nahfeld, wenn nicht zu einer Trefferspur Fernfeld, wenn einer der Treffer dann das Trefferobjekt verwendet, um das Material zu bewerten und eine Beleuchtung durchzuführen. Möglich wird dies durch die Entkopplung von Tracing und Shading.

Die oben beschriebene Implementierung führte zu einer Geschwindigkeitssteigerung von 20–30 % bei Lumen-Reflexionen auf der GPU, gemessen bei der Profilerstellung einer typischen Arbeitslast in UE5 City Sample.

Wenn Sie ein Entwickler sind, der daran interessiert ist, Ihrer Engine SER-Unterstützung hinzuzufügen, Vielleicht möchten Sie sich das vollständige Whitepaper ansehen. Es ist derzeit unklar, welche Spiele in naher Zukunft Shader Execution Reordering (oder Opacity Micro-Maps und Displaced Micro-Mesh) unterstützen werden, aber wir werden dies sowohl mit NVIDIA als auch mit Spielestudios untersuchen.

source-99

Leave a Reply