Nvidia hat mit seinen Ada Lovelace-Grafikkarten der nächsten Generation eine massive Steigerung der Raytracing-Leistung angekündigt, und das ist nicht alles auf die riesige Anzahl von CUDA-Kernen zurückzuführen, die Nvidia in seine GPU der nächsten Generation gesteckt hat (obwohl sie bis zu 18.000 haben wird). von diesen).
Ein wichtiger Teil dieser Beschleunigung ist eine neue Technologie, die Nvidias CEO Jensen Huang Shader Execution Reordering (SER) nennt. Dies “plant die Arbeit spontan neu”, was eine 2/3-fache Geschwindigkeit für Raytracing auf Ada Lovelace-Karten ergibt. Huang vergleicht dies mit einer technischen Entwicklung von der gleichen Bedeutung wie die Out-of-Order-Ausführung für CPUs, die heute in so ziemlich jeder CPU ein wichtiges Merkmal ist.
Dann haben Sie die offensichtliche Verbesserung: einen neuen RT Core. Der RT Core ist der Haupttreiber der Raytracing-Leistung in Nvidias RTX-Grafikkarten und wurde bereits mit der RTX 30-Serie grundlegend überarbeitet. Mit Ada Lovelace wird es wieder größer und besser und bietet 200 RT TFLOPS Leistung und den doppelten Durchsatz der Strahlendreieckskreuzung.
Das liegt teilweise an zwei neuen Hardwareeinheiten im RT Core: einer neuen Opazitäts-Micromap-Engine, die „das Raytracing der Alpha-Testgeometrie um den Faktor zwei beschleunigt“, und einer neuen Micromesh-Engine, die „den geometrischen Reichtum ohne die Bau- und Lagerkosten von BVH.”
Dann gibt es noch den neuen Tensor Core. Tensor Cores sind der Beschleuniger hinter Anweisungen, die für maschinelles Lernen und ähnliches verwendet werden, und dieser neue Tensor Core der 4. Generation bietet 1.400 TFLOPS Tensor-Programmierung und die Hopper FP8 Transformer Engine, direkt aus der Hopper-Architektur, die Nvidia zuvor für Rechenzentren angekündigt hatte.
Diese ganze Änderung läuft also im Wesentlichen auf eine große Verschiebung der Raytracing-Leistung hinaus, und Huang erklärt, dass es notwendig war, die Raytracing-Leistung von Ada Lovelace zu steigern, weil „Raytracing notorisch schwer zu parallelisieren ist“. Im Wesentlichen erfordert Raytracing den Zugriff auf viele verschiedene Dinge auf der GPU zu unterschiedlichen Zeiten.
Hier kommt SER ins Spiel, da dieser Block die Effizienz beim Raytracing verbessert, „indem er Shading-Arbeitslasten spontan neu plant, um die GPU-Ressourcen besser zu nutzen“.
„Wir sehen eine bis zu zwei- bis dreifache Steigerung beim Raytracing und eine 25-prozentige Steigerung der Gesamtleistung des Spiels“, fährt Huang fort.
Der andere Teil des Raytracing-Puzzles, obwohl nicht direkt mit der GPU-Hardware per se verbunden, ist die Veröffentlichung von DLSS 3.0, von dem Nvidia erwartet, dass es erneut dazu beitragen wird, die Bildraten mit aktivierten RTX-Funktionen zu erhöhen, wie es DLSS zuvor getan hat. Natürlich haben wir heutzutage mehr Optionen als DLSS für Superauflösung, aber es hat sich als nützliche und geschickte Option erwiesen, daher ist es gut zu sehen, dass weitere Verbesserungen auf dem Weg sind.
Und natürlich, was nützen Informationen über die neue Ada-Lovelace-Architektur ohne ein Wort von der eigentlichen Grafikkarte, die man um sie herum bauen kann: die RTX 4090 (öffnet in neuem Tab). Das kommt am 12. Oktober für 1.599 $ an. Es sind auch zwei Modelle der RTX 4080 auf dem Weg, ein 12-GB-Modell und ein 16-GB-Modell, ab 899 US-Dollar.