Digital Foundry hat kürzlich eine veröffentlicht exklusiver erster Blick auf die Leistung von DLSS 3 auf Nvidias neuen Ada Lovelace-GPUs der RTX 40-Serie. Das Video zeigte beeindruckende FPS-Gewinne auf einer RTX 4090, wobei die Bildrate um bis zu 500 % gesteigert werden konnte. Das Tech-Outlet demonstrierte jedoch auch die Mängel von DLSS 3, wie z. B. eine erhöhte Verzögerung und Artefakte bei den von der KI generierten Frames, die einige unerwünschte Nebenwirkungen im Spielerlebnis hervorrufen können.
DLSS 3 ist eine Revolution von Nvidias Deep Learning Super Sampling und übernimmt nun die Rolle der gleichzeitigen Bereitstellung von Bild-Upscaling und Frame-Generierung. Das bedeutet, dass DLSS 3 ein Bild hochskaliert (wie DLSS 2) und auch selbst KI-erstellte Bilder generiert – was die Bildraten ohne die Hilfe von herkömmlichem 3D-Rendering erheblich erhöht.
Das bedeutet nicht, dass DLSS 2 verschwindet – vielmehr werden DLSS 2 und DLSS 3 parallel existieren, je nachdem, was Spieleentwickler implementieren möchten. DLSS 3 ist einfach die Frame-verstärkte Version von DLSS 2.
Infolgedessen können Sie auch mit DLSS 3 weiterhin die Bildqualitätsvoreinstellungen von DLSS 2 auswählen, z. B. Qualität, Ausgewogen und Leistung.
Die Technologie funktioniert, indem zwei physische Frames gerendert werden – die von den GPU-Kernen generiert und von DLSS hochskaliert werden – und dann ein KI-generiertes Frame direkt in die Mitte dieser beiden anderen Frames eingefügt wird. Infolgedessen werden die Bildraten immens gesteigert, aber die Eingangsverzögerung wird aufgrund der Wartezeit für das Zurückhalten beider Bilder zum Generieren des AI-Bildes stark erhöht.
Um dem entgegenzuwirken, verlangt Nvidia, dass alle DLSS 3-fähigen Spiele mit der Nvidia Reflex-Technologie ausgestattet sind, um den Input-Lag so gering wie möglich zu halten.
Derzeit unterstützt DLSS 3 nur GPUs der RTX 40-Serie, da die Technologie einen leistungsfähigeren optischen Flussbeschleuniger erfordert, der derzeit nur in der Ada Lovelace-GPU-Mikroarchitektur vorhanden ist. Nvidia sagt, dass DLSS 3 technisch gesehen auf früheren Generationen von RTX-GPUs laufen kann, aber diese älteren GPUs sind nicht leistungsfähig genug, um DLSS 3 gut auszuführen.
Infolgedessen besteht technisch gesehen die Möglichkeit, dass eine Variation von DLSS 3 den Weg zu den GPUs der RTX 20- und 30-Serie findet – aber es ist höchst unwahrscheinlich. Vom Standpunkt der Softwareoptimierung aus würde es ein Wunder erfordern, um es zum Laufen zu bringen.
Leistungsmerkmale
Digital Foundry erhielt drei verschiedene Titel mit DLSS 3-Integration zur Ansicht, einschließlich Test-Builds von Cyberpunk 2077, Portal RTX und Spider-Man Remastered – alle laufen auf einer GeForce RTX 4090. Aufgrund von Embargo-Einschränkungen konnte Digital Foundry nur prozentuale Steigerungen und keine statischen Framerate-Ergebnisse liefern.
Im Cyberpunk 2077, Digital Foundry sah einen 3,9-fachen Leistungsmultiplikator mit aktiviertem DLSS 3 im Vergleich zur Ausführung des Spiels mit einer nativen 4k-Auflösung. DLSS 3 ist im Leistungsmodus 2,5-mal langsamer als DLSS 2 – langsamer ist „nur“ 2,5-mal schneller als die native Auflösung.
Spider Man Remastered zeigte einen deutlich geringeren Leistungsschub, wobei DLSS 3 nur einen 2-fachen FPS-Multiplikator gegenüber der nativen 4k-Auflösung bietet. Aber es war immer noch viel schneller als der DLSS 2-Leistungsmodus, der nur eine Steigerung der Bildrate um 9 % gegenüber dem nativen Modus bietet. (Der Grund für die niedrigen Leistungsergebnisse von DLSS 2 sind CPU-Engpässe.)
Portal-RTX zeigte den größten Leistungssprung mit DLSS 3 – mit einem satten 5,5-fachen Bildratenschub gegenüber nativem 4k-Rendering. DLSS 3 war im Leistungsmodus 2,2-mal schneller als DLSS 2 – obwohl DLSS 2 immer noch eine 3,3-fache Leistungsverbesserung gegenüber der nativen Auflösung bietet. (Es ist erwähnenswert, dass Portal-RTX ist im YouTube-Video mit etwa 20 FPS bei 4k native zu sehen, sodass die native Framerate für dieses Spiel von Anfang an unglaublich niedrig ist – insbesondere für eine RTX 4090).
Die DLSS 3-Leistung skaliert besser bei niedrigeren nativen Bildraten
Die Analyse von Digital Foundry zeigt, dass DLSS 3 am besten funktioniert, wenn die nativen Bildraten sehr niedrig sind, und die Leistungsvervielfachung abnimmt, wenn die nativen Bildraten steigen. Dies zeigt sich bei Portal-RTXwo Sie die Bildratenunterschiede tatsächlich visuell von der nativen zur DLSS 2- und 3-Version sehen können.
Dies wird verglichen mit Spider Man Remastered, das bei maximalen Einstellungen auf Flaggschiff-Hardware nicht so schwer zu laufen ist – und Frameraten von weit über 60 FPS erreichen kann, solange Sie keinen CPU-Engpass haben. Aus diesem Grund sehen wir in diesem Titel die niedrigsten DLSS 3-Multiplikationsgewinne.
Dieser Nebeneffekt macht bei der Funktionsweise von DLSS 3 sehr viel Sinn – DLSS 3 muss mehrere Millisekunden warten, nachdem es zwei vollständige Frames generiert hat, um dann ein AI-Bild zu rendern, bevor alle drei Frames auf Ihrem Display freigegeben werden. Diese zusätzliche Wartezeit verringert kontinuierlich die Bildratengewinne von DLSS 3, wenn die Bildraten insgesamt steigen.
Selbst in Umgebungen mit hohen FPS bietet DLSS 3 jedoch immer noch höhere FPS-Boosts als DLSS 2 im Leistungsmodus, daher vermuten wir, dass dies nur bei ultrahohen Bildraten ein Problem sein wird – über 700 FPS oder so ähnlich.
Es bedeutet jedoch, dass DLSS 3 für Wettkampfschützen, wie z Overwatch und Apex-Legendenwo der Input-Lag genauso wichtig ist wie hohe FPS.
Input-Lag-Analyse
Digital Foundry zeigt, dass die Kombination von DLSS 3 mit Nvidia Reflex die Technologie wirklich zum Leuchten bringt. Im Portal-RTXwurde die Eingangsverzögerung von DLSS 3 bei 56 ms fast halbiert – im Vergleich zum nativen 4k-Rendering mit aktiviertem Reflex bei 95 ms (es waren 129 ms ohne es).
Im Cyberpunk 2077, die Gewinne sind unterschiedlich, aber immer noch gut für die DLSS 3/Nvidia Reflex-Kombination. Bei nativem 4k mit aktiviertem Reflex sah Digital Foundry einen Durchschnitt von 62 ms (108 ms ohne Reflex). Mit DLSS 3 und Reflex ging dies auf 54 ms zurück. Aber die Eingangsverzögerung war am niedrigsten – 31 ms mit aktiviertem Reflex und 42 ms mit deaktiviertem Reflex – mit DLSS 2 im Leistungsmodus.
Dasselbe Verhalten ist in zu sehen Spider Man – mit einer Eingangsverzögerung von 36 ms bei aktiviertem Reflex bei nativem 4K (39 ms bei ausgeschaltetem). DLSS 3 und Reflex lagen mit 38 ms dazwischen. Und DLSS 2 im Leistungsmodus zeigte die niedrigste Eingangsverzögerung: 23 ms mit eingeschaltetem Reflex und 24 ms mit ausgeschaltetem Reflex.
Es ist schade, dass DLSS 3 nicht ohne Reflex verwendet werden kann, aber die Ergebnisse des DLSS 2-Leistungsmodus zeigen uns, dass die Nvidia Reflex-Technologie einen Großteil der Schwerarbeit leistet, wenn DLSS 3 aktiviert ist, und die Eingangsverzögerung stark auf ein spielbares Niveau reduziert.
Bildqualität
Eines der vielleicht interessantesten Themen rund um DLSS 3 ist die Bildqualität der KI-generierten Frames. Digital Foundry hat dies ebenfalls getestet und fand DLSS 3 überraschend gut (wenn auch nicht perfekt).
Es sieht so aus, als ob die Schwäche von DLSS 3 in der verborgenen Geometrie liegt, wo Informationen zwischen zwei Frames fehlen, weil die Geometrie während der Bewegung einen anderen Satz von Geometrien überlappt. Dies kann dazu führen, dass DLSS 3 „shuttert“ und hässliche Artefakte ausgibt, wenn es versucht, die Lücke fehlender Details zu füllen.
Aber alles andere an den Bildern sieht solide aus, mit sehr wenigen Problemen.
Digital Foundry sagt, dass sie DLSS 3 gründlicher testen müssen, sobald sie eine strengere Testmethode herausgefunden haben. Sie haben keine Möglichkeit gefunden, zu demonstrieren, ob die Geometrieprobleme von DLSS 3 in Echtzeit zu sehen sind, da die Bildraten bei DLSS 3 ohnehin so hoch sind.
Soweit wir das beurteilen konnten, sind die gelegentlichen Artefakte von DLSS 3 nicht in Echtzeit sichtbar – aber wir wissen nicht, wie das Spiel mit DLSS 3 im wirklichen Leben aussehen wird, aufgrund von Komprimierungs- und Bildratenbeschränkungen auf YouTube. Bleiben Sie dran für unsere eigenen DLSS 3-Tests in naher Zukunft.