DF Weekly: Neubewertung von Benchmarking und PC-Gaming-Berichterstattung

Ein weiterer Montag, eine weitere Folge von DF Direct Weekly. Ich selbst, John Linneman und Alex Battaglia kämpfen uns durch die Themen der Woche, einschließlich der ersten Reaktionen auf die Hellblade 2-Vorschauen von letzter Woche – aber worüber ich hier sprechen möchte, ist, wie Alex seine Zeit letzte Woche verbracht hat. Im Direct dieser Woche werden Sie seine Tests mit Intels PresentMon 2.0 sehen, die das Gesicht des PC-Benchmarkings durchaus verändern könnten … zumindest bis zu einem gewissen Grad.

PresentMon bildet die Grundlage für nahezu jedes seriöse Benchmarking-Tool auf dem Markt. Intel war der Vorreiter und fügt neue Funktionen hinzu (mehr dazu in Kürze), aber es wird auch von Unternehmen wie CapFrameX, AMD OCAT und sogar Nvidia FrameView verwendet. Alle von ihnen kombinieren verschiedene Funktionen, aber im Kern ist PresentMon dabei, was die neuesten Ergänzungen interessant macht. Wir haben sie zum ersten Mal entdeckt ein von Gamers Nexus zusammengestelltes Video und wir haben auch gesehen, wie die neuen Funktionen sozusagen „im Zorn“ eingesetzt wurden GNs hervorragende Leistungsbewertung von Dragon’s Dogma 2.

Lassen Sie uns zunächst ganzheitlicher über PresentMon sprechen. Es ist ein großartiges Werkzeug. Im Wesentlichen liefert es genaue Frame-Time-Werte für jeden einzelnen Benchmark-Durchlauf, es berechnet Frame-Raten und die verschiedenen Perzentile, die in den meisten GPU- und CPU-Tests verwendet werden (außer bei uns – wir testen immer noch auf der Grundlage tatsächlicher Frames, die vom PC ausgegeben werden). Sie erhalten außerdem hervorragende Messwerte zu wichtigen Faktoren wie Stromverbrauch, CPU-Kernauslastung und mehr. Viel mehr. Intels erste große Änderung bestand darin, das zu implementieren, was es „CPU Busy“ und „GPU Busy“ nennt. Anstatt Ihnen nur zu sagen, wie lange das Rendern und Präsentieren eines Frames dauert, können wir jetzt sehen, wie viel Zeit CPU und GPU für die Bereitstellung eines bestimmten Frames in Anspruch nehmen – von unschätzbarem Wert für die Ermittlung der Gesamtbalance Ihres Systems.

Mit diesen beiden Variablen können Sie ein „Gleichgewicht“ anstreben, das heißt, die Nutzung dieser Komponenten maximieren, um Spitzenleistungen zu erzielen. Persönlich sind wir bei DF eher an Konsistenz interessiert, die entweder durch eine striktere Festlegung einer Zielbildrate (z. B. 60 fps oder 120 fps) erreicht wird oder durch die Sicherstellung, dass das Spiel immer (oder möglichst nahe daran) GPU-begrenzt ist . Jedes einzelne Bild wird tendenziell ähnlich dargestellt wie das davor und danach, was konsistente Bildzeiten und ein wahrnehmungsmäßig flüssigeres Erlebnis bedeutet, was gut für VRR-Monitore ist. Im Vergleich dazu führt eine CPU-Begrenzung fast immer zu starkem Ruckeln.

Digital Foundry Direct Weekly #157 ist oben eingebettet – ein weiteres zweistündiges Epos.Auf YouTube ansehen
  • 0:00:00 Einführung
  • 0:01:04 News 01: Vorschauen zu Hellblade 2 fallen!
  • 0:26:53 News 02: PS-Portal-Hack vor Veröffentlichung gepatcht
  • 0:34:41 News 03: 90er FPS PO’ed bekommt Nightdive-Remaster
  • 0:41:07 News 04: C-Smash VRS erreicht Meta Quest
  • 0:52:03 News 05: Alex‘ PresentMon-Experimente
  • 1:06:57 News 06: Forderungen der Kampagne: Schluss mit Tötungsspielen!
  • 1:16:19 News 07: Intel aktualisiert XeSS mit überarbeiteten Modi
  • 1:22:04 Unterstützer F1: Wäre es praktischer, für die Leistungsmodi 1440p statt 4K anzustreben?
  • 1:28:11 Unterstützer F2: Dragon’s Dogma 2 hat eine unscheinbare NPC-Dichte, warum kann es also auf Konsolen keine 60 fps erreichen?
  • 1:35:17 Unterstützer F3: Warum implementieren einige Entwickler falsche 30-fps-Framerate-Obergrenzen?
  • 1:43:36 Unterstützer F4: Warum ist die Kompensation niedriger Bildraten bei 120 Hz und VRR auf der PS5 nicht die Standardeinstellung?
  • 1:50:05 Unterstützer F5: Könnte die PS5 Pro leistungsstark genug sein, um fortgeschrittene Path-Trace-Spiele auszuführen?
  • 1:55:04 Unterstützer F6: Da Microsoft möglicherweise Xbox für Dritte öffnet, war der 3DO-Ansatz von Anfang an richtig?
  • 2:01:21 Unterstützer F7: Wäre es besser gewesen, auf die PS5 Pro zu verzichten und stattdessen diese Konsolengeneration zu verkürzen?

Ein weiterer interessanter neuer Datenpunkt ist die „Click-to-Photon“-Latenz, bei der es sich im Wesentlichen um die Zeit handelt, die von der Benutzereingabe bis zur Registrierung auf dem Bildschirm vergeht. Nvidia verfügt über diese Funktion in seinem eigenen FrameView-Tool, das auf „Markern“ basiert, die der Entwickler seinem Code hinzufügen muss (was bei Verwendung von DLSS 3 Frame-Gen natürlich geschieht). Intels Lösung sollte „einfach funktionieren“. Die Latenzüberwachung ist von entscheidender Bedeutung, um Ihnen nicht nur zu sagen, warum sich ein Spiel schlecht zu kontrollieren anfühlt, sondern auch, um eine tatsächliche Zahl anzugeben, was ohne interne Metriken sehr zeitaufwändig ist.

Es spricht also viel dafür, unser bestehendes, auf Frame-Capture basierendes Benchmarking zu aktualisieren – wir sind stolz darauf, sicherzustellen, dass unsere Daten so nah wie möglich am Spielerlebnis sind, was bedeutet, dass nichts die Ergebnisse übertrumpfen kann, die aus der Ausgabe der GPU stammen und über erfasst werden Capture-Karte. Die schiere Fülle an Daten von PresentMon spricht jedoch dafür, stattdessen diese zu verwenden (oder sie tatsächlich mit unseren eigenen Tools zusammenzuführen). Darüber hinaus verfügt das kürzlich veröffentlichte PresetMon 2.0 über eine weitere neue Neuerung: Animationsfehler. Hierbei handelt es sich um eine Form des Stotterns, das in der Videoausgabe tatsächlich auftreten kann, aber nicht unbedingt.

Im Direct dieser Woche spricht Alex über das berüchtigte Star Wars Jedi: Survivor. Selbst wenn wir das Spiel mit 60 Bildern pro Sekunde laufen lassen, wirkt die Bewegung subjektiv „fehl am Platz“. Wenn man die CPU-Auslastung im Verhältnis zur GPU-Auslastung betrachtet, zeigt sich, dass die GPU zwar einwandfrei läuft, die CPU jedoch eindeutig Probleme mit der Konsistenz hat. Kurz gesagt: PresentMon liefert uns objektive Daten, die die subjektiv schlechte Erfahrung erklären. Und das ist erst der Anfang – mit einem ganzheitlicheren Blick auf alle Bereiche der PC-Leistung könnten sich weitere Erkenntnisse ergeben.

Allerdings würde ich auch argumentieren, dass die schiere Datenmenge den Endbenutzer möglicherweise überwältigt, was bedeutet, dass die Verwendung der aktuellen Bildschirmvisualisierungen von PresentMon nur einen gewissen Nutzen für unsere Arbeit hat – also vielleicht der richtige Weg nach vorne Wir möchten unsere aktuellen Grafiktools überarbeiten, um die neuen Daten klarer darzustellen und es uns zu ermöglichen, auszuwählen, welche Variablen angezeigt werden, um die von uns angesprochenen Punkte hervorzuheben.

Bisher haben wir über Spielrezensionen gesprochen, aber der „alle Daten, die ganze Zeit“-Aspekt von PresentMon in Verbindung mit unserem Echtzeit-Grafik-Setup bedeutet, dass wir alle Daten visualisieren können, die wir wollen, aber auch tun also mit mehreren Eingängen (zum Beispiel verschiedene GPUs). Im Moment erfassen wir Frame-Time-Metriken, aber das ist möglicherweise nicht die ganze Geschichte. Eine AMD- und eine Nvidia-GPU können die gleiche Leistung erbringen, andere Aspekte wie CPU-Auslastung oder Stromverbrauch können jedoch sehr unterschiedlich sein. Ein Framerate-Diagramm mit identischer Leistung vermittelt einen anderen Eindruck als ein Diagramm, das auch Echtzeit-Stromverbrauchsmetriken enthält, die möglicherweise zeigen, dass eine Karte einen deutlichen Vorteil gegenüber der anderen hat.

Dies ist erst der Anfang der Gespräche, die wir derzeit bei Digital Foundry führen, während wir darüber nachdenken, von einem System abzuweichen, das wir seit 2013 (mit verschiedenen Upgrades) verwenden. Unser aktuelles Frame-Capture-System lässt sich in das Eurogamer-Grafiksystem integrieren um dynamisch Balkendiagramme und Frame-Time-Messwerte basierend auf unseren Aufnahmen zu generieren, aber mit den Daten in PresentMon sind keine Grenzen gesetzt, wenn es darum geht, Komponentenbewertungen zu verbessern oder sogar Produktempfehlungen anzubieten. Es steht zwar noch am Anfang, aber der Ehrgeiz ist da und die Kerntools werden immer besser.


source site-57

Leave a Reply