Intel Sapphire Rapids Xeon CPUs zeigen überraschende Ergebnisse im Vergleich zu AMD EPYC Genoa in AVX-512


Intels Xeon-Familie der 4. Generation, Sapphire Rapids, hat einige überraschende Ergebnisse gegen AMDs EPYC Genoa-Reihe bei AVX-512-Workloads gezeigt.

AVX-512-Leistungsbenchmarks auf AMD Genoa-, Intel Sapphire Rapids- und Ice Lake-CPUs durchgeführt

Letzte Woche hat Intel die skalierbare Xeon-Prozessoren der vierten Generation, auch bekannt als Sapphire Rapids, auf den Markt gebracht, die eine höhere Leistung für serverbasierte Prozessoren versprechen. Sie führten eine brandneue ISA, Advanced Matrix Extensions und mehr ein, um die Verbesserung der künstlichen Intelligenz und des maschinellen Lernens zu erweitern.

Mit dem AVX-512-Erweiterungsset, das auch in KI, HPC und ML verwendet wird, mussten jedoch beim Start weitere Informationen zu den Verbesserungsgewinnen für die skalierbaren Prozessoren vorliegen. Michael Larabel, Linux-Analyst und Herausgeber der Linux-Hardware-Website Phoronix, haben den neuen Prozessor zahlreichen Benchmarks unterzogen. Sie haben es mit seinem Vorgänger Ice Lake und den neuen Genoa-Prozessoren von AMD verglichen, und die Ergebnisse sprechen für sich.

Larabel initiierte mehrere Tests über die Phoronix Test Suite, Phoromatic und die OpenBenchmarking-Website, auf der er der leitende Entwickler aller Projekte ist. Die an den drei CPUs durchgeführten Tests basierten alle auf dem Testen der AVX-Leistung bei Workloads wie:

  • Neural Magic DeepSparse – Eine CPU-Laufzeit, die die in neuronalen Netzwerken gefundene Sparsity nutzt, führt zu einem Nebenprodukt der Verringerung der Rechenleistung.
  • LCnull – Diese Schachsoftware, auch bekannt als Leela Chess Zero, implementiert das UCI-Protokoll und erfordert eine Schach-GUI ähnlich der Arena Chess GUI, BanksiaGUI, Cutechess, Nibbler und Chessbase.
  • Embree – Embree wurde von Intel entwickelt und ist eine Reihe von Raytracing-Kernels, die Grafikanwendungsingenieuren dabei helfen, die Leistung von fotorealistischen Rendering-Anwendungen zu verbessern.
  • OpenVKL – Open VKL wurde ebenfalls von Intel entwickelt und mit Open-Source-Software entwickelt, die mit Open VDB gespeicherte Daten versteht und ohne Konvertierung darauf zugreifen kann.
  • Bild entrauschen öffnen – Intel Open Image Denoise baut auf der Intel oneAPI Deep Neural Network Library auf, auch bekannt als oneDNN. In Echtzeit nutzt es moderne Befehlssätze wie Intel SSE4, AVX2 und AVX-512. Dies geschieht, damit das Exploit eine hohe Rauschunterdrückungsleistung erzielt.
  • OSPRay (Studio) – OSPRay Studio von Intel ist ein interaktives Open-Source-Raytracing- und Visualisierungsprogramm.
  • einDNN – Die Intel oneAPI Deep Neural Network Library (oder oneDNN) bietet eine optimierte Deep-Learning-Bausteinleistung.
  • CPUminer-opt – Cpuminer-opt ist eine CPU-Mining-Software, die in zwei separate Versionen aufgeteilt ist – CPUminer-opt und CPUminer-gr, die für die Raptoreum-Kryptowährung verwendet wird.
  • OpenVINO – Open Visual Inference and Neural Network Optimization ist ein kostenloses Toolkit, das bei der Optimierung von Deep-Learning-Modellen aus einem einzigen Framework hilft und sie mithilfe einer Inferenz-Engine auf Intel-Hardware einsetzt, wobei Intel das Unternehmen ist, das das Toolkit erstellt hat.
  • miniBUDE – eine Kernberechnung der Bristol University Docking Engine, die in anderen HPC-Programmiermodellen zu finden ist.
  • SMHasher – SMHasher ist “eine Testsuite, die entwickelt wurde, um die Verteilungs-, Kollisions- und Leistungseigenschaften von nicht-kryptografischen Hash-Funktionen zu testen”.

Die in den meisten Tests aktiven AVX-512-Erweiterungen zeigten gute Gewinne für alle CPUs, aber Sapphire Rapids Xeon-CPUs verzeichneten mit AVX-512 den größten Gewinn von bis zu 44 %, während EPYC Genoa einen Gewinn von 21 % verzeichnete.

Überraschenderweise lieferte Intel mit AVX-512 nicht nur einen größeren Leistungsgewinn, sondern auch die beste Effizienz, was ordentlich ist, wenn man bedenkt, dass AMD den AVX-512 für EPYC Genoa-Chips stark vermarktet hat, während Intel nicht viel über AVX-512 auf seinem Sapphire gesprochen hat Rapids-Chips. Mit aktiviertem AVX-512 konnten die Intel Sapphire Rapids-CPUs die Genoa-Teile erreichen oder übertreffen und nur mit AVX-512 waren die EPYC-Chips in der Lage, den Boost-Uplift zu liefern. Nachfolgend ist, was Phoronix zu ihren Ergebnissen zu sagen hatte:

Das geometrische Mittel zeigt auch, wie wichtig AVX-512 für den Erfolg von EPYC Genoa der 4. Generation ist, da es gegenüber Xeon Scalable der 4. Generation für HPC-Workloads wettbewerbsfähig ist. Hätte Zen 4 AVX-512 nicht hinzugefügt, lagen die Ergebnisse für EPYC 9654 2P AVX-512-deaktiviert direkt hinter dem Xeon Platinum 8490H 2P mit aktiviertem AVX-512. Ein Zen 4-Serverprozessor ohne AVX-512 wäre bei mehr Workloads ein Kopf-an-Kopf-Rennen zwischen Sapphire Rapids und Genoa gewesen. Aber stattdessen war der EPYC 9654 2P mit AVX-512 in dieser Reihe von Benchmarks 19 % schneller als die Xeon Platinum 8490H-Prozessoren.

Ich bin ziemlich überrascht, dass Intel seine AVX-512-Verbesserungen mit Xeon Scalable der 4. Generation bei der Markteinführung nicht deutlicher beworben hat, aber auf jeden Fall ist es gut zu sehen, dass AVX-512 einen größeren Auftrieb bietet, während es auch keinen signifikanten Einfluss auf den Stromverbrauch hat das war bei früheren Generationen von AVX-512-Prozessoren zu beobachten. Dies kann für viele vorhandene Software sofort von Vorteil sein, verglichen mit der Notwendigkeit, sich anzupassen, um AMX und die neuen Beschleuniger zu nutzen. Hoffentlich wird dieser effizientere AVX-512 mit Sapphire Rapids gepaart mit AMD Zen 4-CPUs, die jetzt AVX-512 haben, dazu führen, dass mehr Softwareentwickler AVX-512-Optimierungen für ihre Software in Betracht ziehen.

über Phoronix

Larabel geht davon aus, dass Entwickler weiterhin die bereits auf dem Markt befindliche AVX-512-kompatible Software verwenden und den Aufwand für die Anpassung an das neuere AMX-Erweiterungsset verringern werden, wo neuere Beschleuniger weiteres Lernen und Verständnis von Entwicklungsteams benötigen würden.

Teilen Sie diese Geschichte

Facebook

Twitter

source-99

Leave a Reply