Ampere stellt 192-Core-CPU vor, kontroverse Benchmarks


Ampere hat diese Woche seine vorgestellt AmpereOne-Prozessoren für Cloud-Rechenzentren, die zufällig die ersten Allzweck-CPUs der Branche mit bis zu 132 sind, die für KI-Inferenz verwendet werden können.

Die neuen Chips verbrauchen mehr Strom als ihre Vorgänger – Ampere Altra (die zumindest für eine Weile im Ampere-Sortiment bleiben werden) – aber das Unternehmen behauptet, dass seine Prozessoren mit bis zu 192 Kernen trotz des höheren Stromverbrauchs eine höhere Rechendichte als CPUs bieten von AMD und Intel. Einige dieser Leistungsansprüche können umstritten sein.

192 benutzerdefinierte Cloud Native-Kerne

Die AmpereOne-Prozessoren von Ampere verfügen über 136 bis 192 Kerne (im Gegensatz zu 32 bis 128 Kernen beim Ampere Altra), die mit bis zu 3,0 GHz laufen und auf der firmeneigenen Implementierung der Armv8.6+-Befehlssatzarchitektur (mit zwei 128-Bit-Vektoren) basieren Einheiten, die die Formate FP16, BF16, INT16 und INT8 unterstützen), die mit 2 MB 8-Wege-Set-Assoziativitäts-L2-Cache pro Kern ausgestattet sind (vorher 1 MB) und über ein mechanisches Netzwerk mit 64 Heimknoten und verzeichnisbasiertem Snoop miteinander verbunden sind Filter. Zusätzlich zu den L1- und L2-Caches verfügt der SoC auch über einen 64-MB-Cache auf Systemebene. Die neuen CPUs sind abhängig von der genauen SKU für 200 W – 350 W ausgelegt, beim Ampere Altra sind es 40 W – 180 W.

(Bildnachweis: Ampere)

Das Unternehmen gibt an, dass seine neuen Kerne weiter für Cloud- und KI-Workloads optimiert sind und über Leistungs- und Effizienzsteigerungen bei den Anweisungen pro Takt (IPC) verfügen, was wahrscheinlich einen höheren IPC (im Vergleich zu Arms Neoverse N1, der für Altra verwendet wird) ohne spürbare Steigerung bedeutet hinsichtlich Stromverbrauch und Chipfläche. Apropos Chip-Bereich: Ampere macht keine Angaben dazu, sagt aber, dass der AmpereOne auf einer der 5-nm-Klasse-Prozesstechnologien von TSMC hergestellt wird.

(Bildnachweis: Ampere)

Obwohl Ampere nicht alle Details zu seinem AmpereOne-Kern preisgibt, heißt es, dass sie über einen hochpräzisen L1-Daten-Prefetcher verfügen (reduziert die Latenz, stellt sicher, dass die CPU weniger Zeit mit dem Warten auf Daten verbringt und reduziert den Stromverbrauch des Systems durch Minimierung der Speicherzugriffe). verfeinerte Verzweigungsfehlvorhersage-Wiederherstellung (je früher die CPU eine Verzweigungsfehlvorhersage erkennen und wiederherstellen kann, desto geringer wird die Latenz und es wird weniger Strom verschwendet) und ausgefeilte Speicher-Disambiguierung (erhöht den IPC, minimiert Pipeline-Störungen, maximiert die Ausführung außerhalb der Reihenfolge, senkt Latenz und verbessert die Handhabung mehrerer Lese-/Schreibanforderungen in virtualisierten Umgebungen).

source-109

Leave a Reply