Chinesisches Forschungspapier zum analogen KI-Chip „ACCEL“ behauptet 3000-fache Geschwindigkeitssteigerung im Vergleich zu NVIDIA A100- und A800-GPUs


Eine chinesische Forschungsarbeit zeigt, dass „ACCEL“, ein hauseigener analoger KI-Verarbeitungschip, eine 3000-mal schnellere Leistung als die A100- und A800-GPUs von NVIDIA liefern kann.

Der chinesische ACCEL-Analog-KI-Chip bietet Berichten zufolge „3000-mal“ schnellere Leistung als NVIDIAs A100 und A800

Da China unter dem Einfluss globaler Sanktionen steht, scheint es, als würde das Land seine „hausgemachten“ Lösungen rasch verbessern, um das bestehende Tempo des Branchenwachstums aufrechtzuerhalten. Ein von der Tsinghua-Universität in China veröffentlichtes Papier enthüllt, dass das Institut eine neue Technik für KI-Rechenleistung entwickelt und einen Chip namens ACCEL (All-Analog Chip Combining Electronic and Light Computing) entwickelt hat, der im Grunde die Leistungsfähigkeit von Photonik und analoger Technologie nutzt bieten außergewöhnliche Leistung und die veröffentlichten Zahlen sind ziemlich schockierend.

Laut der Veröffentlichung via NaturDer KI-Chip ACCEL ist in der Lage, 4,6 Peta-Operationen pro Sekunde zu liefern, was zwar weit über dem liegt, was die aktuellen Branchenlösungen bieten, aber das ist noch nicht alles. Der Chip ist darauf ausgelegt, die Energieeffizienz aufrechtzuerhalten, da er sonst in der Industrie nicht anwendbar wäre. Das ACCEL verwendet eine „systemische Energieeffizienz“-Architektur, die 74,8 Peta-Operationen pro Sekunde und Watt liefern kann. Damit weicht der Chip, wie die Zahlen zeigen, vom Branchentrend ab, bei dem eine hohe Rechenleistung direkt proportional zu einem höheren Stromverbrauch ist.

Bildquelle: Natur

Ohne irgendeine Art von Echtzeit-Benchmark ist es gerechtfertigt, einen Chip als „den schnellsten der Branche“ zu bezeichnen. Allerdings wurde ACCEL experimentell mit Fashion-MNIST, 3-Klassen-ImageNet-Klassifizierung und Zeitraffer-Videoerkennungsszenarien verglichen, um die Grenzen zu testen der „Deep-Learning“-Leistung des Chips. Er konnte Genauigkeiten von 85,5 %, 82,0 % bzw. 92,6 % liefern, was zeigt, dass der Chip weitreichende Industrieanwendungen hat und nicht nur auf ein bestimmtes Segment beschränkt ist. Das macht die Sache mit ACCEL noch spannender und wir können es kaum erwarten zu sehen, was der Chip für die Zukunft bringt.

Bildquelle: Natur

Lassen Sie uns nun darüber sprechen, wie ACCEL tatsächlich funktioniert. Der Chip kombiniert die Fähigkeiten des diffraktiven optischen Analogrechnens (OAC) und des elektronischen Analogrechnens (EAC) mit Skalierbarkeit, Nichtlinearität und Flexibilität. Um solche Effizienzzahlen zu erreichen, verfügt der Chip über eine optoelektronische Hybridarchitektur auf rein analoge Weise, um bei großen Arbeitslasten massive ADCs (Analog-Digital-Wandlungen) zu reduzieren, was zu einer deutlich verbesserten Leistung führt. Der veröffentlichte Forschungsbericht deckt den Mechanismus des Chips ziemlich ausführlich ab, Sie können ihn sich also ansehen Hierum eine Vorstellung davon zu bekommen, wie die Dinge mit ACCEL funktionieren.

Als hochmoderne GPU verwendeten wir NVIDIA A100, dessen angebliche Rechengeschwindigkeit 156 TFLOPS für float32 erreicht (Ref.33). ACCEL mit zweischichtigem OAC (400 × 400 Neuronen in jeder OAC-Schicht) und einschichtigem EAC (1.024 × 3 Neuronen) erreichte experimentell eine Testgenauigkeit von 82,0 % (horizontale gestrichelte Linie in Abb. 6d,e). Da OAC auf passive Weise rechnet, verbessert ACCEL mit zweischichtigem OAC die Genauigkeit gegenüber ACCEL mit einschichtigem OAC, ohne dass die Latenz und der Energieverbrauch ansteigen (Abb. 6d,e, violette Punkte). Bei einer Echtzeit-Bildverarbeitungsaufgabe wie dem automatischen Fahren auf der Straße können wir jedoch nicht mehrere aufeinanderfolgende Bilder im Voraus erfassen, damit eine GPU ihre Rechengeschwindigkeit durch die gleichzeitige Verarbeitung mehrerer Streams voll ausnutzen kann48 (Beispiele als gestrichelte Linien in Abb. 6d,e). Um sequentielle Bilder seriell mit der gleichen Genauigkeit zu verarbeiten, erreichte ACCEL experimentell eine Rechenlatenz von 72 ns pro Frame und einen Energieverbrauch von 4,38 nJ pro Frame, während NVIDIA A100 eine Latenz von 0,26 ms pro Frame und einen Energieverbrauch von 18,5 mJ erreichte pro Frame.

über die Natur

Wie werden ACCEL und ähnliche Entwicklungen analoger KI-Chips die Branche verändern? Nun, die Beantwortung dieser Frage ist derzeit nicht einfach, da die Einführung analogbasierter KI-Beschleuniger noch Zukunftsmusik ist. Obwohl die Leistungszahlen und -statistiken recht optimistisch sind, ist es wichtig zu beachten, dass ihre „Einführung“ in der Branche nicht so einfach ist, wie es scheint, da sie mehr Zeit, größere finanzielle Ressourcen und gründliche Forschung erfordert arbeiten. Allerdings kann niemand behaupten, dass die Zukunft der Computerbranche rosig aussieht, und es ist nur eine Frage der Zeit, bis wir in der Mainstream-Branche eine solche Leistung sehen.

Nachrichtenquelle: Toms Hardware

Teilen Sie diese Geschichte

Facebook

Twitter

source-99

Leave a Reply