Die IBM-Antwort auf den kostengünstigen Supercomputer läuft bereits seit einigen Monaten, hat aber erst kürzlich handfeste Informationen über ihr sogenanntes Vela-Projekt preisgegeben.
Wenden wir uns seinem zu bloggen (öffnet in neuem Tab) Um Details zu besprechen, enthüllte IBM, dass die von fünf Mitarbeitern des Unternehmens verfasste Studie die Probleme früherer Supercomputer und ihre mangelnde Bereitschaft für KI-Aufgaben angeht.
Um das Supercomputer-Modell für diese zukünftige Art von Arbeitslast zu optimieren, wirft das Unternehmen einen Blick auf die Entscheidungen, die es in Bezug auf den Einsatz erschwinglicher, aber leistungsstarker Hardware getroffen hat.
IBMs Supercomputer Vela AI
Die Arbeit hebt hervor, dass „Gebäude a [traditional] Supercomputer bedeutet Bare-Metal-Knoten, Hochleistungs-Netzwerkhardware … parallele Dateisysteme und andere Elemente, die normalerweise mit Hochleistungsrechnen (HPC) in Verbindung gebracht werden.“
Obwohl klar ist, dass diese Supercomputer hohe KI-Arbeitslasten bewältigen können, einschließlich der für OpenAI, das Startup hinter der beliebten ChatGPT-Live-Chat-Software, entworfenen, hat ein Mangel an Optimierung dazu geführt, dass traditionellen Supercomputern wertvolle Leistung fehlt und sie in anderen Bereichen einen Überschuss haben was zu unnötigen Ausgaben führt.
Während es seit langem anerkannt ist, dass Bare-Metal-Knoten am besten für KI geeignet sind, wollte IBM untersuchen, ob diese innerhalb einer virtuellen Maschine (VM) angeboten werden. Das Ergebnis sind laut Big Blue enorme Leistungssteigerungen.
„Nach umfangreicher Recherche und Entdeckung haben wir eine Möglichkeit entwickelt, alle Funktionen des Knotens (GPUs, CPUs, Netzwerke und Speicher) in der VM verfügbar zu machen, sodass der Virtualisierungs-Overhead weniger als 5 % beträgt, was das Richtige ist die niedrigsten Gemeinkosten in der Branche, die wir kennen.“
In Bezug auf das Node-Design ist Vela mit 80 GB oder GPU-Speicher, 1,5 TB DRAM und vier 3,2 TB NVMe-Speicherlaufwerken ausgestattet.
Die nächste Plattform (öffnet in neuem Tab) Schätzungen zufolge, wenn IBM seinen Supercomputer in die Top500-Rangliste aufnehmen wollte, würde er rund 27,9 Petaflops an Leistung liefern und ihn laut der Rangliste vom November 2022 auf Platz 15 platzieren.
Während die heutigen Supercomputer derzeit in der Lage sind, KI-Arbeitslasten zu bewältigen, unterstreichen enorme Entwicklungen in der künstlichen Intelligenz in Verbindung mit dem dringenden Bedarf an Kosteneffizienz die Notwendigkeit einer solchen Maschine.