Was du wissen musst
- Koreanische Wissenschaftler haben kürzlich ein neues KI-Bilderzeugungsmodell namens KOALA entwickelt.
- Im Gegensatz zu anderen Modellen wie Microsofts Image Creator von Designer bietet das Tool eine schnellere Bildgenerierungsgeschwindigkeit.
- Es nutzt eine neue Technik namens Wissensdestillation, die die Größe eines Open-Source-Bildgenerierungstools namens Stable Diffusion XL komprimiert.
- Auf diese Weise können Bilder auch auf alten PCs mit veralteten GPUs schneller generiert werden.
Ein neuer KI-gestützter Bildgenerator ist in Sicht und könnte es möglicherweise mit Microsofts Image Creator von Designer (ehemals Bing Image Creator), Midjourney und dem DALL-E 3-Modell von OpenAI aufnehmen.
Das neue Tool kann Bilder in weniger als zwei Sekunden generieren, deutlich schneller als ein durchschnittliches Bildgenerierungstool. Laut einem Spot von Live-WissenschaftDie südkoreanischen Wissenschaftler hinter dieser neuen Erfindung nutzten eine neue Technik namens Wissensdestillation, die die Größe eines Open-Source-Bildgenerierungstools namens Stable Diffusion XL komprimiert.
Zum Vergleich: Stable Diffusion XL verfügt über bis zu 2,56 Milliarden Parameter. Wie Sie vielleicht bereits wissen, ist KI beim Training stark auf vorhandene Inhalte, einschließlich Bilder, angewiesen. Dieser große Satz an Parametern erklärt, warum das Generieren von Bildern etwas Zeit in Anspruch nehmen kann. Mit dieser neuen Technik reduzierten die Wissenschaftler jedoch die Parameter für ihr kleinstes Modell, KOALA, auf 700 Millionen.
Somit kann das Tool Bilder im Bruchteil einer Sekunde erzeugen. Das Bilderzeugungsmodell erfordert keine High-End-GPUs und hochentwickelten Geräte, um reibungslos zu funktionieren. Zum Generieren von Bildern sind nur etwa 8 GB RAM erforderlich. Im Wesentlichen siebt die Wissensdestillationstechnik Informationen vom großen Modell zum kleineren, ohne die Qualität oder Leistung zu beeinträchtigen. Auf diese Weise ist das kleinere Modell in der Lage, schneller qualitativ hochwertige Bilder zu erzeugen.
VERWANDT: Die Bildgenerierungsgeschwindigkeit von Microsofts Image Creator ist unerträglich schmerzhaft
Entsprechend von den Wissenschaftlern geteilte BenchmarksDamit ist KOALA deutlich schneller als die DALL-E 3- oder DALL-E 2-Modelle von OpenAI. Als ich aufgefordert wurde, „ein Bild eines Astronauten zu erstellen, der unter dem Mond auf dem Mars ein Buch liest“, dauerte ersteres 13,7 Sekunden und letzteres 12,3 Sekunden. KOALA brauchte nur 1,6 Sekunden, um das Bild zu erzeugen.
Es gibt fünf Versionen von KOALA. Drei Versionen des Modells generieren Bilder basierend auf Textaufforderungen, während die verbleibenden zwei Versionen (Ko-LLaVA) sowohl Bilder als auch Videos generieren können (ähnlich wie das Sora-Modell von OpenAI).
Die koreanischen Wissenschaftler des Electronics and Telecommunication Research Institute (ETRI) teilten ihre Arbeit und Erkenntnisse im Open-Source-KI-Repository Umarmendes Gesicht und das arXiv-Datenbank.
Die Wissenschaftler beabsichtigen, diese Modelle in bestehende Bilderzeugungsdienste, Inhaltsproduktion und mehr zu integrieren.