Stable Diffusion 3 ist ein neuer KI-Bildgenerator, der Text in Bildern nicht durcheinander bringt, behaupten seine Hersteller


Stability AI, das Startup hinter Stable Diffusion, dem Tool, das generative KI nutzt, um Bilder aus Textaufforderungen zu erstellen, enthüllt Stable Diffusion 3, ein Modell der nächsten Generation, am Donnerstag. Stability AI behauptete, dass das neue Modell, das noch nicht allgemein verfügbar ist, die Bildqualität verbessert, besser mit Eingabeaufforderungen funktioniert, die mehrere Themen enthalten, und genaueren Text als Teil des generierten Bildes erstellen kann, was bei früheren Stable Diffusion-Modellen nicht besonders gut war bei.

Emad Mosque, CEO von Stability AI, hat einige Beispiele hierfür auf X gepostet.

Die Ankündigung erfolgt wenige Tage, nachdem OpenAI, der größte Konkurrent von Stability AI, Sora vorgestellt hat, ein brandneues KI-Modell, das aus einfachen Textaufforderungen nahezu realistische, hochauflösende Videos generieren kann. Sora, das der breiten Öffentlichkeit ebenfalls noch nicht zugänglich ist, löste Bedenken hinsichtlich seines Potenzials aus, realistisch aussehende gefälschte Aufnahmen zu erstellen. OpenAI sagte, es arbeite mit Experten für Fehlinformationen und hasserfüllte Inhalte zusammen, um das Tool zu testen, bevor es allgemein verfügbar gemacht werde. Stability AI sagte, dass es dasselbe tue. „[We] „Wir haben angemessene Schritte unternommen und werden dies auch weiterhin tun, um den Missbrauch von Stable Diffusion 3 durch böswillige Akteure zu verhindern“, schrieb das Unternehmen in einem Blogbeitrag auf seiner Website. „Durch die kontinuierliche Zusammenarbeit mit Forschern, Experten und unserer Community erwarten wir, mit Integrität weitere Innovationen voranzutreiben, während wir uns der Veröffentlichung des Modells nähern.“

Es ist nicht klar, wann Stable Diffusion 3 der Öffentlichkeit zugänglich gemacht wird, aber bis dahin kann jeder Interessierte mitmachen eine Warteliste.

source-115

Leave a Reply