Google stellt mit ImageFX ein weiteres generatives Text-zu-Bild-KI-Tool vor


Google führt eine Reihe von Updates im Bereich der generativen KI ein, darunter ein neues Text-zu-Bild-Tool. Was ist anders? ImageFX ist, dass es über eine Schnittstelle verfügt, die über „ausdrucksstarke Chips“ verfügt. Die Idee dabei ist, dass diese Ihnen dabei helfen werden, „schnell mit angrenzenden Dimensionen Ihrer Kreation und Ideen zu experimentieren“.

Neben dem Debüt von ImageFX hat Google nach eigenen Angaben auch MusicFX und TextFX verbessert. Das Unternehmen behauptet, dass es Upgrades am MusicLM-Modell vorgenommen hat, die eine schnellere Musikerzeugung und eine höhere Audioqualität sowie neue Funktionen umfassen. Generierte Songs können jetzt bis zu 70 Sekunden dauern. Wie für TextFXGoogle hat Updates zur Benutzerfreundlichkeit eingeführt, um die Navigation und das allgemeine Benutzererlebnis zu verbessern.

Von ImageFX generierte Bilder und Audiodateien, die mit MusicFX erstellt wurden, sind mit SynthID gekennzeichnet, einem digitalen Wasserzeichen, das deutlich machen soll, dass diese mithilfe von KI gefälscht sind, insbesondere wenn sie in der Suche oder in Chrome angezeigt werden. ImageFX-Kreationen umfassen auch IPTC-Metadaten. Dies wird laut Google „Menschen mehr Informationen bieten, wann immer sie auf unsere KI-generierten Bilder stoßen“.

Menschen in den USA, Kenia, Neuseeland und Australien können diese neuen und überarbeiteten Tools ab heute in der AI Test Kitchen ausprobieren. Sie sind derzeit nur auf Englisch verfügbar.

Das Imagen 2-Modell unterstützt die neuen Bildgenerierungsfunktionen von ImageFX. Es ist auch die Technologie, die neue generative KI-Optionen in Bard, Search, Ads, Duet AI in Workspace und Vertex AI vorantreibt. Google sagt, dass Imagen 2 dazu beiträgt, die bisher hochwertigsten KI-generierten Bilder zu liefern. Das Unternehmen weist darauf hin, dass das Modell dabei hilft, Bilder frei von Artefakten zu halten und Bereiche der Bilderzeugung verbessert, mit denen solche Tools bisher Probleme hatten.

Darüber hinaus hat Google nach eigenen Angaben „erhebliche Investitionen“ in die Sicherheit der Imagen 2-Schulungsdaten getätigt und gleichzeitig Leitplanken hinzugefügt, um „problematische Ausgaben wie gewalttätige, anstößige oder sexuell eindeutige Inhalte zu begrenzen, sowie Filter anzuwenden, um das Risiko der Generierung von Bildern namentlich genannter Personen zu verringern“. ” Dies liegt an der verbesserten Fähigkeit des Modells, fotorealistische Bilder zu erzeugen. Das Unternehmen gibt an, auch „umfangreiche kontroverse Tests“ durchzuführen, um potenziell problematische und schädliche Inhalte zu erkennen und zu bekämpfen.

Andernorts ist Gemini Pro in Bard ab heute breiter verfügbar. Es ist jetzt zugänglich in mehr als 40 Sprachen und in über 230 Ländern und Territorien. Außerdem gibt Google an, dass Menschen in den meisten Ländern ab heute Bilder erstellen können Barde auf Englisch kostenlos. Diese Bilder enthalten SynthID-Wasserzeichen.

source-115

Leave a Reply