OpenAI stellt einen leistungsstarken, gruseligen neuen Text-zu-Video-Generator vor, den es als „eine Grundlage für Modelle, die die reale Welt verstehen und simulieren können“ bezeichnet.


Das generative KI-Unternehmen hinter ChatGPT und DALL-E hat ein neues Spielzeug: Sora, ein Text-zu-Video-Modell, das (manchmal) ziemlich überzeugende 60-Sekunden-Clips aus Aufforderungen wie „Eine stilvolle Frau geht eine Straße in Tokio entlang“ generieren kann. .“ und „ein Filmtrailer mit den Abenteuern des 30-jährigen Weltraummanns, der einen roten Wollstrick-Motorradhelm trägt …“

Ein Großteil der KI-Videogeneration, die wir bisher gesehen haben, schafft es nicht, eine konsistente Realität aufrechtzuerhalten und Gesichter, Kleidung und Objekte von einem Bild zum nächsten neu zu gestalten. Sora „versteht jedoch nicht nur, wonach der Benutzer in der Eingabeaufforderung gefragt hat, sondern auch, wie diese Dinge in der physischen Welt existieren“, sagt OpenAI seinen Ankündigungsbeitrag (Verwendung des Wortes „versteht“ locker).

Beitrag auf imgur.com ansehen”

source-83

Leave a Reply