Google Bard ist vielleicht gerade erst gestartet, aber Microsoft hat mit der bevorstehenden Veröffentlichung einer lang erwarteten Funktion, der KI-Bilderzeugung, die Aufmerksamkeit wieder auf sein eigenes Bing mit ChatGPT AI gelenkt.
KI-Kunstgeneratoren sind schon seit einiger Zeit beliebt, aber was Bing mit ChatGPT anders macht, ist das Potenzial für Benutzer, Änderungen über einen Konversationsthread zu erstellen. Genauso wie Sie einen menschlichen Künstler bitten könnten, hier oder da ein paar Änderungen vorzunehmen.
Zum Beispiel Corporate Vice President bei Bing und Microsoft Jordi Ribas (öffnet in neuem Tab) demonstrierte die Funktion, indem er die KI dazu brachte, ein Bild von einem Shih-Tzu zu zeichnen, der ein Boot segelt.
Die KI vervollständigte dies wie erwartet, aber dann bat Ribas die KI, „Farben der Universität von Michigan hinzuzufügen“, die dann den Hund in lila und gelbe Kleidung kleideten und das Boot neu einfärbten. Ein typisches KI-Kunstwerkzeug würde die Farben der Universität nicht kennen und würde erfordern, dass sie explizit erklärt werden.
Ich freue mich, Ihnen mitteilen zu können, dass Bing Image Creator heute für die neue Bing- und Edge-Vorschau eingeführt wird. Jetzt können Sie ein Bild erstellen, indem Sie das Bild, das Sie sehen möchten, einfach mit Ihren eigenen Worten beschreiben. (1/4) pic.twitter.com/kSmvopFJOF21. März 2023
In einem Blogeintrag (öffnet in neuem Tab) Microsoft demonstrierte auch, dass die KI im selben Gespräch zwischen Bild- und Textantworten wechseln kann. Während Textantworten von GPT4 unterstützt werden, wird die Bilderstellung von OpenAIs eigenem Bildtool DALL∙E übernommen.
Obwohl wir den Bing-Chat noch nicht dazu bringen konnten, Bilder zu erstellen, können Sie es mit a versuchen Vorschau (öffnet in neuem Tab) seiner Bilderzeugungstechnologie jetzt. Interessanterweise ein in New York ansässiges Startup hat eine KI entwickelt, die Videos erzeugen kann aus Texten.
Bing gegen Barde
Da Google Bard jetzt für die Öffentlichkeit freigegeben wird (Sie haben immer noch eine Warteliste), können wir damit beginnen, direktere Vergleiche zwischen den beiden anzustellen.
Bard hat derzeit keine multimodalen Fähigkeiten wie die Bildgenerierung, aber es hat kein Turn-Limit. Dies deutet darauf hin, dass Google mehr Vertrauen in sein Chat-Modell hat als Microsoft, das Bing-Gespräche einschränkt, nachdem festgestellt wurde, dass längere Chats dazu führen könnten gehen Sie aus dem tiefen Ende.
In Bezug auf Textantworten scheinen beide Chatbots ziemlich zuversichtlich zu sein, verwenden aber tatsächlich zwei verschiedene Modelle. Bing verwendet GPT4, während Bard das Google-eigene LLAMDA-Modell verwendet.
Bis Bard jedoch mit Bings Imaging-Bemühungen mithalten kann, wird es für Kreative nicht so nützlich (oder so lustig) sein.