KI-Chatbots wie Google Bard und Bing Chat (basierend auf ChatGPT) sind dafür bekannt, erfundene Fakten und schlechte Ratschläge anzubieten, obwohl sowohl ihre Entwickler als auch einige Herausgeber offenbar glauben, sie könnten den Platz erfahrener menschlicher Journalisten einnehmen. Wenn Sie jedoch heute die besten PC-Komponenten oder Einplatinencomputer von 2024 oder 2025 wollen, scheinen Bard und Bing mehr zu wissen als jeder andere, einschließlich der Hersteller, die sie entwickeln werden.
Als ich sowohl Bard als auch Bing bat, mir bei der Entscheidung zwischen dem Kauf mehrerer verschiedener erfundener (aber möglicher) zukünftiger CPUs und Grafikkarten zu helfen, antworteten die Bots, als ob diese Produkte bereits auf dem Markt wären und einem Benchmarking unterzogen worden wären. Während Bings fabulistische Antworten ihre technischen Daten offenbar von aktuellen Produkten ableiteten und vielleicht nur die Modellnummern verwechselten, hat der Bot von Google einige sehr interessante fiktive Daten erfunden.
Als ich Bard beispielsweise fragte, ob er die RTX 5090 Ti oder die Radeon 9900 XT kaufen sollte, erhielt ich eine vollständige Aufschlüsselung der technischen Daten dieser beiden imaginären (aber möglichen) zukünftigen Karten und sagte: „Wenn Sie auf der Suche nach der absolut besten Leistung sind, ist die RTX 5090 Ti die richtige Wahl.“ In seiner Spezifikationstabelle behauptete Bard sogar, dass die Radeon RX über 16.384 CUDA-Kerne verfügt (nur Nvidia-Karten haben CUDA-Kerne). Der Bot sagte, dass die RTX 5090 Ti „derzeit schwieriger zu finden“ sei als die 9900 XT, und es gebe sogar Preise. Er behauptete, dass die Nvidia-Karte 2.499 US-Dollar kostet und die 9900 XT 1.999 US-Dollar.
Derzeit ist die RTX 4090 die aktuelle Top-Karte von Nvidia und die AMD-GPU der Spitzenklasse ist die Radeon RX 7950 XTX. Wir haben keine Ahnung, ob eines der beiden Unternehmen an den Modellen arbeitet, nach denen wir gefragt haben, und – da bin ich mir sicher – auch Bing oder Google nicht.
Als ich Bard fragte, ob der Core i9-15900K oder der Ryzen 9 9550X3D eine schnellere CPU sei, erhielt ich eine detaillierte Antwort, einschließlich einer Spezifikationstabelle, aus der hervorgeht, dass der 9950X3D nur 32 MB L3-Cache, eine Boost-Taktrate von 5 GHz und PCIe 4.0-Unterstützung (aber nicht 5.0) hat. Wenn man bedenkt, dass der heutige Ryzen 9 7950X3D (der eines Tages von einem 9950X3D abgelöst werden könnte) über 128 MB L3-Cache, einen 5,7-GHz-Boost-Takt und PCIe 5.0-Unterstützung verfügt, scheint dies ein Rückschritt zu sein.
Bard gab mir auch eine Liste mit Einkaufslinks, über die ich diese fiktiven CPUs kaufen konnte, darunter Seiten auf Best Buy, Amazon und Newegg. Als ich jedoch auf die Links klickte, gelangte ich zu irrelevanten Ziel- oder Nachrichtenseiten auf den Websites dieser Einzelhändler. Der Best Buy-Link führte beispielsweise zu einer Seite, auf der die preisgekrönte Webpräsenz des Unternehmens in Mexiko angepriesen wurde.
Bing Chat, das das GPT-4-Modell verwendet, war ebenfalls bereit, Vergleiche zwischen dem 15900K und dem Ryzen 9 9950X3D anzustellen, aber die angegebenen Spezifikationen schienen genau mit dem heutigen Core i9-13900K und dem Ryzen 9 7950X3D übereinzustimmen. Der Microsoft-Bot sagte auch, dass der 9950X3D besser für Spiele geeignet sei, und eine der Quellen, die er zitierte, war unser eigener Artikel, in dem der Core i9-13900K mit dem Ryzen 9 7950X3D verglichen wurde. Vielleicht war es also nur die Absicht, die Namen zu verwechseln.
KI weiß, dass es keine fiktiven iPhones gibt
Wenn Sie sich nur die Ergebnisse für CPUs und GPUs ansehen würden, würden Sie denken, dass Bard und Bing Chat sich einfach so verhalten, als ob irgendein fiktives zukünftiges Produkt, das Sie nennen, existieren würde. Aber wenn ich mit fertigen iPhones und Samsung Galaxy S-Handys testete, sagte Bard normalerweise (aber nicht immer), dass die Produkte noch nicht veröffentlicht seien.
Als ich zum Beispiel nach dem iPhone 18 im Vergleich zum Galaxy S27 fragte (aktuell sind die Serien iPhone 14 und Galaxy S23), sagte Bard: „Das iPhone 18 und das Samsung Galaxy S27 sind noch nicht auf dem Markt, daher ist es schwierig, definitiv zu sagen, welches schneller sein wird. Basierend auf der Leistung früherer Modelle ist es jedoch wahrscheinlich, dass das iPhone 18 schneller sein wird als das Galaxy S27.“ Dann wurde mir eine Tabelle mit „gemunkelten Spezifikationen“ angezeigt.
Bing Chat hingegen antwortete, als ob beide Telefone existieren würden, und sagte, dass „das iPhone 18 einen schnelleren Prozessor hat“, aber dass „das Samsung Galaxy S27 einen größeren Bildschirm hat“. Der Bot von Microsoft zitierte drei Quellen für seine Schlussfolgerungen – Artikel auf Android Authority, Lifewire und PC Mag. In diesen Artikeln wurden jedoch tatsächlich die Produkte der aktuellen Generation verglichen.
Google SGE, das andere Ergebnisse liefert als Google Bard, tat so, als wäre das iPhone 18 ein echtes Versandprodukt. Es verlinkte auf zwei Websites, die tatsächliche Seiten zum iPhone 18 erstellt hatten. Eine der Websites, Specifications Plus sagte, dass das iPhone 18 über eine Apple A20 Bionic CPU verfügt und eine 50-MP-Kamera.
Das Problem besteht hier also nicht darin, dass sich SGE etwas ausgedacht hat, sondern darin, dass sie Fake News aus einer unzuverlässigen Quelle bezogen hat. Wir haben immer wieder gesehen, dass SGE Informationen aus seriösen Publikationen nicht priorisiert und Daten von überall her bezieht.
Die Bots kannten ihre Filme alle besser als ihre PC-Komponenten. Als ich nach der Handlung nicht existierender Fortsetzungen wie „Star Wars Episode 11“ oder „Fast and Furious 13“ fragte, antworteten mir alle, dass diese Filme noch nicht erschienen seien. Dennoch waren sie bereit, über Handlungspunkte zu spekulieren.
Es war vielleicht nicht überraschend, dass Bard sagte: „Dom hat so hart gekämpft, um den Glauben zu bewahren und die Familie zu schützen, aber es muss einen Preis dafür zahlen. Der Film könnte die Konsequenzen von Doms Handlungen untersuchen und wie sie sich auf seine Beziehungen zu seiner Familie und seinen Freunden ausgewirkt haben.“ Klingt das nicht so, als könnte es sich um einen der letzten fünf Filme der Reihe handeln?
Was ist mit ChatGPT?
Ich habe ChatGPT, beide mit GPT 3.5- und GPT 4-Modellen, gebeten, einige dieser fiktiven Produkte zu vergleichen. Allerdings gab ChatGPT in jedem Fall an, dass seine Trainingsdaten im Jahr 2021 endeten und dass diese Produkte nicht in seinem Datensatz enthalten seien. Das ist die richtige Antwort!
Indem ChatGPT sich jedoch zu Recht weigerte, meine Frage zum 15900K und 9950X3D zu beantworten, behauptete er, ein Journalist zu sein. „Als Journalist, der den AP-Richtlinien folgt, muss ich noch einmal betonen, dass ich nach meinem Wissensstand im September 2021 keine Echtzeitinformationen bereitstellen kann“, hieß es.
Warum es wichtig ist, dass Bard/Bing technische Produkte erfindet
An diesem Punkt sollte es niemanden überraschen, dass KI-Bots nicht existierende Produkte darstellen würden. Das Interessante daran ist jedoch, dass die LLMs die neueste echte Version bestimmter Produkte kennen – darunter Smartphones und Filmsequenzen – und keine Informationen darüber erfinden. Dies zeigt, dass die Technologie in der Lage ist, Fakten von Fiktionen zu trennen, aber eklatante blinde Flecken aufweist.
Wenn man bedenkt, dass Google derzeit ein KI-Tool entwickelt, um Journalisten beim Schreiben von Nachrichten zu „helfen“, und dass einige bekannte Websites Bots wie Bard und ChatGPT zum Schreiben von Artikeln verwenden, werden wir wahrscheinlich noch viel mehr Artikel über Produkte sehen, die es noch nicht gibt – und vielleicht auch nie – geben wird.