Chinas Antwort auf ChatGPT verfälscht seine ersten Zeilen


Chinas Zensurregime verlangt von Baidu und anderen Internetunternehmen, den Zugang zu bestimmten Websites zu sperren und politisch heikle Themen zu vermeiden. Die zu blockierenden Wörter oder Phrasen können als Reaktion auf Proteste oder während besonderer Ereignisse schnell aktualisiert werden.

Aber Jeffrey Ding, ein Assistenzprofessor an der Georgetown University, der sich mit Chinas Technologieindustrie befasst, sagt, dass Bedenken hinsichtlich der Zensur die Entwicklung großer Sprachmodelle in China anscheinend nicht verlangsamt haben. Er stellt fest, dass Baidu das Ernie-Sprachmodell, das seinem neuen Bot zugrunde liegt, seit einiger Zeit über eine API verfügbar macht und dass andere Unternehmen ähnliche Modelle angeboten haben.

Baidu hat keine Details zu den Trainingsdaten von Ernie Bot angegeben, aber sie wurden höchstwahrscheinlich aus dem chinesischen Internet geschabt. Das bedeutet, dass das Ausgangsmaterial des Bots bereits größtenteils durch Chinas Zensurregeln kuratiert wurde, die beispielsweise darauf abzielen, Kritik an der Regierung einzuschränken.

Die Zensur könnte sich auch auf subtilere Weise auf chinesische Chatbots auswirken. Ein akademisches Forschungsprojekt aus dem Jahr 2021, das Algorithmen auf der in China gesperrten chinesischsprachigen Version von Wikipedia und Baidu’s Baike, einer Crowdsourcing-Enzyklopädie, die der staatlichen Zensur unterliegt, trainierte, fand heraus, dass die Verwendung zensierter Trainingsdaten die Bedeutung, die KI-Software zuwies, erheblich veränderte zu verschiedenen Wörtern.

Der auf der chinesischsprachigen Wikipedia trainierte Algorithmus verknüpfte die Wörter „Demokratie“ eher mit positiven Wörtern wie „Stabilität“. Der mit dem zensierten Baike-Material trainierte Algorithmus stellte „Demokratie“ näher am „Chaos“ dar, mehr im Einklang mit der Politik der chinesischen Regierung. Da Chatbots wie ChatGPT jedoch äußerst flexibel sein und Material in ihren Trainingsdaten neu mischen können, musste Baidu wahrscheinlich zusätzliche Sicherheitsvorkehrungen treffen

Trotz seines gemischten Empfangs scheint Ernie Bot ein fähiger Konkurrent von ChatGPT zu sein. Der Bot ist derzeit nur für eine begrenzte Anzahl von Benutzern verfügbar, von denen einige sagen, dass sie beeindruckt sind. ChatGPT ist in China nicht verfügbar, obwohl es in der Lage ist, sich auf Chinesisch zu unterhalten.

Lei Li, ein auf KI spezialisierter Professor an der UC Sant Barbara, der zuvor an der Technologie gearbeitet hat, die zum Aufbau eines Teils des maschinellen Lernens hinter dem Ernie-Bot verwendet wurde, weist darauf hin, dass Baidu seit etwa einem Jahrzehnt an der zugrunde liegenden Technologie arbeitet. Im Gegensatz dazu hat Microsoft die Kerntechnologie für Bings neuen Chatbot und einige bevorstehende Textgenerierungsfunktionen für Office von OpenAI lizenziert, in das es Milliarden von Dollar investiert hat, als Gegenleistung für exklusive Rechte an seinen Kreationen.

Li sagt auch, dass er auch von einigen der Möglichkeiten von Ernie Bot beeindruckt ist, einschließlich seiner Fähigkeit, Geschichten und Geschäftsberichte zu erstellen. Er fügt hinzu, dass das Halluzinationsproblem eine Herausforderung für alle diese Sprachmodelle darstellt. „Hier müssen die Forscher noch arbeiten“, sagt er.

Ein WeChat-Poster verglichen die demonstrierten Fähigkeiten des chinesischen Bots mit denen von ChatGPT und fand es besser im Umgang mit chinesischen Redewendungen und in einigen Fällen genauer. Zum Beispiel behauptete ChatGPT fälschlicherweise, dass das Stammhaus des Science-Fiction-Autors Liu Cixin, der schrieb Das Dreikörperproblem, ist Hubei, während Ernie Bot Henan richtig beantwortet hat. ChatGPT ist in China blockiert, aber viele Menschen haben Wege gefunden, darauf zuzugreifen.

source-114

Leave a Reply