Google hat eine Änderung seiner Datenschutzrichtlinie vorgenommen, die das Ausmaß seiner wachsenden KI-Ambitionen klarstellt. Im Wesentlichen sagt der Suchriese, dass alles, was öffentlich im Internet veröffentlicht wird, ein faires Spiel sei, um ausgekratzt und zur Verbesserung von KI-Tools wie seinem ChatGPT-Konkurrenten Google Bard verwendet zu werden.
Zuerst entdeckt von Gizmododas Unternehmen hat seine aktualisiert Politik über das Wochenende, um zu reflektieren, dass es „öffentlich verfügbare Informationen nutzen wird, um die KI-Modelle von Google zu trainieren und Produkte und Funktionen wie Google Translate, Bard und Cloud AI-Funktionen zu entwickeln“.
Dies ist eine bemerkenswerte Änderung gegenüber dem vorherigen Wortlaut der Richtlinie, der besagte, dass Google die Informationen lediglich zum Erstellen von „Sprachmodellen“ für Google Translate verwendet hat. Auch der Chatbot Bard des Unternehmens und der nebulöse Begriff „Cloud AI“ sind jetzt enthalten.
Was bedeutet das? Nun können Nutzer getrost davon ausgehen, dass alles, was über ein Google-Produkt (Suche, Gmail, YouTube) gepostet wird, auf die eine oder andere Weise vom Unternehmen gespeichert und verwendet wird. Aber das geht noch weiter. Der Wortlaut besagt, dass Google ihn verwenden wird öffentlich zugängliche Informationen um seine KI zu trainieren, die im Grunde genommen als alles gelesen werden kann, was im Internet allgemein veröffentlicht wird. Wenn man bedenkt, dass Googles branchenerobernde Suchplattform auf PageRank und seiner Fähigkeit basiert, das Web effektiv zu indizieren, hat dieser KI-Schritt enorme Auswirkungen.
Tom’s Guide hat sich mit Google in Verbindung gesetzt, um weitere Erläuterungen dazu zu erhalten. Wir werden diesen Artikel aktualisieren, wenn wir eine Antwort erhalten.
Google hat auf seiner jährlichen I/O-Konferenz Anfang des Jahres eine Reihe neuer KI-Projekte vorgestellt, darunter auch die Tatsache, dass das gesamte Workspace-Portfolio diese nutzen wird. Der Knackpunkt für viele Organisationen ist jedoch, wo und wie die großen Sprachmodelle (LLMs), die diese Projekte vorantreiben, ihre Informationen erhalten.
Google war gezwungen, die Einführung seines Bard-Chatbots in Europa zu unterbrechen, während die EU erwägt, Regulierungen für KI-Produkte einzuführen. In der Zwischenzeit haben Plattformen wie Reddit und Twitter den kostenlosen Zugriff auf ihre APIs deaktiviert, was es anderen ermöglichte, große Rückstände an Beiträgen herunterzuladen und möglicherweise die Inhalte zu sammeln, um KI zu trainieren.
ChatGPT, derzeit Googles Hauptkonkurrent im KI-Bereich, war nach einer Beschwerde der italienischen Datenschutzbehörden gezwungen, Datenkontrollen für Nutzer weltweit einzuführen. Benutzer können jetzt verlangen, dass das Training nicht auf den von uns bereitgestellten Daten erfolgt.
Aber das ist etwas anderes, als das gesamte öffentliche Web für potenzielles Crawling durch eines der größten Technologieunternehmen der Welt zu öffnen. Während die meisten Internetnutzer den Unterschied zwischen öffentlichem und privatem Internet verstehen sollten, bleibt abzuwarten, was sie davon halten werden, wenn ein öffentlicher Beitrag zu irgendeinem Zeitpunkt plötzlich zum Futter für Googles aufkeimendes KI-Imperium wird.