Künstliche Intelligenz ist für mich wie Magnete: Ich habe keine Ahnung, wie sie funktionieren. Aber ich verstehe ganz allgemein, dass KI nicht wirklich intelligent ist. Es handelt sich lediglich um Daten, die in großem Umfang gesammelt, algorithmisch verarbeitet und in Konversationstönen ausgespuckt werden, die uns den Eindruck vermitteln sollen, dass die Maschine „intelligent“ sei.
Die beliebten Versionen dieser Systeme, wie ChatGPT, leben und sterben basierend auf der Datenmenge, die sie sammeln können, was im Wesentlichen bedeutet, dass sie auf Sie angewiesen sind. Und falls Zweifel darüber bestehen, was „Sie“ in diesem speziellen Kontext bedeutet, Google (über Techspot) hat seine Datenschutzrichtlinie aktualisiert, um ausdrücklich darauf hinzuweisen, dass so ziemlich alles, was Sie online sagen oder tun, aufgegriffen und zum Trainieren seiner KI-Modelle verwendet werden kann.
Natürlich erfasst Google Daten über Ihre Online-Aktivitäten, beispielsweise die Dinge, nach denen Sie suchen, die Videos, die Sie ansehen, die Dinge, die Sie kaufen, die Personen, mit denen Sie sprechen, sowie die Standortdaten, auf die Sie über Ihr Android-Mobilgerät zugreifen. Aber „unter bestimmten Umständen“ sammelt es auch Informationen aus „öffentlich zugänglichen Quellen“: Wenn Ihr Name beispielsweise in einem lokalen Zeitungsartikel erscheint, kann Google den Artikel indizieren und ihn dann mit Personen teilen, die nach Ihrem Namen suchen.
Das ist an sich nichts Neues: Was sich geändert hat, wie bei Google zu sehen ist Seite mit Richtlinienaktualisierungen, so sagt Google, dass es die Informationen, die es aus diesen öffentlichen Quellen erhält, nutzen kann. Zuvor hieß es in der Richtlinie, dass öffentlich verfügbare Daten verwendet werden könnten, „um dabei zu helfen, die Sprachmodelle von Google zu trainieren und Funktionen wie Google Translate zu entwickeln“. Das neueste Update erweitert die Richtlinie erheblich: „Wir sammeln möglicherweise Informationen, die online oder aus anderen öffentlichen Quellen öffentlich verfügbar sind, um die KI-Modelle von Google zu trainieren und Produkte und Funktionen wie Google Translate, Bard und Cloud AI-Funktionen zu entwickeln.“
Bard ist im Wesentlichen Googles Antwort auf ChatGPT, das Anfang des Jahres angekündigt wurde, und ähnlich wie bei anderen KI-Modellen verlief es nicht ganz reibungslos. Im April hieß es beispielsweise in einem Bericht, mehrere Google-Mitarbeiter hätten das Unternehmen aufgefordert, Bard nicht einzuführen, weil die Informationen, die es als Antwort auf Anfragen bereitstellte, „mehr als nutzlos“ seien und den Chatbot praktisch zu einem „pathologischen Lügner“ machten.
Mehr Daten sollten zumindest theoretisch zu besseren Ergebnissen für die Bots von Google führen. Unabhängig davon, ob die Datenschutzrichtlinie aktualisiert wurde oder nicht, ist der rechtliche Status dieses Verhaltens nicht eindeutig geklärt. OpenAI sieht sich mit mehreren Klagen wegen der Art und Weise konfrontiert, wie es Daten sammelt und zum Trainieren von ChatGPT verwendet: Richtlinien wie die kürzlich von Google eingeführte haben den Anschein, dass einiges davon zum Freiwild wird, aber, aber als Die Washington Post Berichten zufolge saugen KI-Modelle so ziemlich alles auf, von Wikipedia-Seiten bis hin zu Nachrichtenbeiträgen und einzelnen Tweets, eine Angewohnheit, mit der immer mehr Menschen Probleme haben.
Und nicht alle der fraglichen Materialien sind tatsächlich Freiwild: kürzlich die Autoren Mona Awad und Paul Tremblay haben eine eigene Klage eingereicht gegen OpenAI und behauptet, dass ChatGPT gegen Urheberrechte verstoßen habe, indem es ihre Werke ohne Erlaubnis zum Trainieren seines KI-Modells verwendet habe.
Ich habe mich an Google gewandt, um weitere Informationen zu den Gründen für die Änderung seiner Datenschutzrichtlinien zu erhalten, und werde sie aktualisieren, wenn ich eine Antwort erhalte.