Reddits Verkauf von Benutzerdaten für KI-Training löst FTC-Anfrage aus


Reddit sagte voraus Laut seinem Börsengang nächste Woche könnte die Lizenzierung von Nutzerbeiträgen bei Google und anderen für KI-Projekte in den nächsten Jahren einen Umsatz von 203 Millionen US-Dollar einbringen. Die von der Community betriebene Plattform musste am Freitag offenlegen, dass die US-Regulierungsbehörden bereits Fragen zu diesem neuen Geschäftszweig haben.

In eine behördliche EinreichungReddit sagte, dass es am Donnerstag einen Brief von der US-amerikanischen Federal Trade Commission erhalten habe, in dem es um „unseren Verkauf, unsere Lizenzierung oder die Weitergabe von benutzergenerierten Inhalten an Dritte zum Trainieren von KI-Modellen“ ging.

Die FTC, die wichtigste Kartellbehörde der US-Regierung, hat die Befugnis, Unternehmen zu sanktionieren, bei denen festgestellt wird, dass sie unfaire oder irreführende Handelspraktiken anwenden. Die Idee, benutzergenerierte Inhalte für KI-Projekte zu lizenzieren, hat bei Gesetzgebern Fragen aufgeworfen und Rechtegruppen über Datenschutzrisiken, Fairness und Urheberrecht.

Reddit ist nicht der Einzige, der versucht, mit der Lizenzierung von Daten, einschließlich der von Benutzern generierten, für KI Geld zu verdienen. Die Programmier-Q&A-Site Stack Overflow hat einen Vertrag mit Google unterzeichnet, Associated Press hat einen mit OpenAI und Tumblr-Eigentümer Automattic unterzeichnet hat gesagt Es arbeitet „mit ausgewählten KI-Unternehmen“ zusammen, ermöglicht Benutzern jedoch die Möglichkeit, die Weitergabe ihrer Daten abzulehnen. Keiner der Lizenzgeber reagierte sofort auf Anfragen nach Kommentaren. Reddit ist auch nicht das einzige Unternehmen, das einen FTC-Brief zur Datenlizenzierung erhält, Axios gemeldet am Freitag unter Berufung auf einen namentlich nicht genannten ehemaligen Beamten der Agentur.

Es ist unklar, ob der Brief an Reddit in direktem Zusammenhang mit der Überprüfung anderer Unternehmen steht.

Reddit sagte in der Offenlegung vom Freitag, dass es nicht glaubt, an unfairen oder betrügerischen Praktiken beteiligt zu sein, warnte jedoch davor, dass die Bearbeitung von Regierungsuntersuchungen kostspielig und zeitaufwändig sein kann. „Aus dem Brief ging hervor, dass die FTC-Mitarbeiter an einem Treffen mit uns interessiert waren, um mehr über unsere Pläne zu erfahren, und dass die FTC beabsichtigte, im weiteren Verlauf ihrer Untersuchung Informationen und Dokumente von uns anzufordern“, heißt es in der Akte. Reddit sagte, in dem FTC-Brief sei die Prüfung im Zusammenhang mit „einer nicht öffentlichen Untersuchung“ beschrieben worden.

Reddit, dessen 17 Milliarden Beiträge und Kommentare von KI-Experten als wertvoll für die Schulung von Chatbots in der Kunst der Konversation angesehen werden, kündigte letzten Monat einen Deal an den Inhalt an Google zu lizenzieren. Reddit und Google reagierten nicht sofort auf Anfragen nach Kommentaren. Die FTC lehnte eine Stellungnahme ab. (Advance Magazine Publishers, Muttergesellschaft des WIRED-Verlags Condé Nast, besitzt eine Beteiligung an Reddit.)

KI-Chatbots wie ChatGPT von OpenAI und Gemini von Google gelten als Wettbewerbsbedrohung für Reddit, Verlage und andere werbefinanzierte, inhaltsgesteuerte Unternehmen. Im vergangenen Jahr stellte sich für einige Unternehmen die Aussicht auf die Lizenzierung von Daten an KI-Entwickler als potenzieller Vorteil generativer KI heraus.

Doch die Verwendung online gesammelter Daten zum Trainieren von KI-Modellen hat in Vorstandsetagen, Gerichtssälen und im Kongress eine Reihe von Fragen aufgeworfen. Für Reddit und andere, deren Daten von Benutzern generiert werden, geht es um die Frage, wem der Inhalt wirklich gehört und ob es fair ist, ihn zu lizenzieren, ohne dem Ersteller einen Anteil zu gewähren. Sicherheitsforscher haben herausgefunden, dass KI-Modelle persönliche Daten preisgeben können, die in dem Material enthalten sind, aus dem sie erstellt wurden. Und einige Kritiker meinen, dass die Deals mächtige Unternehmen noch dominanter machen könnten.

source-114

Leave a Reply