Die meisten Top-Nachrichtenseiten blockieren KI-Bots. Rechte Medien heißen sie willkommen


„Ein Prozess namens Verstärkungslernen aus menschlichem Feedback wird derzeit in jedem hochmodernen Modell verwendet“, um seine Reaktionen zu verfeinern, sagt Baum. Die meisten KI-Unternehmen streben danach, Systeme zu schaffen, die neutral erscheinen. Wenn die Menschen, die die KI steuern, einen Anstieg rechter Inhalte sehen, diese aber als unsicher oder falsch einstufen, könnten sie jeden Versuch, der Maschine eine bestimmte Perspektive zu geben, zunichte machen.

OpenAI-Sprecherin Kayla Wood sagt, dass das Unternehmen bei der Suche nach KI-Modellen, die „alle Kulturen, Branchen, Ideologien und Sprachen umfassend repräsentieren“, umfangreiche Sammlungen von Trainingsdaten verwendet. „Jeder einzelne Sektor – einschließlich Nachrichten – und jede einzelne Nachrichtenseite ist ein winziger Ausschnitt der gesamten Trainingsdaten und hat keinen messbaren Einfluss auf den beabsichtigten Lern- und Output des Modells“, sagt sie.

Rechtskämpfe

Die Diskrepanz, mit der Nachrichtenseiten KI-Crawler blockieren, könnte auch eine ideologische Kluft im Urheberrecht widerspiegeln. Der New York Times ist gerade verklagen OpenAI wegen Urheberrechtsverletzung und argumentiert, dass die Datenerfassung des KI-Neulings illegal sei. Auch andere führende Vertreter der Mainstream-Medien betrachten dieses Kratzen als Diebstahl. Roger Lynch, CEO von Condé Nast, sagte kürzlich bei einer Anhörung im Senat, dass viele KI-Tools mit „gestohlenen Gütern“ gebaut wurden. (WIRED gehört Condé Nast.) Rechte Medienbosse waren in der Debatte weitgehend abwesend. Vielleicht lassen sie das Data Scraping stillschweigend zu, weil sie das Argument unterstützen, dass das Data Scraping zur Entwicklung von KI-Tools durch die Fair-Use-Doktrin geschützt ist?

Einige der neun rechten Medien, die von WIRED kontaktiert wurden, um zu fragen, warum sie KI-Scraper zulassen, deuteten in ihren Antworten auf einen anderen, weniger ideologischen Grund hin. Der Washingtoner Prüfer reagierte nicht auf Fragen zu seinen Absichten, begann jedoch innerhalb von 48 Stunden nach der Anfrage von WIRED mit der Blockierung des GPTBot von OpenAI, was darauf hindeutet, dass das Unternehmen möglicherweise vorher nichts von der Option zum Blockieren von Webcrawlern wusste oder ihr keine Priorität einräumte.

Unterdessen gab der Daily Caller zu, dass seine Freizügigkeit gegenüber KI-Crawlern ein einfacher Fehler gewesen sei. „Wir unterstützen keine Bots, die unser Eigentum stehlen. Das muss ein Versehen gewesen sein, aber es wird jetzt behoben“, sagt Neil Patel, Mitbegründer und Herausgeber von Daily Caller.

Rechte Medien sind einflussreich und besonders geschickt darin, Social-Media-Plattformen wie Facebook zum Teilen von Artikeln zu nutzen. Aber Verkaufsstellen wie die Washingtoner Prüfer und der Daily Caller sind im Vergleich zu etablierten Medienriesen klein und schlank Die New York Timesdie über umfangreiche technische Teams verfügen.

Der Datenjournalist Ben Welsh führt eine laufende Liste der Nachrichten-Websites, die KI-Crawler von OpenAI, Google und dem gemeinnützigen Common Crawl-Projekt blockieren, dessen Daten in der KI weit verbreitet sind. Seine Ergebnisse ergaben das etwa 53 Prozent der 1.156 befragten Medienverlage blockieren einen dieser drei Bots. Seine Stichprobengröße ist viel größer als die von Originality AI und umfasst kleinere und weniger beliebte Nachrichtenseiten, was darauf hindeutet, dass Medien mit größerem Personal und höherem Datenverkehr KI-Bots eher blockieren, möglicherweise aufgrund besserer Ressourcen oder technischer Kenntnisse.

Mindestens eine rechtsgerichtete Nachrichtenseite denkt darüber nach, wie sie die Art und Weise, wie ihre Mainstream-Konkurrenten versuchen, KI-Projekte zu blockieren, nutzen könnte, um vermeintlichen politischen Vorurteilen entgegenzuwirken. „Unsere rechtlichen Bestimmungen verbieten Scraping und wir erforschen neue Tools zum Schutz unseres geistigen Eigentums. Allerdings suchen wir auch nach Möglichkeiten, um sicherzustellen, dass KI nicht denselben Vorurteilen unterliegt wie die etablierte Presse“, sagt Jen Smith, Sprecherin von Daily Wire. Bis heute war es GPTBot und anderen KI-Bots noch möglich, Inhalte aus dem Daily Wire zu extrahieren.

Aktualisiert am 24. Januar 2024 um 10:20 Uhr ET, um die genaue Anzahl der Top-Nachrichtenseiten aufzunehmen, von denen Originality AI Daten gesammelt hat.

source-114

Leave a Reply