Googles Deal mit Stack Overflow ist der jüngste Beweis dafür, dass KI-Giganten für Daten bezahlen werden


Letztes Jahr war Stack Overflow eine der ersten Websites, die bekannt gab, dass sie KI-Giganten Gebühren für den Zugriff auf Inhalte erheben würde, die zum Trainieren von Chatbots verwendet werden. Jetzt hat der beliebte Q&A-Dienst für Programmierer seinen ersten Kunden – Google – gewonnen, was laut CEO Prashanth Chandrasekar der Beginn einer „bedeutungsvollen“ neuen Einnahmequelle ist.

Der Deal ist von Bedeutung, da unklar bleibt, wie hoch Google und andere KI-Entwickler für die für KI-Projekte benötigten Inhalte zahlen werden. Millionen von Büchern und Websites haben die Entwicklung von KI-Systemen vorangetrieben, aber die meisten Verlage wurden nicht entschädigt, und einige klagen wegen angeblichem Missbrauch. Viele Verlage, darunter auch Stack Overflow, scheinen von ChatGPT und anderen generativen KI-Produkten bedroht zu sein, die Anfragen beantworten können, die früher Programmierer auf die Probe gestellt hätten.

Der Deal sieht vor, dass die Cloud-Abteilung von Google Fragen und Antworten von Stack Overflow zu Google Cloud-Diensten nutzt, um Codierungshilfe und technischen Support über eine Version von Googles Gemini-Chatbot bereitzustellen. Cloud-Computing-Kunden von Google können außerdem Fragen über die Befehlszeilenschnittstelle von Google Cloud stellen. „Ihre KI hat möglicherweise nicht alle Antworten, und daher haben wir eine enorme Fähigkeit, dabei zu helfen, diesen Kreis zu schließen“, sagt Chandrasekar. „Wir sind der größte Ort, an dem Community-Wissen kuratiert und validiert wird.“

Gemini fasst die Antworten von Stack Overflow in eigenen Worten zusammen, enthält jedoch das Logo des Unternehmens, einen Link zurück zum Originalmaterial und den Benutzernamen des Website-Mitarbeiters, der es bereitgestellt hat. Die Unternehmen planen, das System auf Google Cloud Next, der jährlichen Cloud-Konferenz des Suchunternehmens im April, vorzuführen und es bald darauf vorzustellen.

Laut Chandrasekar gibt es keine wesentlichen Einschränkungen hinsichtlich der Nutzung von Stack Overflow-Daten durch Google Cloud, was bedeutet, dass sie zum Trainieren großer Sprachmodelle und anderer KI-Systeme verwendet werden können. „Woran wir feststehen wollen, ist –für uns nicht verhandelbare Dinge– Vertrauen, Genauigkeit, Qualität und Zuordnung zu den Quellen dieser KI-Ergebnisse“, sagt er.

Er lehnte es ab zu sagen, wie viel Stack Overflow von Google für die Daten bezahlt wird. „Dies wird für uns kurz-, mittel- und langfristig ein bedeutsames kommerzielles Angebot sein“, sagt Chandrasekar.

Verdecktes Schaben

Google und andere KI-Entwickler haben zuvor ohne große Vorankündigung Daten von Stack Overflow und anderen Websites gesammelt. Da die Nachfrage nach generativen KI-Technologien sprunghaft angestiegen ist – und die Bewertungen der Unternehmen, die diese Technologien entwickeln, in die Höhe geschossen sind –, haben die Websites, die den Grundlagentext liefern, begonnen, das zu fordern, was sie als ihren gerechten Anteil ansehen. Zum Glück für Stack Overflow haben potenzielle Kunden die Nachricht beachtet, sagt Chandrasekar. „Wir müssen den Leuten nicht nachjagen“, sagt er.

Stapelüberlaufdaten sind besonders vorteilhaft für KI-Systeme, die Computercode generieren, die sich bei Softwareentwicklern als beliebt erwiesen haben und eine bedeutende Einnahmequelle für Microsoft und OpenAI darstellen.

Der neue Stack Overflow-Deal kommt nur eine Woche, nachdem Google eine Lizenzvereinbarung getroffen hat, um Daten von Reddit, dem Betreiber von Diskussionsforen, abzusaugen, dessen Inhalte die Konversationsfähigkeit von Chatbots verbessert haben. Reddit hatte letztes Jahr kurz vor Stack Overflow Pläne bekannt gegeben, für den Datenzugriff Gebühren zu erheben.

source-114

Leave a Reply