Was hat der „Open Source“-Algorithmus von Twitter tatsächlich offenbart? Nicht viel.


Als Elon Musk zum ersten Mal vorschlug, Twitter zu übernehmen, war eine der ersten Änderungen, von denen er behauptete, dass er sie vornehmen würde, der Algorithmus von Twitter. Letzte Woche hat Twitter dieses Versprechen endlich eingehalten, den zugrunde liegenden Code für die „For You“-Empfehlungen der Website auf GitHub.

Schnell begannen Twitter-Detektive, den Code zu sichten, um zu sehen, was sie ausgraben konnten. Es dauerte nicht lange, bis sich eine Augenbraue hochzog: Musks Tweets haben ihre (zusammen mit Demokraten, Republikanern und „Power-Usern“). Twitter-Ingenieure erklärten hastig, dass dies zu „Statistik-Tracking-Zwecken“ sei, was inzwischen von anderen bestätigt wurde . Und zwar Twitter Dieser Abschnitt des Codes von GitHub innerhalb weniger Stunden nach seiner Veröffentlichung hat immer noch Spekulationen angeheizt, dass die Ingenieure von Twitter dem Engagement ihres Chefs besondere Aufmerksamkeit schenken und Schritte unternommen haben, um seine Tweets zu verbessern.

Seitdem gab es jedoch nur wenige andere wichtige Enthüllungen über den Inhalt des Codes oder die Funktionsweise des Twitter-Algorithmus. Und wer hofft, dass dieser öffentliche Code neue Einblicke in das Innenleben von Twitter bringen würde, wird wahrscheinlich enttäuscht werden. Das liegt daran, dass der von Twitter veröffentlichte Code laut Ingenieuren, die ihn untersucht haben, wichtige Details darüber weggelassen hat, wie „der Algorithmus“ tatsächlich funktioniert.

Der von Twitter geteilte Code war demnach eine „stark redigierte“ Version des Twitter-Algorithmus , Associate Professor am Center for Social Media and Politics der NYU und ehemaliger Twitter-Mitarbeiter. Zum einen waren nicht alle Systeme enthalten, die in den Empfehlungen von Twitter eine Rolle spielen.

Twitter sagte, es halte Code zurück, der sich mit Anzeigen befasst, sowie Vertrauens- und Sicherheitssysteme, um zu verhindern, dass schlechte Schauspieler es spielen. Das Unternehmen entschied sich auch dafür, die zugrunde liegenden Modelle zurückzuhalten, die zum Trainieren seines Algorithmus verwendet wurden, und erklärte in a Blogeintrag letzte Woche, dass dies „um sicherzustellen, dass die Sicherheit und Privatsphäre der Benutzer geschützt wird“. Diese Entscheidung ist laut Messing sogar noch folgenreicher. „Das Modell, das den wichtigsten Teil des Algorithmus antreibt, war nicht Open Source“, sagt er mir. „Der wichtigste Teil des Algorithmus ist also immer noch undurchschaubar.“

Musks ursprüngliche Motivation, den Algorithmus Open Source zu machen, schien aus seiner Überzeugung zu stammen, dass Twitter den Algorithmus verwendet hatte, um die Meinungsfreiheit zu unterdrücken. „Eines der Dinge, von denen ich glaube, dass Twitter den Algorithmus öffnen und Änderungen an den Tweets der Leute vornehmen sollte – ob sie betont oder abgeschwächt sind – diese Aktion sollte deutlich gemacht werden“, sagte Musk im vergangenen April in einem kurzen Auftritt nachdem er sein Übernahmeangebot bestätigt hatte. „Damit jeder sehen kann, dass Maßnahmen ergriffen wurden, gibt es keine Art von Manipulation hinter den Kulissen, weder algorithmisch noch manuell.“

Aber keiner der von Twitter veröffentlichten Codes sagt uns viel über mögliche Voreingenommenheit oder die Art von „Manipulation hinter den Kulissen“ aus, die Musk offenbaren wollte. „Es hat den Geschmack von Transparenz“, sagt Messing. „Aber es gibt keinen wirklichen Einblick in das, was der Algorithmus tut. Es gibt nicht wirklich Aufschluss darüber, warum die Tweets von jemandem heruntergestuft und warum andere hochgestuft werden könnten.“

Messing weist auch darauf hin, dass die jüngsten API-Änderungen von Twitter wesentlich sind die überwiegende Mehrheit der Forscher daran gehindert, auf eine bedeutende Menge an Twitter-Daten zuzugreifen. Ohne ordnungsgemäßen API-Zugriff sind Forscher nicht in der Lage, ihre eigenen Audits durchzuführen, was würde in der Lage sein, neue Details über die Funktionsweise des Algorithmus bereitzustellen. „Zur gleichen Zeit, als Twitter diesen Code veröffentlicht, hat es die Recherche unglaublich erschwert Prüfung diesen Code“, schrieb er in seinem eigenen.

Alex Hanna, Forschungsdirektor am Distributed AI Research Institute (DAIR), hob die Bedeutung von Audits ebenfalls hervor, als wir uns letztes Jahr unterhielten, kurz nachdem Musk erstmals über Pläne gesprochen hatte, den Algorithmus von Twitter zu „öffnen“. Wie Messing war sie skeptisch, dass die einfache Veröffentlichung von Code auf GitHub die Transparenz der Funktionsweise von Twitter erheblich erhöhen würde.

„Wenn Sie tatsächlich an einer öffentlichen Aufsicht über so etwas wie einen Twitter-Algorithmus interessiert sind, brauchen Sie tatsächlich mehrere Methoden, damit die Aufsicht stattfindet“, sagte Hanna.

Es gibt jedoch einen Aspekt des Twitter-Algorithmus, auf den der GitHub-Code ein neues Licht wirft. Messing zeigt auf eine Datei des Datenwissenschaftlers Jeff Allen, der eine Art „Formel“ dafür offenbart, wie verschiedene Arten von Engagement vom Algorithmus priorisiert werden. „Wenn wir das für bare Münze nehmen, ist ein Favorit (Twitter-Like) einen halben Retweet wert“, schreibt Messing. „Eine Antwort ist 27 Retweets wert, und eine Antwort mit einer Antwort des Autors eines Tweets ist satte 75 Retweets wert.“

Das ist zwar etwas aufschlussreich, aber es ist wieder einmal ein Bild von dem, was wirklich passiert. „Ohne die eigentlichen Daten bedeutet das nicht viel“, sagt Messing. „Und Musk hat Daten für Akademiker gerade so wahnsinnig teuer gemacht. Wenn sie das jetzt wirklich studieren wollen, müssen Sie im Grunde riesige, massive Zuschüsse bekommen – eine halbe Million Dollar pro Jahr – um eine aussagekräftige Menge an Daten zu erhalten, um zu untersuchen, was passiert.“



source-115

Leave a Reply