Birdwatch: Die Twitter-Gemeinschaft gegen Fake News

Technik Armin Fix 21 Februar 2021

Lesezeit: Etwa siebeneinhalb Minuten.

Artikelbild: Birdwatch: Die Twitter-Gemeinschaft gegen Fake News — © Foto von Cristian Dina von Pexels

Der Kampf gegen Falschmeldungen und Desinformationen stellt soziale Netzwerke vor große Herausforderungen. Twitter möchte künftig mithilfe der Community gegen dieses Problem vorgehen.

Fake News können sich rasend schnell ausbreiten, sobald eine kritische Masse an Menschen erreicht wird, die diese weitergeben. Das Problem: Wenn viele Menschen eine Falschinformation verteilen, wird sie immer weniger hinterfragt. Das führt dazu, dass noch mehr Menschen die Meldungen teilen. Das dahinter liegende Phänomen, „die Weisheit der Vielen“, besagt, dass eine Gruppe immer klüger als ein Individuum ist, das ist die so genannte kollektive Intelligenz. Twitter möchte jetzt Feuer mit Feuer bekämpfen und schickt einen ebenso auf Gemeinschaft basierenden Mechanismus ins Rennen: Birdwatch.

"We believe this approach has the potential to respond quickly when misleading information spreads, adding context that people trust and find valuable. Eventually we aim to make notes visible directly on Tweets for the global Twitter audience, when there is consensus from a broad and diverse set of contributors", schreibt Twitter Vice President of Product Keith Coleman in einer Pressemitteilung.

Wie die Community Fake News identifizieren soll

Aus Nutzer:innensicht erhält jeder Tweet im Kontextmenü, dort, wo man auch einen Tweet melden kann, eine neue Option. Diese besteht aus drei grundlegenden Bereichen:

Das Kontextmenü eines jeden Tweets erhält eine neue "Birdwatch-Option". Diskussionen finden auf einer separaten Webseite statt. (Bild: Twitter)

Notizen: Twitternutzer:innen können in einem Notizfeld erklären, weshalb sie glauben, dass ein Tweet problematisch, irreführend oder falsch sei, und dann auf relevante Quellen verlinken. Als Werkzeuge stehen hier einige Multiple-Choice-Fragen und ein Freitextfeld zur Verfügung.
Bewertungen: Andere Twitternutzer:innen können die Korrekt- und Nützlichkeit dieser Notizen positiv oder negativ bewerten. Anders als bei gängigen Daumen-Bewertungen steht hier der Kontext im Vordergrund. Beispielsweise lässt sich eine Notiz positiv bewerten, weil sie einen komplexen Sachverhalt in einfachen Worten beschreibt. Eine negative Bewertung gibt es möglicherweise, wenn die Notiz populistisch ist und einen Sachverhalt unnötig dramatisiert. Dieser Kontext unterstützt Twitter darin, herauszufinden, welche Bewertungen und Notizen besonders hilfreich sind, und erlaubt Birdwatch, die Sichtbarkeit einer Notiz zu verändern, sobald eine gewisse Anzahl an Abstimmungen erreicht wurde.
Die Birdwatch-Webseite: In der Pilotphase möchte Twitter die Notizen und Bewertungen auf einer separaten Webseite hinterlegen. Birdwatch soll zunächst keinen Einfluss darauf haben, wie Menschen Tweets sehen oder wie der Twitter-Algorithmus Empfehlungen ausspricht. Priorität hat zunächst, zu verstehen, wie eine communitybasierte Moderationsplattform funktioniert und ob es Schwachstellen gibt, bevor es echte Auswirkungen auf den Fluss von Informationen gibt.

Anstelle einer einfachen Daumen-Bewertung werden Notizen mit einem Kontext bewertet.

Zusammenfassend kombiniert Twitter die Moderationswerkzeuge der Plattformen Reddit und Wikipedia. Denn auch bei Reddit beeinflusst die Bewertungen von Beiträgen die Sortierung innerhalb der Subreddits. Subreddits sind Diskussionsforen auf der Plattform, die einem bestimmten Thema gewidmet sind. Aus Wikipedia stammt die Funktion, in einem separaten Bereich über Inhalte zu diskutieren.

Der Ranking-Algorithmus von Birdwatch im Detail

Der Algorithmus zur Einordnung positiver beziehungsweise negativer Notizen wurde ebenfalls veröffentlicht. Gibt es noch nicht genug Bewertungen für Notizen, werden diese in umgekehrter chronologischer Reihenfolge angezeigt. Sind einige Bewertungen für eine Notiz vorhanden und bestimmte Kriterien erfüllt, wird die Notiz an den Anfang der Liste verschoben und mit einer „derzeit hilfreich“-Überschrift markiert.

Um zu ermitteln, welche Notizen als „derzeit hilfreich“ eingestuft werden, wird für jede Notiz ein „Hilfreich-Wert“ aus dem Anteil positiver Bewertungen berechnet. Mehr als 84 Prozent der Bewertungen müssen positiv sein: Liegt der ermittelte „Hilfreich-Wert“ also über 0,84 und hat eine Notiz mindestens fünf Bewertungen, wird sie als „derzeit hilfreich“ markiert. Es können maximal drei Notizen als „derzeit hilfreich“ markiert werden, absteigend sortiert nach dem „Hilfreich-Wert“.

So sieht eine als „derzeit hilfreich“ markierte Notiz aus. (Bild: Twitter)

Drei Rechenbeispiele für eine „derzeit hilfreich“-Überschrift:

Für eine Notiz liegen 20 Bewertungen vor. Es müssen mindestens 17 davon positiv sein, denn 17/20 ist gleich 0,85.
Hat eine Notiz fünf Bewertungen, müssen alle fünf positiv sein, denn 5/5 ist gleich 1, also 100 Prozent. Vier positive Bewertungen würden aus zweifacher Hinsicht nicht ausreichen: Es braucht immer mindestens fünf positive Bewertungen und 4/5 sind nur 80 Prozent.
Bei sechs Bewertungen reichen auch keine fünf positiven Bewertungen, denn 5/6 ist gleich 0,83.

Dieser in der Pilotphase des Projekts als erster Ansatz zu verstehende Algorithmus wurde bewusst einfach gehalten und wird iterativ verfeinert. Er kann und wird sich daher nach dem Veröffentlichen dieses Artikels ändern (Stand: 20. Februar 2021).

Informationen und Inhalte werden öffentlich verfügbar gemacht

We know this might be messy and have problems at times, but we believe this is a model worth trying. We invite you to learn alongside as we continue to explore different ways of addressing a common problem. -- Keith Coleman

Damit Birdwatch verbessert und öffentlich kontrolliert werden kann, bietet das Unternehmen seit dem 1. Februar die verfügbaren Informationen zum Download an. Interessierte Softwareentwickler:innen und Data-Analyst:innen können so mithilfe eigener Algorithmen Probleme und Manipulationsversuche identifizieren, eliminieren und Vorschläge zur Verbesserung liefern.

Ein Ausblick auf mögliche Verbesserungen des Ranking-Algorithmus

Vor allem die Resilienz gegen koordinierte Manipulationsversuche einer großen Nutzer:innengruppe bereitet dem Unternehmen Sorgen. Der Algorithmus muss dagegen immun sein. Welche Dynamik entstehen kann, zeigt das Beispiel Mister Splashy Pants. Hierbei handelt es sich um einen Buckelwal, dessen Name Greenpeace im Jahr 2007 per Online-Umfrage finden ließ. Die Umfrage geriet dabei in den Fokus großer Internetforen wie Reddit und 4chan. Als Folge wurde der Name Mister Splashy Pants knapp 120.000 mal gewählt, der zweitplatzierte Name Humphrey erhielt nur etwa 4000 Votes.

Ein Reputationssystem kann die Angriffsfläche für koordinierte Manipulationsversuche verringern. Ein denkbares System wäre, dass eine positive Reputation einer Person nur erreicht werden kann, indem verschiedene Personengruppen frühere Notizen positiv bewerten.

Diversität ist bei Bewertungen wichtig

Nur durch ein breites Spektrum von Menschen mit unterschiedlichem politischem, ethnischem, soziodemografischem und weltanschaulichem Hintergrund, unterschiedlichem Geschlecht, Alter und genetischer Vielfalt kann der Algorithmus neutral und effektiv sein.

Anstatt die Top-Beiträge durch eine einfache Mehrheitsabstimmung zu bewerten, muss daher berücksichtigt werden, wie divers die Bewertungen sind. Ist die Vielfalt nicht gegeben, müssen weitere Abstimmungen einfließen, bevor ein Konsens ermittelt wird. Denkbar wäre auch, Abstimmungen von Personen stärker zu gewichten, die selbst konsistent hohe positiv gerankte Notizen abgegeben haben, die also in der Vergangenheit positiv aufgefallen sind.

Darüber hinaus könnte Birdwatch proaktiv Personen bitten, Bewertungen abzugeben, die aufgrund ihrer früheren Bewertungen wahrscheinlich eine andere Perspektive einbringen können. Es muss verhindert werden, dass der Algorithmus Bewertungen vermehrt aus einer bestimmten Ideologie oder einem Interessenbereich beachtet. Je breiter die Interessen von Nutzer:innen sind, desto besser sind sie für Bewertungen geeignet.

Ein weiterer Baustein in der Pilotphase ist die Bewertung von Birdwatch an sich. Twitter muss evaluieren, ob Menschen den neuen Kontext bei Tweets als hilfreich und angemessen empfinden. Ist Birdwatch in der Lage, Menschen mit einer Vielzahl an Perspektiven und Meinungen zu reflektieren und einen hilfreichen und angemessenen Konsens zu bieten? Die Daten werden es zeigen.

Derzeit nur in den USA verfügbar

Da Birdwatch vorerst nur in den USA verfügbar ist, muss zum Herunterladen der Daten oder zum Ausprobieren eine aktive amerikanische Internet-Verbindung bestehen. Anbieter kommerzieller VPN-Software bieten hierfür jedoch einfache Lösungen. Wie bereits erwähnt, wird das Feature nicht jeder:m Twitter-Nutzer:in direkt angeboten, sondern ist zunächst nur für eine kleine Gruppe sichtbar. Ob oder wann die Funktion freigeschaltet wird, ist also unklar. Aktuelle Informationen und Entwicklungen zum Thema finden Nutzer:innen jederzeit über das Twitter-Profil @Birdwatch.