Künstliche Intelligenz

So kommt es heraus, wenn eine KI für higgs schreibt

Immer öfter wird künstliche Intelligenz zum Autor. Teilweise sind die Texte verblüffend gut, teilweise abstrus. Denn eines kann die KI nicht: Erzählen. Wie sich KI-Werke erkennen lassen.

Das musst du wissen

  • Ein Schreibprogramm, das auf künstlicher Intelligenz beruht, kann Wissenschaftsnachrichten imitieren.
  • Doch die KI-Schreibfeder hinterlässt Spuren im Text, die sie entlarven.
  • Ausserdem gibt es bereits Programme, welche künstlich geschriebene Texte detektieren.

Es ist eine besondere News, die wir hier präsentieren. Ist sie echt oder fake?

«Bisher gingen Wissenschaftler davon aus, dass der Mensch die intelligenteste Lebensform der Erde ist. Doch nun zeigt eine neue Studie mit Daten des Hubble-Weltraumteleskops, dass auch Menschenaffen mit Computern umgehen können. Das macht das Ergebnis der Studie, das diese Woche in der Fachzeitschrift Science veröffentlicht wurde, noch wichtiger, sagt Hauptautor Sigmund Stolte, ein Computerwissenschaftler der Universität Stanford. Die Ergebnisse, über die erstmals in der Mai-Ausgabe der Zeitschrift Science berichtet wurde, sind wichtig, sagt er, denn obwohl Menschenaffen die intelligentesten Lebensformen der Erde sind, sind sie in den Naturwissenschaften noch nicht viel untersucht worden.»

Kommt dir das spanisch vor? In der Tat hat diesen Absatz eine künstliche Intelligenz (KI) geschrieben, basierend unter anderem auf dem sogenannt neuronalen Sprachmodell GPT-2. Wir haben die kursiv geschriebenen ersten 16 Wörter auf Englisch und das Thema «Wissenschaft» vorgegeben. Das Resultat haben wir auf deutsch übersetzt. Hier kannst du es selber probieren.

Das Beispiel zeigt: KI-Schreiberlinge hinterlassen linguistische Spuren, die sie enttarnen. Zwar sind die Texte stilistisch ähnlich wie von Menschen geschriebene. Aber sie können falsche Tatsachenbehauptungen enthalten, zum Beispiel, dass Affen schlecht erforscht und die intelligentesten Lebensformen seien. Ausserdem ist ein Kennzeichen solcher Texte, dass sie sich leicht wiederholen. Auch in unserem Beispieltext wird zweimal gesagt, dass die Studie im Magazin «Science» erschienen ist.

Fake-News-Gefahr?

«Maschinell erstellte Texte sind oft auch banal, sie können keine Geschichten, keine Neuigkeiten erzählen», sagt Jannis Vamvas, der sich am Institut für Computerlinguistik der Universität Zürich mit maschinellem Lernen für die Verarbeitung von Sprache beschäftigt. «Wenn Menschen schreiben, geht es ihnen nicht nur um den oberflächlichen Eindruck, sondern sie haben auch etwas zu sagen. Sie wollen, dass ihre Botschaft ankommt. Bei Sprachmodellen fehlt dieser Teil, und das zeigt sich in ihrer Sprache.»

Fehlende Kreativität beobachtet auch der Computerwissenschaftler Hendrik Strobelt von IBM Research, der sich mit Sprachmodellen beschäftigt: «Menschen sind oft kreativer und nutzen zum Beispiel öfter Synonyme damit ein Text nicht langweilig wird». Ein Sprachmodell aber hat nicht gelernt, zu erzählen. Es ist darauf ausgelegt Sprache zu imitieren, statt kreativ zu sein.

Sprachmodelle werden aber immer raffinierter. «Oftmals verraten nur subtile logische Trugschlüsse oder sprachliche Eigenheiten einen Textausschnitt als maschinell erzeugt – Fehler, die eine extrem genaue Lektüre erfordern, um sie zu erkennen», schreiben etwa Computerwissenschaftler der University of Pennsylvania und von Google 2019 in einer Studie zu Sprachmodellen. Das Sprachmodell Grover vom Allen Institute für Künstliche Intelligenz etwa schafft es, nur aufgrund der Überschrift «Verbindung zwischen Autismus und Impfstoffen gefunden» einen kohärenten Artikel zu schreiben, der sowohl den Stil bestimmter Reporter als auch jenen bestimmter Medien, etwa der New York Times, imitieren kann.

Das schürt Ängste, Sprachmodelle könnten massenhaft, automatisch generierte Fake News schreiben. Die von Elon Musk mitbegründete Firma OpenAI hielt daher das von ihr entwickelte Sprachmodell GPT-2 Anfang 2019 vorerst zurück.

Dies kritisierte die Computerwissenschaftlerin Animashree Anandkumar vom California Institute of Technology damals gegenüber higgs: Diejenigen, die Fake News im grossen Stil in Umlauf brächten, würden dies auch ohne künstliche Intelligenz schon ziemlich effektiv tun.

Mittlerweile ist das Modell vollständig veröffentlicht, bisher gab es keine nachgewiesene GPT2-Fake-News-Welle. Aber dennoch gibt es Risiken: So konnten 2017 Menschen auf einer Internetplattform der US-Bundesbehörde für Kommunikation eine öffentliche Vernehmlassung zur Netzneutralität kommentieren. Tatsächlich stammte ein Teil der Kommentare von Bots, die neuronale Sprachmodelle genutzt hatten. «Die Gefahr besteht darin, legitime Kommentare oder Nachrichten in einer Flut von Fakes untergehen zu lassen», sagt Computerlinguist Vamvas. Ein ähnliches schädliches Szenario könnte man sich für massenhaft automatisch generierte Produkt-Reviews auf den Websites von Online-Warenhäusern vorstellen.

Texte automatisch schreiben – und entlarven

Die Aufregung um die potentielle Gefahr des Sprachmodells GPT2 brachte den IBM-Computerwissenschaftler Hendrik Strobelt und seine Kollegen von der Harvard Universität in den USA auf eine Idee: Statt einen potentiellen Fake-News-Generator geheim zu halten, könnte man doch gleichzeitig einen Detektor entwickeln. Sie ersannen eine Methode, um KI-Texte zu erkennen. Sie nannten sie GLTR, ausgesprochen «Glitter».

So sieht die englische Version unseres KI-Textbeispiels aus, wenn man den Text mit GLTR untersucht. Viel grün bedeutet, dass der Text wahrscheinlich automatisch von einer KI generiert wurde.

Um GLTR zu verstehen, muss man ein wichtiges Prinzip von Sprachmodellen kennen: Sie bauen Texte Wort für Wort auf, in dem sie voraussagen, welches Wort wahrscheinlich als nächstes kommt. GLTR nutzt die Sprachmodelle in gleicher Weise und sagt die Wahrscheinlichkeit voraus, dass ein bestimmtes Wort an einer bestimmten Stelle kommt. Sehr wahrscheinliche Worte färbt GLTR grün ein, sehr unwahrscheinliche Worte violett. Worte im Mittelfeld sind entweder gelb oder rot. Je bunter ein Text ist, desto eher stammt er von einem Menschen. Denn menschliche Sprache ist nicht vollständig voraussagbar. Maschinen geschriebene Texte sind dagegen meist fast ganz grün. Denn es ist ja ihr Funktionsprinzip, immer die wahrscheinlichsten Wörter zu wählen.

So sieht die englische Version eines higgs-Artikels aus der Feder unserer Redaktorin Katrin Schregenberger aus, wenn man den Text mit GLTR untersucht. Ein bunt gesprenkelter Text mit viel Violett bedeutet, dass der Text eher vom Menschen, denn von einer KI geschrieben wurde.

«Wir haben bewusst auf eine voll-automatische Interpretation dieser Analyse verzichtet», erklärt Hendrik Strobelt. «Durch die Visualisierung mittels der bunten Farben wollen wir Menschen befähigen, Texte selbst einzuschätzen undselber zu bewerten ob sie möglicherweise automatisch generiert sind oder nicht.»

Menschen erkennen Fakes schlecht

Wie gut das gelingt, untersuchten die Forschenden in einer kleinen Pilot-Studie: Sie legten 35 Studenten der Computerwissenschaften Texte vor, die entweder von einem Menschen oder einem Sprachmodell geschrieben waren. Innerhalb von 90 Sekunden sollten sie entscheiden: Echt oder Fake. Nur 54 Prozent der Texte erkannten die Studierenden richtig, sie waren also kaum besser als der Zufall. Danach erklärten ihnen Strobelt und seine Kollegen die GLTR Methode und legten ihnen wiederum sowohl menschengeschriebene als auch automatisch generierte Texte vor – diesmal waren diese von GLTR eingefärbt. Nun lagen die Probanden in 72 Prozent der Fälle richtig. Zwar warnt Strobelt, dass diese erste Studie nicht repräsentativ sei, aber sie zeige doch die Effektivität der Methode.

Es ist also wahrscheinlich eine Frage der Aufmerksamkeit und der Schulung unserer Lesegewohnheiten, die uns in Zukunft helfen können, Fakes zu erkennen. Dies in Zusammenarbeit mit automatischen Detektionsprogrammen. Jannis Vamvas zieht eine Analogie zu Spam E-Mail, in denen etwa ein entfernter Verwandter aus Afrika sein Vermögen mit uns teilen möchte. Vor zwanzig Jahren haben wir so etwas noch eher ernst genommen – heute sehen wir solche E-Mails dank Filtermechanismen kaum mehr. Und ausserdem sind wir mittlerweile geschult, solche Arten von Spam zu erkennen. Irgendwann kommt uns der Stil der KI also vielleicht ebenfalls spanisch vor.

Dies ist der letzte von vier Teilen einer KI-Serie. Die Serie wird ermöglicht durch die Unterstützung der Hasler Stiftung.