X

Beliebte Themen

News vom Roboter

Katalog-Texte, Wetterprognosen oder Sportberichte – dahinter stecken heute oft nicht mehr Menschen, sondern Maschinen. Auch bei Abstimmungen und Wahlen kommt Software zum Einsatz, die aus trockenen Daten lesbare Texte erstellt.

FOTOS
Getty iMages, zvg
04. November 2019

Künstliche Intelligenz (KI) verwandelt Daten in lesbare Texte.

Am Wahlsonntag vor zwei Wochen gabs für Reporter- und Redaktionsteams der Schweizer Medien viel zu tun. Auch für Lena, obwohl sie nicht dem Bild vom klassischen Journalismus entspricht: Klaglos lieferte Lena Texte zu den Wahlergebnissen aller Schweizer Gemeinden – mehr als 2200, eine Riesenbüez. Lena macht so etwas mit links, denn Lena ist ein Computerprogramm. Schon seit einiger Zeit setzt es die Nachrichtenagentur Keystone-SDA bei der Berichterstattung an Abstimmungssonntagen ein.

Dass Algorithmen knochentrockenes Zahlenmaterial zu lesbaren Texten verarbeiten, ist nicht neu: «2007 gab es in den USA die ersten automatisch erzeugten Spielvorschauen und Zusammenfassungen für College-Basketball», weiss Colin Porlezza (41), Zürcher mit Tessiner Wurzeln und Professor für Journalismus in London. «Wenig später begannen etablierte Medien wie Forbes die Unternehmensberichterstattung zu automatisieren.»

Neben Sportresultaten oder Quartalsberichten börsenkotierter Unternehmen lassen sich Produktvorstellungen in Online-Katalogen ebenso wie Wettervorhersagen automatisch aus Datenbanken generieren. Der Deutsche Fussballbund präsentiert ab dieser Saison die Resultate aller Amateurligen – per Software umgewandelt zu kleinen Texten.

Ergänzung des Angebots

Christoph Zimmer (43) von der Zürcher Mediengruppe Tamedia, die als erste in der Schweiz mit solchen Systemen experimentiert hat, sieht darin keine Gefahr für den Journalismus: «Eher eine Chance: Ohne solche Software könnten wir unmöglich die Wahlergebnisse für alle Schweizer Gemeinden in Textform aufbereiten.» Dies sei aber nur in Verbindung mit klassischen journalistischen Beiträgen – Hintergrund, Recherche, Kommentar – ein Mehrwert für die Nutzer, betont der für digitale Bezahlmedien verantwortliche Manager.

Die Wirtschaftlichkeit von Textrobotern sei derzeit noch schwer einzuschätzen, hänge aber von der Verbreitung des Mediums und der Häufigkeit der Textroboter-Einsätze ab, sagt Zimmer. Programmierung und Formulierung der Textbausteine sind aufwendig und rentieren nur, wenn die Software häufig eingesetzt wird und einen möglichst grossen Nutzerkreis erreicht. Die Mehrsprachigkeit der Schweiz ist kein Problem: Die Algorithmen im Hintergrund arbeiten unabhängig von der Sprache der Textbausteine.

Dass Künstliche Intelligenz weit mehr kann, zeigten Forscher des kalifornischen Unternehmens OpenAI Anfang 2019: Ihr Programm GPT-2 ergänzt einen vorgegebenen Satz zu einem umfangreichen Text, indem es alle für das Thema relevanten Quellen aus dem Internet kombiniert – mit verblüffenden Resultaten. Den Code will OpenAI allerdings nicht veröffentlichen – aus Angst vor Missbrauch ihrer Entwicklung für die Verbreitung von Fake News.

Interview mit Colin Porlezza, Professor für Journalismus an der Universität London

Wann und wo wurden erstmals Computersysteme zur automatischen Textgenerierung verwendet?
Als erstes textgenerierendes System gilt das 1976 an der Universität Yale (USA) entwickelte Programm «Tale-Spin», das Kindergeschichten produzierte, allerdings mehr schlecht als recht. Automatisierter Journalismus, auch algorithmischer oder Roboterjournalismus genannt, ist hingegen ein relativ neues Phänomen, dessen Entstehung eng mit dem Sportjournalismus und spezifischen US-amerikanischen Sportarten verknüpft ist. Dies liegt daran, dass es bei Sportarten wie Baseball oder Basketball massenweise Statistiken und strukturierte, also spezifisch geordnete und maschinenlesbare, Daten zu jedem Spiel gibt. Und genau das braucht es für die Generierung von Texten aus Textbausteinen. 2007 bot die Webseite «StatSheet» erstmals automatisch erstellte Spielvorschauen, Zusammenfassungen und Echtzeit-Updates für College-Basketball. An der Northwestern University in Chicago (USA) entstand etwas später «StatsMonkey», eine Software, die realistische Berichte über College-Baseball-Spiele produzierte. 2010 fertigte der Algorithmus, nun in «Narrative Science» umbenannt, im Auftrag eines auf College-Sportarten spezialisierten TV-Networks über Baseball, American Football und Softball. Kurze Zeit darauf begannen etablierte Medien, etwa «Forbes», ihre Unternehmensberichterstattung zu automatisieren und verhalfen damit dem automatisierten Journalismus zum endgültigen Durchbruch.

Woran erkennt der Nutzer solche robotisierten Texte? Müssen sie von den Redaktionen gekennzeichnet werden?
Eine Untersuchung aus dem Jahre 2017 bei einem Dutzend Webseiten hat ergeben, dass die Praxis der Kennzeichnung sich je nach Publikation stark unterscheidet und dass es keine einheitlichen Regeln gibt. Das Thema ist auch komplexer, als es auf den ersten Blick erscheint. Was soll genau gekennzeichnet, bzw. wem soll die Autorschaft des Beitrages zugeschrieben werden? Und bei wem können sich Leserinnen und Leser melden, wenn sie Fragen haben oder auf den Beitrag reagieren möchten? Aus meiner Sicht ist es unerlässlich, dass Medien bei automatisiert produzierten Artikeln volle Transparenz herstellen. Die Redaktionen sollen nicht nur darauf hinweisen, wenn Beiträge automatisch generiert wurden, sondern auch die verwendete Software und die zugrunde liegenden Daten offenlegen. Denn meist werden Algorithmen als unvoreingenommen und unfehlbar wahrgenommen. Erst eine systematische Kennzeichnung ermöglicht dem Publikum eine Auseinandersetzung mit diesen Beiträgen.

Wo geht die Entwicklung hin? Welche Bereiche der Information werden künftig durch Künstliche Intelligenz (KI) abgedeckt?
KI beeinflusst mittlerweile weite Felder im Informationsbereich. Zum Beispiel Data Mining: Dabei geht es darum, grosse Datenmengen nach interessanten Geschichten durchzukämmen. Data-Mining-Algorithmen können aber auch für Vorhersagen, zur Erkennung und Überwachung von Ereignissen – etwa Erdbeben – oder zur Überprüfung und Verifizierung von Fakten verwendet werden. Daneben wird KI auch für die Entwicklung von News- oder Chatbots verwendet, also für Programme, die entweder automatisch Nachrichten sammeln, oder eine simulierte Konversation mit Nutzern betreiben. Den weitaus grössten Einfluss hat KI allerdings auf der Nutzerseite, wenn es darum geht, Inhalte zum Beispiel auf Social-Media-Plattformen auf die Interessen der Nutzer abzustimmen. Diese Entwicklung bietet den Nutzern durchaus Vorteile, etwa für die Bewältigung des Informationsüberangebots. Andererseits birgt dieser Einsatz von KI aber auch Risiken: Solche Systeme können Inhalte nicht nur besser der Konsumnachfrage anpassen, sondern auch Nutzer mit propagandistischen Inhalten täuschen – gerade in politischen Belangen.

Haben klassische Medien mit KI-gestützten Systemen bessere Chancen, um sich gegen neue Kommunikationsplattformen zu behaupten?
Die Schweizer Medienöffentlichkeit wird längst nicht mehr von den klassischen journalistischen Informationsmedien dominiert. Neue Akteure sind hinzugekommen, und Technologie-Plattformen wie Facebook, Google, Youtube und Co. spielen bei der Mediennutzung eine zentrale Rolle. Dies hat einen Erosionsprozess bei den klassischen Medien zur Folge und eine «Plattformisierung» der Medienarena. Der professionelle Informationsjournalismus stellt zwar noch die Inhalte her, die Nutzer konsumieren diese aber zusehends über Plattformen. Laut dem Jahrbuch «Qualität der Medien 2019» der Universität Zürich sind Social Media mit einem Anteil von 70 Prozent der am weitesten verbreitete News-Kanal und fester Bestandteil des Schweizer Medienmenüs. Und die konsumierten Inhalte werden gar nicht mehr mit der Quelle beziehungsweise der Medienmarke in Verbindung gebracht – das schwächt den professionellen Informationsjournalismus zusätzlich. KI-gestützte Systeme reichen deshalb bei weitem nicht aus, um den Informationsmedien neuen Schwung zu verleihen. Redaktionelle News sind aber essentiell für eine demokratische Gesellschaft, und darum sind in Anbetracht des Marktversagens weitere Massnahmen erforderlich, um den professionellen Informationsjournalismus mit ausreichenden Ressourcen versorgen zu können.