Mebucom / News / Technik / Mensch oder Maschine?
Mensch oder Maschine?

News: Technik

Mensch oder Maschine?

Thema des diesjährigen IFA-Presseforums der Produktions- und Technikkommission (PTKO) von ARD und ZDF war die Automatisierung der Medienproduktion durch Künstliche Intelligenz und neuartige Assistenzsysteme. Aber was ist KI? Was ist am KI-gesteuerten Roboterjournalismus sinnvoll und was nicht – und kann man damit wirklich Kosten sparen?

Das prägnanteste Beispiel für potentiell negative Folgen der Künstlichen Intelligenz (KI) ist bereits 50 Jahre alt. Es stammt aus dem immer noch sehenswerten Stanley Kubrick-Film „2001 Odyssee im Weltraum“ und wird heute gerne bei Diskussionen um den aktuellen Megatrend KI zitiert – ohne den Inhalt zu benennen. Schlüsselszene: Die zwei Raumschiff-Kapitäne hatten bei ihrem KI-gesteuerten Bordcomputer Hal 9000 fehlerhafte Algorithmen ausgemacht und wollten ihn deshalb abschalten. Sie versteckten sich vor Hal 9000 in einer Nische hinter einer Glasscheibe, um zu beraten, wie sie vorgehen sollen. Doch Hal 9000 hatte in seiner KI längst auch die Kunst der Videoanalyse gespeichert, nämlich mit seinem magischen Auge von den Bewegungen der Lippen ablesen zu können, was gesprochen wird. Er wollte nicht sterben, drehte vielmehr flugs den Spieß um, und entwickelte ein Programm, um sukzessive die ganze menschliche Raumschiff-Mannschaft zu töten. Aber ein Mensch überlebte. Hal 9000 agierte nicht im Sinne der Menschen, sondern verfolgte das Ziel seines eigenen System-erhalts. Kubrick hatte sich von NASA-Forschern beraten lassen, die schon damals detaillierte Vorstellungen davon hatten, wie in ferner Zukunft KI technologisch funktionieren könnte, aber noch nicht über die Rechnerleistung verfügten, um es realisieren zu können. 

„Werden in Zukunft wild gewordene Roboter die Menschheit vernichten?“, fragte Moderator Gerald Meyer (rbb) auf dem PTKO-Forum Detlef Sold. Er zeichnet seit 2012 als CEO von tcp für die Produktionstechnik der 100-prozentigen SRF-Tochter verantwortlich. Sold hatte einen spannenden Vortrag zu den KI-Aktivitäten (Automation und KI Ansätze) des SRF im Rahmen der internationalen Entwicklungen gehalten, der im Mittelpunkt des Forums stand. Auf die vom Moderator skizzierte Weltuntergangsangst wegen KI antwortete Sold zwar ganz cool: „Das ist Science Fiction“. Allerdings sei es „theoretisch eine Gefahr“. So habe „einer“, wie Sold sagte, „der die Zukunft maßgeblich mitgestalten will, Tesla-Chef Elon Musk“, mehrfach vor KI gewarnt, weil er sie für gefährlicher als Atomwaffen hält. Obwohl Musk Regulierung grundsätzlich ablehne, fordere er sie speziell für KI. Auch wies Sold darauf hin, dass erst kürzlich führende KI-Forscher von den Universitäten Stanford, Oxford und Tohoku sowie Entwickler von Microsoft und Google in einem gemeinsamen Moratorium vor bösartigen Nutzungen der KI warnten, wie sie beispielsweise im Bereich der automatischen Bilderkennung und Bildgenerierung vorkommen könne. Und in der Diskussion betonte Sold, der Einsatz von KI müsse auch in Medienunternehmen von einem „ethischen moralischen Framework beim Programmieren“ begleitet werden. Er teile beispielsweise die Ansicht „einiger Forscher“ nicht, wie etwa denen von der BBC, die ihre Sichtweise auf dem Media Future Day in Zürich vorgetragen hatten, wonach „KI objektiver und deshalb besser“ als Menschen sei. Zu Beginn seines Vortrags hatte Sold festgestellt: „Assistenzsysteme in der Produktion und Regie sind – mit Verlaub gesagt – schon alte Hüte“. Er präsentierte filmisch ein Produktionssystem, das autonom und selbständig achsengerecht Licht korrigieren kann, je nachdem, wie sich eine Person im Studio bewegt. Ein „Assistenzmittel“ also, wie Sold hinzufügte, das hilft, Standardproduktionen mit weniger Personal und Aufwand zu realisieren. 

Operator-Aufgaben ändern sich

„Auf Unternehmensseite liegen die Vorteile auf der Hand“, hatte Birgit Spanner-Ulmer, PTKO-Vorsitzende und Produktions- und Technikdirektorin beim Bayerischen Rundfunk in ihrer Keynote referiert: „Mit wenig Personaleinsatz lässt sich die gleiche Anzahl an Prozessen mit hoher Güte und Zuverlässigkeit abarbeiten.“ Beispiel vollautomatisiertes Studio der „Tagesschau“. Die dabei eingesetzten Roboterkameras „bestechen dadurch, dass sie ermüdungsfrei und präzise sind“. Der Mensch werde durch neue Technik nicht überflüssig, aber seine Aufgaben, etwa vom Kameramann zum Studiooperator, veränderten sich. „Technik muss den Menschen dienen und nicht umgekehrt“, betonte Spanner-Ulmer.

Nach den schon vorhandenen Assistenzsystemen für die Produktion gehe es nun um die „nächste Stufe“ der Automatisierung, erklärte Sold. Was heißt das genau? Solds Fernziel ist ein „KI-getriebener Newsroom-OS“. Ein Newsroom auf Basis eines vernetzten Betriebssystems, das verschiedene Computer und Anwendungsprogramme als ein „Operating System“ (OS) zusammenfasst. Was technologisch einfach klingt, ist ein Mammutprojekt. Eine Herkules-Aufgabe, die voraussetzt, dass die gesamte Unternehmensstruktur des öffentlich-rechtlichen SRF, die sich mit der Recherche und Produktion von Nachrichten und Multimedia beschäftigt, „artifiziert“ (Sold), auf die Funktionsweise von „Artificial Intelligence“ umgestellt werden müsste. 

Im Zentrum dieses Projekts stünde dann ein automatisiertes Archivsystem für Audio, Video und Texte, das selbstlernend aus einem Meer an teils automatisiert gespeicherten Daten herausfiltert, welche Inhalte der Welt wichtig für die Schweizer in ihrem öffentlich-rechtlichen SFR sind, für dessen Erhalt sie sich kürzlich in einem Volksentscheid ausgesprochen haben. Der KI-gesteuerte Newsroom müsste dabei unter anderem neben Sprachen wie Deutsch, Englisch und Französisch die Transkription von 28 regionalen Schwitzerdütsch-Dialekten beherrschen. Das System soll in der Lage sein Fakten zu checken, also Wahrheit von „Fake“ unterscheiden können. Es soll Empfehlungssysteme für menschliche Rechercheure offerieren, eine Personalisierung der Information über verschiedene Distributionswege, insbesondere via Internet, realisieren und natürlich auch den Roboterjournalismus meistern, das heißt: autonom selber multimediale Nachrichten erstellen. 

 

Automatische Gesichtserkennung

Als ein schon praktiziertes KI-gesteuertes Teilsystem für die Videoanalyse hob Sold ein Projekt des britischen Kanals Sky News hervor, das anlässlich der Berichterstattung über die letzte königliche Hochzeit online eingesetzt worden war. Dem System gelang es, wie Sold wertete, „ziemlich zuverlässig“ die Livestream-Videobilder der geladenen und zur Hochzeit eintreffenden Gästen automatisch mit ihren Namen und persönlichen Zusatzinformationen zu versehen. Denn weil bei der Hochzeit nur prominente Gäste geladen waren, konnte das System ihre Gesichter mit denen im Archiv gespeicherten Gesichtern vergleichen und mit den dort erfassten Infos bestücken. Diese Art der automatischen Gesichtserkennung wird insbesondere von den Forschern bei Amazon und dem chinesischen Konkurrenten Alibaba vorangetrieben. 

KI bedeutet laut Sold: „Wir wollen Maschinen intelligentes Denken beibringen.“ Dabei sollen Maschinen „selbstständig lernen, sich selbst mit den Grunddaten, mit denen wir sie füttern, programmieren und den Weg zur Lösung selbst finden. Das ist autonomes Lernen, autonome KI.“

 

Das MEDAS-Projekt der ARD

Ein ähnliches KI-gesteuertes Newsroom-Projekt ist auch bei der ARD in Planung. Es wurde Ende 2016 aus der Taufe gehoben und heißt MEDAS (Mediadatensystem). Es befindet sich noch in der Konzeptphase, die von Oliver Hofrichter (Radio Bremen) und Tobias Tiesler (SWR) unter dem Vortrags-Rubrum „Automation im Archiv – Audiomining“ vorgestellt wurde. Damit strebt die ARD an, „übergreifende Recherchen über alle Systeme des Sende- und Produktions-Workflows“ zu ermöglichen. Man will „zentrale ARD Mining-Systeme“ schaffen, die eine einheitliche automatisierte Erschließung des Contents ab der Phase der Produktion“ ermöglichen. Den Entwicklern schwebt offensichtlich ein News-Kreislauf, eine Art Perpetuum Mobile, vor: Kaum ist eine News produziert und distribuiert, landet sie im automatisierten Archiv, das sie in verschiedenen Zusammenhängen wieder selbstlernend verwertet. Voraussetzung für die Basis des Gesamtsystems ist allerdings die Analyse in Form der automatischen Spracherkennung. Um News einheitlich als Daten zu speichern, muss beispielsweise das gesprochene Wort in Text umgewandelt werden. Für diesen Prozess wurde ein Computerprogramm demonstriert, das anstrebt Audio fast in Echtzeit in Text umzuwandeln. 

Was die ARD mit dem KI-Projekt MEDAS erreichen will, erläuterte Michael Eberhard, Direktor Technik und Produktion des SWR, in der abschließenden Diskussionsrunde. Man wolle damit dem „finanziellen Druck“, der auf der ARD laste, begegnen und mit Hilfe von KI und Automatisierung „schneller hochwertigen Content produzieren und distribuieren“, wozu als Voraussetzung auch eine schnellere, weil automatisierte Recherche notwendig sei. Was die Rationalisierung und Veränderung der Arbeitsplätze angeht, meinte Eberhard: „Wir müssen enorm viel Kraft in die Qualifikation stecken – wir müssen Menschen allokieren, sie aber auch weiterbilden“. Beim „Switch von MAZ-Maschinen zu Computerterminals“ sei es auch prima gelungen, „Menschen an neue technologische Umgebungen zu führen“. Eberhard ist überzeugt: Wir müssen uns die neuen Systeme nutzbar machen“. Allerdings dürfe man dabei auch nicht „blind Entwicklungen hinterher laufen“. Vielmehr müsste man sich bewusst darüber sein, dass „eine Gefahr“ bestehe, die man durch „eigene Regularien“ eindämmen müsse. Als eine Gemeinschaftsveranstaltung sei die ARD verpflichtet, sich mit Hilfe der neuen KI-Systeme so zu vernetzen, so dass man auch mit weniger Finanzierungs-Ressourcen in Zukunft Content in hoher Qualität generieren könne: um „die Leute glücklich“ zu machen, fügte Eberhard hinzu. 

Große Visionen, aber wie sieht die Realität aus? „Robotjournalismus“, so referierte Sold, ist heute schon gang und gäbe. Zwar können Roboter keine Hintergrundberichte fertigen, aber Daten wie etwa zu Sportergebnissen, Verkehrslage oder Wetterprognosen in Nachrichten transformieren. Viele Zeitungen in Deutschland und der Schweiz arbeiten längst damit. Und auch neun der vierzehn in einer Studie der Oxford-Uni befragten Nachrichtenagenturen. Wobei die Uni Zürich herausgefunden hat, wie Sold referierte, dass die von Robotern erzeugten journalistischen Inhalte von den Lesern „als genauso glaubhaft wahrgenommen“ werden „als wären sie von realen, wirklichen Köpfen gemacht“. 

Hauptgrund, warum es ein Gebot der Stunde sei, dass Medienunternehmen KI-Systeme einsetzen müssten: „Der Input von Informationen steigt exponentiell an“. Jährlich finde eine Verdopplung der digitalen Informationen statt, betonte Sold. Gleichzeitig würden im Internet immer mehr „Ausgabe-Formate für die Personalisierung von Informationen“ eingesetzt. Hingegen, so beschrieb Sold die öffentlich-rechtliche Finanz- und Personalsituation, blieben „die personellen Ressourcen auf der technischen und redaktionellen Seite gleich oder sinken sogar“. 

Aber stimmt das auch? Sind es „Informationen“, die exponentiell ansteigen oder eher „Daten“, die undifferenziert und in einem viel zu schnellen Tempo als elektronische Signale durch das Netz jagen? Was ist eine Qualitätsinformation und wer definiert die eigentlich? Muss alles, was an Daten durch den Kosmos schwirrt, medial aufbereitet werden?

Einerseits behauptet Sold, dass es hinsichtlich der zu berücksichtigenden Daten heute ein „Mengenproblem“ gebe: „Redaktionen sind gar nicht mehr in der Lage die Menge aufzuarbeiten“. Andererseits klagt Sold darüber, dass man im SFR-Unternehmen über viel zu wenig für KI-Systeme verwendbare Daten verfüge. Historisch gewachsen sind da nicht Daten- oder Metadatenmengen, die in Archive gelangen, sondern multimediale Informationen. Das meint Sold mit „artifizieren“: Informationen müssten in solche Daten transformiert werden, die die KI-Systeme verstehen. So fordert Sold, man müsse „in eine eigene Datenarchitektur investieren, Daten konsequent per APIs verfügbar machen.“ Ergo: „Die Leute der Stunde sind die, die in der Lage sind diese APIs zu programmieren“, sagte Sold. Das Problem aber sei, dass es sie nicht in ausreichender Zahl auf dem hiesigen Markt und auch nicht in Ausbildung an den Unis gebe. Werden in Zukunft die Arbeitsplätze der öffentlich-rechtlichen Medien von Schnittstellen-Programmierern dominiert? Einerseits nennt Sold als Ziel „so viel wie möglich niedrig qualifizierte operative Tätigkeiten zu automatisieren, um Mitarbeiter mit höher qualifizierten Tätigkeiten zu entlasten. Andererseits gibt er offen zu: „Das klingt abstrakt. Wahr ist, dass Automatisierung dazu dient zu rationalisieren, Kosten zu reduzieren und Mitarbeiter zunächst einmal frei zu setzen, aber eventuell dann anderweitig zu qualifizieren oder anderweitig qualifiziert zurück zu holen“. Ob man aber mit KI-Systemen tatsächlich, wie auch als Ziel von Eberhard genannt, Kosten reduzieren kann, steht nur in den Sternen. Sold räumte ein, dass es „nicht einfach“ sei Kosten und Nutzen für KI-gesteuerte Automatisierung zu analysieren, weil man sich „in den Systemen schnell verliert“. Aber es besteht ein internationaler Wettbewerbsdruck auch für Medienunternehmen. Acht große Unternehmen beherrschen laut Sold den KI-Markt. Es sind die üblichen Verdächtigen wie Google & Co, in dessen Markt zunehmend auch die Chinesen drängen. Allein im Fachgebiet Machine Learning“ seien bei Amazon 5.000 Ingenieure beschäftigt. Google und Microsoft kämen auf jeweils 9.000 Ingenieure. Die absolute Spitze nehme das chinesische Unternehmen Alibaba mit 25.000 Ingenieuren ein. Weltweit, so Sold weiter, gebe es 2.400 Player die neben den acht Großen tätig sind, die sich im Produkt- und Plattformbereich um Entwicklung neuer Dienste mit KI beschäftigen. Der extrem wachsende Markt werde von großen Kapitalgebern und riesigen Summen an Forschungsgeldern forciert.

 

Kontrapunkt zur KI-Automatisierung

Nun setzte das PTKO-Forum mit einem Referenten, Jan Meyer-Veden, Managing Editor der schweizerischen Firma getAbstract, auch einen Kontrapunkt zur KI-Automatisierung. GetAbstract wurde 1999 als Startup mit Internet-Auftritt gegründet und hat sich zum Ziel gesetzt, komplexe Informationen leicht zu machen. Mit heute 650 Verlagspartnern und 120 Fachjournalisten rund um den Globus bietet die Firma Zusammenfassungen, „Abstracts“, von Business-Büchern und Weltliteratur an. Ziel sei es nicht, wie Meyer-Veden erläuterte, die Werke durch Abstracts zu ersetzen, sondern die Leser darauf vorzubereiten, was sie als Inhalte erwartet. Das Geschäft floriert ganz offensichtlich. Zwar war das Thema des Referats von Meyer-Veden in der Einladung zum PTKO-Forum noch mit den Worten beschrieben, es handele sich um „Textextraktion beziehungsweise -kompression als komplexer, weitgehend IT-unterstützter Prozess“. Tatsächlich aber werden, wie Meyer-Veden ausführte, die Zusammenfassungen ohne jede Technikhilfe, allein vom jeweiligen Fachjournalisten erstellt. Die KI sei noch weit davon entfernt, in der Lage zu sein, Texte in ihrem Inhalt zusammenzufassen. Das habe sogar Vic Gunotra, ehemaliger Google-Vizepräsident, vor nicht langer Zeit festgestellt. Wozu Sold ergänzte: „Die Rechenleistung für solche komplexen Vorgänge wie Zusammenfassung von Texten existiert noch gar nicht“. Außerdem, so Sold: „Würde eine Maschine die Zusammenfassung machen, wäre es eine große Gefahr. Das muss kontrolliert werden, was zusammengefasst wird und dass nicht die falschen Schlüsse gezogen werden. Ein Risiko.“ Man wird wohl in Medienunternehmen eine Menge menschlicher Kontrolleure brauchen, sollte es demnächst nur noch KI-gesteuerte Newsrooms geben. Wie sollen dann Kosten eingespart werden?

Am Rande des Forums haben wir Meyer-Veden noch rasch eine ketzerische Frage gestellt: War der menschliche Prozess, den er in seinem Vortrag zur Zusammenfassung von Texten beschrieb, nicht auch ein Algorithmus? Ja, sagte er. Aber der Unterschied zwischen Mensch und Maschine bestehe darin, dass der Mensch nicht allein nach einem Algorithmus handele, sondern gleichzeitig seine Vernunft zur Beurteilung von Inhalten einsetze – wie auch die Fähigkeit, sich in andere Menschen einfühlen zu können. 

Erika Butzek

MB 4/2018

© rbb

Zurück