Die Automatische Textgenerierung – Wenn Maschinen ’natürlich‘ sprechen

Blog - Header Hintergrund

Warum noch selber schreiben, wenn das eine Maschine für mich erledigen kann? Ich kann mir stattdessen die Fingernägel wachsen lassen oder andere Dinge mit meinen Händen anstellen, während der geforderte Text automatisch von einem Programm geliefert wird.

Zukunftsmusik? Nicht unbedingt. Die Technologie zu dieser Idee existiert bereits und findet auch schon auf verschiedenen Ebenen Anwendung. Das Grundkonzept besteht darin, ein idealerweise lernfähiges Programm mit Algorithmen zu füttern, damit es über bekannte Muster und wiedererkannte Variablen kurze oder auch längere Texte (wie gewünscht und je nach Anwendungsgebiet) selbständig erarbeitet und zusammenstellt.

Zugegeben: Nicht jede Sparte unseres Lebens profitiert heute schon davon. Die Unterhaltungsbranche etwa experimentiert zwar bereits mit automatischer Textgenerierung. Die Ergebnisse sorgen aber, da dort die jeweiligen Tools freilich noch nicht völlig ausgereift sind, eher noch für Schmunzeln denn für echte Umbruchstimmung. Ein schönes wie erheiterndes Beispiel liefert hier der Kurzfilm Sunspring, bei dem Text bzw. Handlung allein von der KI Benjamin fka Jetson (Ross Goodwin, Oscar Sharp) generiert wurden.

Sie sehen: Zumindest der Unterhaltungswert ist gegeben, allerdings noch losgelöst von der eigentlichen (sofern erkennbaren) Handlung des Films. Wenn es auch noch nicht für das ganz große Kino reicht, zumindest weniger talentierte Schreiberlinge innerhalb der bunten B-Movie-Industrie dürfen ihre warmen Klamotten schon mal vorsichtig aus dem Schrank holen. Vorausgesetzt, Experimente wie Sunspring bleiben keine Einzelfälle. Und wenn das Infinite-Monkey-Theorem auch hier greifen sollte, kommt möglicherweise noch zu unseren Lebzeiten ein Blockbuster mit automatisch generiertem Text in die Kinosäle.

Automatische Textgenerierung als BUSINESS TOOL

Nun ist Automatische Textgenerierung nicht für die Unterhaltungsindustrie entstanden. Es geht vor allem um intelligente Werkzeuge in der Geschäftswelt. Es sei an das Konzept der Sache erinnert: Programme werden aus sinnvoll strukturierten Datenbanken mit Inhalt gefüttert und erstellen daraus eigenständig sprach-textliche Ergebnisse. Wer das heutzutage nicht in seinem Betrieb nutzt, ist selber schuld.

Scopevisio setzt eine solche Technologie selbstverständlich auch ein. Mit ihrer Hilfe kann eine Unternehmenssoftware ereignisgesteuert sprechen lernen (Als “Ereignisse” bezeichnen Programmierer die Aktionen innerhalb der Software). Das Projekt nennt sich ‚Scoper‘ und ergänzt die Unternehmenssoftware von Scopevisio vor allem im Beantworten geschäftsrelevanter Nachfragen: Diese Funktion deckt etwa Themen wie den Forecast, Angebote bzw. Aufträge oder auch die Liquidität ab (um nur einige zu nennen). Die eigene Recherche und der damit verbunde Arbeitsaufwand werden dadurch deutlich reduziert. Scoper kann allerdings auch selbständig über Kommunikationskanäle (E-Mail, Slack, MS Team etc.) wichtige Nachrichten und aktuelle Meldungen im Unternehmen versenden.

Im Folgenden möchte Scopevisio Ihnen diese spannende Idee der automatischen Textgenerierung näherbringen und verraten, was es dabei zu beachten gilt.

Die Grammatik der KI

Ein Beispiel: „Frau Müller bucht eine Eingangsrechnung des Lieferanten Meier AG.“ Im Grunde ist dieses Ereignis ein simpler Aussagesatz mit Subjekt (Frau Müller), Prädikat (bucht) und Objekt (Eingangsrechnung) und einem Bezug zum Aussteller der Rechnung (Meier AG).

Diese Angaben liegen nun im Programm strukturiert als wiederkehrende Größen vor. Daher kann man der Software beibringen, künftig entsprechende Standardsätze zu bilden: Fülltexte bleiben konstant und wechselnde Textteile werden als Variablen eingebunden. Man denke an personalisierte Serienbriefe. Das Prinzip ist dasselbe.

So kann die Software einem Anwender, zum Beispiel Frau Müllers Chef, in natürlicher Sprache – schriftlich oder sogar mündlich – mitteilen: “Am 11. April hat Frau Müller eine Eingangsrechnung der Meier AG gebucht. Die Rechnung belief sich auf 1.235,44 Euro und betrifft das Projekt Strategieberatung Meier.” Und das, ohne dass ein Mitarbeiter den Text so abgetippt hätte.

Management-Berichte aus der ‚Retorte‘

Das war ein sehr einfaches Beispiel. Es sind natürlich auch viel komplexere Mitteilungen möglich. Etwa in Bezug auf Liquiditäts-Forecasts oder vielerlei andere Informationen für Manager oder Controller. Anwender können dabei genau einstellen, was sie wann wissen möchten. Das ist eine große Hilfe, wenn es gilt, aus den vielen verfügbaren Unternehmensdaten die wirklich wichtigen rechtzeitig zu registrieren und herauszufiltern.

Vorsicht vor Datensilos

Eine Grundvoraussetzung für diese automatisierte Textproduktion ist, dass die Software möglichst viele Unternehmensfunktionen integriert. Sonst gibt es sogenannte Datensilos, in denen Informationen künstlich getrennt werden, die eigentlich zusammengehören. Und wenn wir in Prozessen denken, gehören praktisch alle Informationen im Unternehmen irgendwie zusammen: Vom Marketing über den Vertrieb, das Projektmanagement, die Produktion, die Abrechnung bis hin zu Finanzbuchhaltung, Reporting und Controlling.

Produktbeschreibungen automatisch erstellen

Auch E-Commerce-Unternehmen profitieren von der automatischen Textgenerierung. Beschreibungen von Produkten und Kategorien sind häufig sehr ähnlich strukturiert. Damit sind sie ideale Kandidaten für einen Textgenerator. Webshops brauchen sich mit dem mühsamen, fehleranfälligen Geschäft der manuellen Texterstellung nicht mehr abzugeben.

Anwendungen für die automatische Textgenerierung

Doch nicht nur der elektronische Handel und Manager nutzen diese Technologie. Mit der automatischen Textgenerierung können an sich alle Unternehmen arbeiten. Sie eignet sich prinzipiell für Geschäftsprozesse, die häufig ähnliche Texte in einem wiederkehrenden Format hervorbringen.

Das sind allerdings weit mehr als man zunächst denkt: Die Texterstellung funktioniert bereits mit Erfolg bei:

  • Beschreibungstexten für sich ähnelnde Dienstleistungen oder Produkte
  • Stetig wiederkehrenden Berichten, wie etwa die bereits erwähnten Managementberichte aus einer Unternehmenssoftware
  • Geschäftsberichten
  • Börsenberichten und Wirtschaftsnachrichten
  • Newstickern, z. B. über Hochrechnungen bei laufenden Wahlen
  • Sportergebnissen
  • Wettervorhersagen
  • Verkehrsmeldungen
  • Statistischen Informationen

Die Liste ließe sich beliebig fortsetzen. Und je “intelligenter” die automatisierte Texterstellung wird, umso mehr Anwendungen sind denkbar.

Thinking cyborg

Was es zu beachten gilt: Duplicate Content…

Der Begriff “Unique Content” hat sich im Online Marketing für Texte eingebürgert, die im Web einzigartig sind. Dahinter steht die logische Überlegung, dass niemand etwas davon hat, wenn derselbe Text immer wieder auftaucht (“Duplicate Content”). Duplicate Content wird von Suchmaschinen wie Google “abgestraft”, d. h. im Ranking herabgesetzt. Es ist strittig, ab wie viel Prozent Text-Übereinstimmung ein Inhalt als “Duplicate” gebranntmarkt wird, und der zugrunde gelegte Wert ändert sich ständig. Die Algorithmen der Suchmaschinen werden immer besser darin, Plagiate zu erkennen. Deshalb ist einzigartiger (Unique) Content für Marketer wichtig.

…und automatisierter Unique Content

Automatic Unique Content (AUC) – automatisiert erstellter, einzigartiger Inhalt – kann mit cleveren Tools ebenfalls generiert werden. Allerdings nicht für jede beliebige Anwendung. Tauchen zu viele wiederkehrende Textbausteine auf, klingeln bei Google die Alarmglocken.

Ein möglicher Business Case für eine solche Anwendung wäre der Fall, dass ein Webshop viele Texte generiert, in die jeweils verschiedene Produktbeschreibungen eingefügt werden. Das Ganze kann mit Textbausteinen für Einleitungen, Überleitungen und Fazite „aneinander geflanscht“ werden. Nach demselben Prinzip lassen sich auch Produktkataloge generieren.

In diesem Zusammenhang wird auch das sogenannte “Text Spinning” verwendet, das Begriffe immer wieder durch Synonyme ersetzt. Ob das für den Leser funktioniert oder nur für Google, mag dahinstehen. Denn es gibt nur wenige “echte” Synonyme; die meisten drücken unterschiedliche Nuancen eines Konzeptes aus. Sprache ist ökonomisch. Wozu mehrere Begriffe für exakt dieselbe Sache verwenden?

….sowie das ‚Schriftbild‘ computergenerierter Texte

Ein Bericht des SWR über Roboterjournalismus zeigt erstaunliche Beispiele dafür, wie clever die automatische Textgenerierung heute schon arbeitet. Kein Leser kann computergenerierte Sport- und Börsennachrichten von denen menschlicher Autoren unterscheiden. Trotzdem bleiben diese Texte steril, denn sie sind datengetrieben. In einer Studie beurteilten die Probanden computergenerierte Texte zwar als glaubwürdiger, aber nicht so gut lesbar wie die der menschlichen Autoren. Der Grund: Statt persönlicher Sprache warten sie nur mit Fakten und Daten auf. Der Tag, an dem Computer zu Kolumnisten werden, ist also noch fern.

Werden Redakteure irgendwann doch überflüssig?

Nach aktuellem Stand ist das nicht zu erwarten. Automatische Textgenerierung bietet eine Menge, aber noch keine “gute Schreibe”. Fortschrittliche Redakteure, die sich auf bestimmte Themen spezialisiert haben, können allerdings die harten Fakten aus einer vorhandenen Datenbasis automatisiert herausziehen (lassen). Die mühsame Recherchearbeit würde dadurch erleichtert, während der Mensch die kreative Leistung vollbringt. Die Redaktion würde dadurch nicht ‚entmenschlicht‘, vielmehr könnte sich in Zukunft die Arbeit der Redakteure den Fertigkeiten ihrer digitalen Assistenten nach verändern.

Fazit

Automatische Textgenerierung spielt eine immer größere Rolle in immer mehr Betriebsbereichen. Das gilt sowohl für Unternehmen als auch für den Medienbetrieb. Computertexte bestehen aus einem Gerüst von Textbausteinen und variablen Anteilen, die je nach gewünschtem Inhalt und Datenlage eingefügt werden. Auf diese Weise entstehen mächtige Textgeneratoren für Managementberichte, Produktbeschreibungen und sogar auch redaktionelle Inhalte.

Allerdings ist die automatische Texterstellung nicht wirklich kreativ. Vielleicht wird der Kollege Computer ja durch Künstliche Intelligenz eines Tages eine flotte Schreibe entwickeln. Heute hat er sie noch nicht.

 

Video: Ars Technica Videos

Autor:in Dorothea Heymann-Reder
Das könnte auch interessant sein

Digitalisieren Sie noch heute Ihr Unternehmen

Testen Sie die Unternehmenssoftware von Scopevisio kostenlos und unverbindlich. Alle Prozesse in einem System - vernetzt, automatisiert und effizient.