KI und Literaturübersetzen – wie sinnvoll ist das?

Kann Künstliche Intelligenz auch Literatur übersetzen? Viele Verlage, doch auch Übersetzer*innen stellen sich diese Frage, da sie sich von KI-Tools erhebliche Zeiteinsparungen und finanzielle Vorteile erhoffen. Inzwischen gibt es einige Studien, die dieser Frage nachgegangen sind.

Studien zu KI-generierten Übersetzungen literarischer Texte und Post-Editing

Bei der Studie des Projekts Kollektive Intelligenz führten 14 professionelle Literaturübersetzer*innen im Frühjahr 2023 mehrere Experimente mit zwei Textausschnitten durch; der eine aus einem Unterhaltungsroman, der andere aus einem Sachbuch. Sie bearbeiteten den ihnen zugeteilten Text anhand von unterschiedlichen Aufgabenstellungen mithilfe von DeepL. Anschließend erstellten sie einen Bericht zu ihrem jeweiligen Workflow. Zu jedem Bericht gab es zudem eine Peer Review. Die Zusammenfassung und Auswertung der Studie finden Sie hier.

© mikemacmarketing via Wikimedia Commons, source: https://www.flickr.com/photos/152824664@N07/30212411048/
Wie sich herausstellte, überwogen die Nachteile der maschinellen Übersetzung (MÜ) deutlich. Sie konnte dem Original auf mehreren Ebenen nicht gerecht werden. Von Zeitersparnis beim Post-Editing konnte aufgrund des hohen Nachbearbeitungsbedarfs keine Rede sein. Die Studie hebt zudem drei Effekte hervor, die die Nachbearbeitung von KI-Übersetzungen durch Menschen negativ beeinflussen: Vorprägungseffekt (priming effect), Ermüdungseffekt (fatigue effect) und Hinderniseffekt (obstacle effect).

Die Ergebnisse zeigen, dass DeepL – laut Werbeslogan angeblich „der präzisteste Übersetzer der Welt“ – bei sprachlich, inhaltlich und stilistisch komplexen Texten nach wie vor nicht leistungsfähig genug ist, um Literaturübersetzende bei ihrer Arbeit in einem signifikanten Maße weiterzuhelfen. Das CREAMT Project kam 2022 ebenfalls zu dem Ergebnis, dass das Post-Editing von maschinellen Übersetzungen die Kreativität beim Literaturübersetzen hemmt. Auch die Übersetzerin Miriam Neidhardt kam 2022 in ihrem Selbstversuch, einen Roman mit DeepL zu übersetzen zu dem Schluss, dass das Post-Editing maschineller Übersetzungen keine Zeit spart und aus verschiedenen Gründen zu mühselig ist. Ich habe 2021 ebenfalls einen Selbstversuch mit einer maschinellen Romanübersetzung durchgeführt und kann es nur bestätigen. Das gilt übrigens auch für das KI-Tool ChatGPT, das ich regelmäßig auf seine übersetzerische Leistungsfähigkeit teste. Die Ergebnisse der genannten Studien lassen sich durch die Funktionsweise von Künstlicher Intelligenz erklären.

Was ist Künstliche Intelligenz und wie funktioniert sie?

Künstliche Intelligenz (KI) ist ein Sammelbegriff für die Fähigkeit von Maschinen, Aufgaben zu übernehmen, die normalerweise der menschlichen Intelligenz vorbehalten sind. KI basiert auf Algorithmen und Programmen, die Maschinen in die Lage versetzen, auf Basis von Mustererkennung und Wahrscheinlichkeitsrechnung bestimmte Aufgaben zu erfüllen. Unter anderem können KI-Systeme Texte und Übersetzungen generieren, die von Menschen erstellt zu sein scheinen. KI-Systeme werden mit gigantischen Textmengen trainiert. Für die Textgenerierung werden verschiedene Techniken und Modelle verwendet, darunter neuronale Netzwerke und GPT-Modelle (Generative Pre-trained Transformer).

Obwohl KI-Systeme in der Lage sind, Texte zu generieren, fehlt ihnen das tiefgreifende Verständnis, das Menschen beim Lesen und Verarbeiten von Texten haben. Menschen können Texte aufgrund ihres breiten Hintergrundwissens, ihrer Erfahrungen und ihres kontextuellen Verständnisses interpretieren und sind imstande, Nuancen, Ironie, Metaphern und kulturelle Bezüge zu erkennen. KI-Systeme können das nicht, da sie kein Bewusstsein haben. Sie können daher auch nicht beurteilen, ob die Übersetzungen, die sie liefern, richtig oder falsch sind.

Bei bestimmten Fachtexten mit einfacher oder standardisierter Sprache und Syntax können KI-generierte Übersetzungen den Menschen bereits nützliche Arbeitsgrundlagen liefern, etwa bei Gebrauchsanleitungen, Beipackzetteln oder Verträgen. Ein Grund dafür ist, dass KI-Systeme zu Trainingszwecken mit unzähligen öffentlich zugänglichen und bereits in verschiedene Sprachen übersetzten Texten aus den Bereichen Technik, Pharmazie und Recht gefüttert wurden. Bei der Übersetzung von sprachlich, inhaltlich und stilistisch anspruchsvolleren und komplexeren Texten, die zudem hochindividuelle und einzigartige Werke darstellen – etwa Romane und Sachbücher -, stoßen KI-Systeme jedoch nach wie vor an ihre Grenzen. Ihre Entscheidungen basieren auf Algorithmen, die von Menschen programmiert wurden, nicht auf bewusster, kreativer Eigenständigkeit.

Es sollte daher den Übersetzer*innen überlassen bleiben, ob und in welchem Umfang sie KI-Tools bei ihrer Arbeit verwenden, denn sie als Expert*innen können deren Nutzen am besten beurteilen. Verlage, die erwägen, ein literarisches Werk teilweise oder komplett maschinell zu übersetzen und anschließend post-editieren zu lassen, sollten sich dreimal überlegen, ob diese Vorgehensweise im jeweiligen Fall überhaupt sinnvoll ist. Die meisten literarischen Werke dürften sprachlich so komplex sein, dass eine maschinelle Übersetzung von zu schlechter Qualität wäre – und deren Post-Editing durch eine*n Literaturübersetzer*in zöge ungefähr den gleichen Zeitaufwand nach sich wie eine Übersetzung, die er/sie von Grund auf selbst erstellen würde.

Worin unterscheiden sich KI-generierte Übersetzungen von menschlichen?

Ein entscheidender Aspekt, über den sich alle Beteiligten klar sein sollten, ist, dass das Post-Editing KI-generierter Übersetzungen einen vollkommen anderen Arbeitsprozess darstellt als eine Übersetzung, die von Grund auf durch einen Menschen erschaffen wird – mit weitreichenden Folgen. Im Idealfall haben menschliche Literaturübersetzer*innen Zeit, sich das Original durchzulesen, bevor sie mit ihrer eigenen Übersetzung beginnen. So können sie sich schon einmal mit dem Inhalt vertraut machen – bei einem Roman z.B. mit der Handlung, den Charakteren und deren Entwicklung. Dies ist jedoch nur eine relativ oberflächliche Lektüre. Erst während des Übersetzungsprozesses lernen sie das Original intensiv kennen, steigen Satz für Satz tief in das Werk ein und entwickeln durch diese kontinuierliche Nähe zum Original ihre eigene Fassung in ihrer Muttersprache. Natürlich redigieren sie ihre eigene Übersetzung dabei fortlaufend, doch stets im engen Dialog mit dem Original. Nach dieser intensiven Lektüre sind sie mit dem Original sehr vertraut, haben die Details und den Gesamtkontext verstanden und können nun zum Feinschliff ihrer eigenen Übersetzung schreiten, mit der sie ebenfalls sehr vertraut sind.

Es ist immens wichtig zu verstehen, dass dieser elementare Prozess des allmählichen Kennenlernens des Originals und der eigenen Übersetzung beim Post-Editing maschineller Übersetzungen verlorengeht. Literaturübersetzer*innen sollen nun mit zwei Texten arbeiten, die nicht von ihnen stammen. Falls sie überhaupt die Zeit haben, das Original vor Beginn des Post-Editings zu lesen, lernen sie es nur oberflächlich kennen, nicht im Detail. Die maschinelle Übersetzung ist ihnen vollkommen fremd. Und unter diesen suboptimalen Arbeitsbedingungen sollen sie nun die maschinelle Übersetzung mit dem Original abgleichen und perfektionieren.

KI-generierte Übersetzungen enthalten bestimmte Arten von Fehlern, die bei der Übersetzung durch einen erfahrenen menschlichen Profi in dieser Häufigkeit nicht auftreten würden. Aufgrund seiner Funktionsweise übersetzt ein KI-Tool unter anderem grundsätzlich zu nah an der Syntax des Originals, zu wörtlich, nicht idiomatisch genug, kann Doppeldeutigkeiten, Humor oder Ironie nicht erkennen, klingt stilistisch seltsam leblos, besitzt oft auch das nötige Hintergrundwissen nicht, um inhaltlich richtige Lösungen zu liefern. Und vor allem ist es nicht in der Lage, die Metaebene zu erkennen; es übersetzt Segment für Segment, ohne Kontextbezug.

Die besondere Problematik des Post-Editings maschineller Übersetzungen

Die erwähnte doppelte Fremdheit plus die typischen Fehler KI-generierter Übersetzungen führen dazu, dass Übersetzer*innen sich beim Post-Editieren noch mehr konzentrieren müssen als bei der Erschaffung ihrer eigenen Übersetzung oder bei der Redaktion der Übersetzung menschlicher Kolleg*innen. Die Folge ist, dass ihr Fokus sich verlagert: vom Original, wo er stets liegen sollte, auf die maschinelle Übersetzung, die ihnen, wie gesagt, fremd ist und Fehler enthält, die sie oder andere Menschen in dieser Form und Häufigkeit nicht machen würden. Hinzu kommt, dass die KI-generierte Übersetzung einen Grundton setzt, der die Entfaltung der eigenen Kreativität behindert und das Finden der richtigen Stimme, die die dem Original wirklich gerecht wird, erschwert. All das wirkt sich auf die Qualität des Endergebnisses aus.

Das Post-Editing einer KI-generierten Übersetzung ist kein Literaturübersetzen im eigentlichen Sinne mehr, sondern eine besondere Form des Übersetzungslektorats, die von den spezifischen Problemen der maschinellen Übersetzung dominiert wird. Sie ist weder im Interesse der Literaturübersetzer*innen, noch der Verlage und der Leser*innen, geschweige denn der Originalautor*innen. Zudem stellt diese Vorgehensweise, wenn sie von Verlagen vorgeschrieben wird, einen massiven Eingriff in die Arbeitsweise freiberuflicher Übersetzer*innen dar und verletzt ihr Recht auf kreative Selbstbestimmung und eigenständige Gestaltung ihrer Arbeitsbedingungen.

Welches Honorar ist für das Post-Editing maschineller Übersetzungen angemessen?

Wer trotz der zuvor geschilderten Nachteile und Unwägbarkeiten bereit ist, Post-Editing-Aufträge anzunehmen, sollte den Zeitaufwand realistisch einschätzen und auf einem angemessenen Honorar bestehen. Post-Editing-Anfragen an Übersetzer*innen in Richtung „Wir haben das schon maschinell vorübersetzt, also müssen Sie nicht mehr viel machen, das wird schnell gehen; ein Drittel (oder die Hälfte) des üblichen Normseitenhonorars erscheint uns daher angemessen“ sind unseriös: Der Arbeitsaufwand wird nicht nur unrealistisch eingeschätzt, sondern auch noch heruntergespielt, um das Honorar zu drücken, was vollkommen inakzeptabel ist. Von der Idee mancher Verlage, eine maschinelle Übersetzung aus Kostengründen von Nicht-Übersetzungsprofis nachbearbeiten zu lassen, die die Sprache des Originals nicht beherrschen, kann ebenfalls nur abgeraten werden. Falls Ihr guter Ruf als Verlag oder Übersetzer*in darauf gründet, dass Sie Ihrer Kundschaft bisher Werke von hoher Qualität geliefert haben, überlegen Sie bitte, was Sie mit KI-generierten Übersetzungen und deren Post-Editing aufs Spiel setzen – auch mit Blick auf die Originalautor*innen, die vielleicht gar nicht möchten, dass ihre Werke, an denen sie Monate, wenn nicht Jahre, persönlich gefeilt haben, maschinell übersetzt werden.

Verlagen sollte erklärt werden, wie hoch der Zeitaufwand voraussichtlich sein wird. Beim Post-Editing von maschinellen Übersetzungen anspruchsvoller literarischer Texte muss aufgrund der zuvor beschriebenen typischen Fehler der KI und deren Häufigkeit ein Großteil des Textes komplett überarbeitet werden. Oft sind aufgrund der zu großen Orientierung an der Syntax des Originals, die sich durch den gesamten Text zieht, umfangreiche syntaktische Umstellungen erforderlich. Zu wörtliche Übersetzungen müssen umformuliert und ggfs. idiomatischer gestaltet werden. Zudem setzt die maschinelle Übersetzung einen seltsam leblosen Grundton, was eine umfangreiche stilistische Überarbeitung erfordert. Auch die inhaltliche Richtigkeit der maschinellen Übersetzung muss überprüft werden. All das kostet mindestens genauso viel Zeit wie eine menschliche Übersetzung. Entsprechend hoch sollte das Honorar sein.

Bei Literaturübersetzungen ist es üblich, ein Normseitenhonorar zu veranschlagen. Bei Werken, die einen überdurchschnittlich hohen Rechercheaufwand erfordern, um es inhaltlich richtig übersetzen zu können, ist ein Recherchezuschlag üblich. Dieser sollte ggfs. auch beim Post-Editing gefordert werden. Bezüglich angemessener Normseitenhonorare sei auf die Gemeinsame Vergütungsregel für Übersetzungen des VdÜ, des VS und der unterzeichnenden Verlage verwiesen, die ein Normseitenhonorar von 19,00 Euro bei durchschnittlich anspruchsvollen bzw. 23,00 Euro bei besonders anspruchsvollen Übersetzungen vorsieht, plus Beteiligungen. Ebenfalls verwiesen sei auf die Präsentation „Basishonorare für Kreative“ von ver.di, die für literarische Übersetzungen sogar noch mehr fordert.

Urheberrechtliche Aspekte bei der Nutzung von Künstlicher Intelligenz

Die Eingabe urheberrechtlich geschützter Inhalte, z.B. eines Romans oder Sachbuchs, in ein KI-System stellt eine Urheberrechtsverletzung dar, nämlich eine Vervielfältigung im Sinne des § 16 UrhG. Eine gesetzliche Schranke in § 44b UrhG erlaubt derzeit Vervielfältigungen urheberrechtlich geschützter Werke für das sogenannte Text- und Datamining (TDM), um KI-Systeme zu trainieren. Allerdings ist dies nur bestimmten Organisationen erlaubt, und auch nur zu Forschungszwecken, nicht für kommerzielle Zwecke. Wenn ein Unternehmen oder eine Person ein urheberrechtlich geschütztes Werk in ein KI-System eingibt, um es übersetzen zu lassen und die maschinelle Übersetzung anschließend zu verkaufen, sei es an einen Verlag oder an die Leserschaft, handelt dieses Unternehmen bzw. diese Person kommerziell, was die Frage aufwirft, ob sie sich überhaupt auf § 44b UrhG berufen kann.

KI-generierte Werke sind urheberrechtlich nicht geschützt, da es sich bei einer künstlichen Intelligenz nicht um eine Persönlichkeit handelt und sie daher nicht Urheberin sein kann. Laut § 2 Abs. 2 UrhG sind nur persönliche geistige Schöpfungen geschützt; laut § 7 UrhG ist der Schöpfer eines Werks dessen Urheber. In der Entscheidung EuGH, 12.09.2019 – C-683/17 – Rn. 30 – Cofemel heißt es, dass eine für urheberrechtlichen Schutz erforderliche eigene geistige Schöpfung dann vorliegt, wenn der geschaffene Gegenstand „die Persönlichkeit seines Urhebers widerspiegelt, indem er dessen freie kreative Entscheidungen zum Ausdruck bringt“. Nur Werke, die von Menschen geschaffen sind, genießen also Urheberrechtsschutz. Wird eine KI-generierte Übersetzung durch einen Menschen nachbearbeitet, muss eine ausreichende Schöpfungshöhe vorliegen, um Urheberrechtsschutz auszulösen.

Die rechtliche Lage bezüglich der Nutzung von KI-Tools ist aktuell noch in vielerlei Hinsicht unklar. In diesem Zusammenhang sei auch auf die Forderung der Initiative Urheberrecht vom April 2023 von Maßnahmen zum Schutz vor generativer KI in der Europäischen KI-Verordnung verwiesen; die Initiative Urheberrecht (IU) repräsentiert über 40 Verbände und Gewerkschaften, darunter auch den VdÜ, den VS und PEN Deutschland. In den USA haben inzwischen einige Autor*innen Klagen gegen KI-Unternehmen wegen Urheberrechtsverletzung eingereicht; sie werfen OpenAI (ChatGPT) und Meta (Facebook) vor, ihre Bücher ohne ihr Einverständnis zum Trainieren von Künstlicher Intelligenz (KI) verwendet zu haben. In Europa sind ähnliche Klagen zu erwarten.

Was sollte beim Einsatz von KI-Tools aus urheberrechtlicher Sicht beachtet werden?

Grundsätzlich ist es ratsam, bei jedem KI-Tool, das für die Übersetzung urheberrechtlich geschützter Texte eingesetzt werden soll, vorher sicherzustellen, dass es die Möglichkeit bietet, die Speicherung des eingegebenen Texts in das KI-System zu Trainingszwecken zu unterbinden, und diese Möglichkeit zu nutzen.

Wer das KI-Tool DeepL nutzen will, um einen urheberrechtlichen geschützten Text (Roman, Sachbuch usw.) übersetzen zu lassen, sollte darauf verzichten, die kostenfreie Version von DeepL zu verwenden, da in dieser sowohl der eingegebene Text als auch die maschinelle Übersetzung automatisch vom KI-System gespeichert und für Trainingszwecke genutzt werden. Dies lässt sich aktuell nur durch Nutzung der kostenpflichtigen DeepLPro-Version vermeiden. Wer ChatGPT für Übersetzungen nutzen will, sollte in den Konto-Einstellungen unter „Data“ die automatisch voreingestellte Speicherung des Chatverlaufs deaktivieren und den Chat anschließend löschen, damit nichts vom KI-System geschluckt wird.

Wer einen Post-Editing-Auftrag für die KI-generierte Übersetzung eines kompletten literarischen Werks annimmt, sollte, um den Umfang und die Schöpfungshöhe der eigenen Arbeit dokumentieren zu können, als erstes die maschinelle Übersetzung in der Fassung speichern, wie sie zugesandt wurde. Die bearbeitete Fassung sollte dann separat davon in einer neuen Datei abgespeichert werden.

Fazit

Bei der Übersetzung komplexer und anspruchsvoller literarischer Texte ist es empfehlenswert, KI-Tools, wenn überhaupt, nur punktuell einzusetzen, also bei einzelnen Sätzen oder kleineren Textabschnitten; als Hilfsmittel, um sich inspirieren zu lassen.

Meine Empfehlung an Verlage lautet: Lassen Sie literarische Werke lieber weiterhin von menschlichen Expert*innen übersetzen, denn dann haben Sie auf jeden Fall eine urheberrechtlich geschützte Rechtsposition aus Ihrem Vertrag mit der/dem Literaturübersetzer*in. Zudem können menschliche Übersetzer*innen im Gegensatz zu KI das Original verstehen und interpretieren und ihm daher auch in jeder Hinsicht gerecht werden. Eine Maschine kann das nicht und wird dazu auch in absehbarer Zeit nicht in der Lage sein.

KI-Systeme funktionieren nicht wie das menschliche Gehirn; sie wurden programmiert, um Übersetzungen auf Basis von Mustererkennung und Wahrscheinlichkeitsrechnung zu erstellen. Anders als Menschen handeln sie nicht kreativ und sind auch nicht in der Lage zu beurteilen, ob ihre Übersetzungen richtig sind. Sie haben weder ein Bewusstsein noch Gefühle, sie erkennen weder Humor noch Ironie noch das, was zwischen den Zeilen steht – und was es bedeutet, in bestimmten Kulturen oder Traditionen verankert zu sein, ist ihnen gleichfalls fremd.

Um Professor Noam Chomsky zu zitieren: „A language is not just words. It’s a culture, a tradition, a unification of a community, a whole history that creates what community is. It’s all embodied in a language.“ („Eine Sprache besteht nicht nur aus Worten. Sprache ist eine Kultur, eine Tradition, die Konsolidierung einer Gemeinschaft, eine ganze Geschichte, die Gemeinschaft erzeugt. Eine Sprache verkörpert all das.“)

Chomskys Zitat stammt übrigens aus dem 2011 erschienenen Dokumentarfilm “We still live here – âs nutayuneân” von Anne Makepeace über die Wiederbelebung der im 19. Jahrhundert ausgestorbenen Wampanoag-Sprache. Menschliche Sprachen sind so alt wie die Menschheit selbst, und nur Menschen können sie wirklich verstehen.