Neuronale Maschinelle Übersetzung und Arabisch

Kann KI Arabisch? Wie gut funktioniert die maschinelle Übersetzung Arabisch<>Deutsch? In meinem ersten Blogbeitrag zu diesem Thema im Jahr 2018 kam ich zu dem Schluss, dass sich neuronale Übersetzungsprogramme mit Arabisch noch sehr schwer tun und sich daran vorerst auch nichts ändern wird. Jetzt schreiben wir das Jahr 2023, die KI wird immer besser, nicht zuletzt dank großer Sprachmodelle (LLM). Bei der Übersetzung Arabisch<>Deutsch sind ebenfalls Fortschritte erkennbar, allerdings auf einem deutlich niedrigeren Qualitätsniveau als bei anderen Sprachen. Woran das liegt und ob sich das ändern wird, erfahren Sie hier.

Die Vorgeschichte

Was heute mit hochleistungsfähigen KI-Systemen so viel Aufmerksamkeit auf sich zieht, hat in der Übersetzungsbranche bereits einen langen Weg hinter sich. Denn die Geschichte der Übersetzungstechnologie reicht bis in die 1950er Jahre zurück, als Wissenschaftler erstmals darüber nachdachten, wie man mit Hilfe von Computern Sprachbarrieren automatisch überwinden könnte.

In den 1980er und 1990er Jahren wurden Translation-Memory-Systeme entwickelt, die einen Meilenstein für die Übersetzungsbranche darstellten und bis heute von professionellen Übersetzerinnen und Übersetzernn als Hilfsmittel verwendet werden. Das Grundprinzip dieser computergestützten Übersetzungssysteme (auch CAT-Tools genannt) besteht darin, dass ein einmal übersetztes Textsegment (Absatz, Satz, Wort…) in einer speziellen Datenbank (Translation Memory) gespeichert wird. Soll der gleiche oder ein ähnlicher Textabschnitt erneut übersetzt werden, wird die gespeicherte Übersetzung automatisch abgerufen und kann wiederverwendet oder bei Bedarf angepasst werden.

In den 2000-er Jahren verhalf die zunehmende Verbreitung des Internets Anbietern wie Google Translation zum Durchbruch, die auf ein statistikbasiertes Übersetzungsverfahren auf der Grundlage einer großen Datenbasis setzten. Das war ein Fortschritt, auch wenn die Ergebnisse noch viele Fehler aufwiesen.

Qualitätssprung durch künstliche Intelligenz

Der große Qualitätssprung kam dann um das Jahr 2016, als die statistischen Verfahren durch neuronale Netze (bekannt als künstliche Intelligenz) ergänzt wurden und die durch die rasanten Fortschritte in der Chipentwicklung stark gestiegene Rechenleistung ganz neue Möglichkeiten eröffnete: Die Übersetzungsergebnisse waren in vielen Sprachkombinationen sprachlich gut formuliert, idiomatisch und auf einem so hohen Niveau, dass die Nachbearbeitung (Post-Editing) des maschinellen Outputs durch einen professionellen Übersetzer in bestimmten Fällen eine Zeit- und Kostenersparnis gegenüber dem herkömmlichen Übersetzungsprozess brachte.

Die größte Errungenschaft der Neuronalen Maschinellen Übersetzung (NMÜ) birgt aber auch die größte Gefahr: Da sich die Texte flüssig und grammatikalisch fehlerfrei lesen, sind fehlerhafte Übersetzungen noch schwerer zu erkennen und für Laien oft unsichtbar. Selbst Profis mussten ihr Auge erst schulen und für die besonderen Tücken des NMÜ-Outputs sensibilisieren.

Inzwischen ist die KI-Revolution in vollem Gange. Systeme wie ChatGPT sind in vielen Branchen das Gesprächsthema Nummer eins. Im Bereich der Übersetzungssprachen setzen viele Dienstleister KI-Engines mit anschließender Nachbearbeitung (Post-Editing) für große Sprachen wie Englisch oder andere EU-Sprachen bereits erfolgreich als Werkzeug in ihrer täglichen Arbeit ein. Natürlich gilt dies längst nicht für alle Fachgebiete, und es gibt auch sogenannte Hochrisikokontexte, in denen der Einsatz von Übersetzungsmaschinen sich aus Gründen der Vertraulichkeit, des Datenschutzes oder z.B. im Bereich der Medizin aufgrund der auf dem Spiel stehenden menschlichen Gesundheit und Sicherheit verbietet.


Abonniere die Falkenpost!

Du möchtest regelmäßig über dieses Thema und vieles mehr informiert werden? Abonniere die Falkenpost – meinen Newsletter rund um die arabische Sprache!


Der stochastische Papagei

Die herausragende Eigenschaft von NMÜ-Systemen liegt  – so beschreiben es die Translationswissenschaftler Oliver Czulo und Ralph Krüger – in ihrer Funktion als Mustererkennungs- und Musterwiedergabemaschinen: Das Programm erkennt Muster in einem ausgangssprachlichen Text (Input) und errechnet daraus ein möglichst wahrscheinliches Muster in der Zielsprache (Output). Dies ist meines Erachtens für das Verständnis der Technologie und ihrer Grenzen sehr wichtig: Der Übersetzungsprozess basiert nach wie vor auf Rechenoperationen und nicht auf echtem Verstehen, eigenständigem Denken und Reflektieren auf der Basis von „gesundem Menschenverstand“ und „Weltwissen“. KI-Systeme werden daher auch als „stochastische Papageien“ bezeichnet.

Arabisch als Herausforderung

Voraussetzung Digitalisierung

Zu den unten genannten sprachlichen Hürden kommt in der arabischen Welt zunächst ein ganz praktisches Problem dazu: Die Digitalisierung ist von Land zu Land sehr unterschiedlich weit fortgeschritten. Während beispielsweise in den wohlhabenden arabischen Golfstaaten viele Texte in digitaler Form vorliegen, ist es in vielen anderen Ländern noch ein weiter Weg zur Digitalisierung, ganz zu schweigen von Kriegs- und Krisengebieten, in denen ganz andere Sorgen im Vordergrund stehen.

In meiner täglichen Übersetzungsarbeit erhalte ich viele Texte als Scans von Ausdrucken, die überhaupt nicht maschinenlesbar oder per OCR konvertierbar sind, so dass sich die Frage nach dem Einsatz eines Translation-Memory-Systems oder gar einer NMÜ-Software gar nicht erst stellt. Nicht selten erhalte ich sogar noch handschriftliche Dokumente zur Übersetzung (Urkunden, Zeugnisse, Obduktionsberichte, ärztliche Atteste…). Die Digitalisierung ist aber die Voraussetzung für das Training der KI-Engines: Je mehr Texte zu den unterschiedlichsten Themen digital vorliegen, desto besser werden auch die Übersetzungsergebnisse.

KI-Übersetzer im Praxistest

Seit 2017 führe ich regelmäßig Testreihen mit verschiedenen arabischen Textsorten und KI-Übersetzungssoftware durch. Dabei stelle ich fest, dass sich die Qualität der Übersetzungsergebnisse von 2017 bis heute – im Jahr 2023 – deutlich verbessert hat. Einfache Texte zu alltäglichen Themen (z.B. Nachrichten oder andere kurze Texte mit klarer Struktur und einfachen Sätzen) werden mit guter Genauigkeit übersetzt und enthalten nur noch wenige Fehler.

Sobald jedoch das Niveau der Texte und damit der Anspruch an die Übersetzung steigt – z.B. bei Übersetzung eines journalistischen Essays,  bei juristischen oder medizinischen Fachtexte oder gar technische Dokumenten –  treten zahlreiche stilistische Schwierigkeiten, offensichtliche Fehler und falsch zugeordnete syntaktische Bezüge auf. Eine maschinelle Vorübersetzung mit anschließender Nachbearbeitung (Post-Editing) durch mich als Übersetzungsprofi bringt in vielen Fällen (noch) keinen Produktivitätsgewinn.

Die Ursachen

Es gibt im wesentlichen drei Gründe, warum sich KI-Übersetzer mit Arabisch so schwer tun.

  1. Die Komplexität der arabischen Sprache. Wie erläutert, arbeitet KI-Übersetzungssoftware mit der Erkennung von Mustern in der Ausgangssprache und generiert daraus einen Zieltext. Im Arabischen kommen mehrere sprachliche Besonderheiten zusammen, so dass die Zahl der möglichen Muster schon rein mathematisch deutlich höher ist als in anderen Sprachen und Weltwissen und außersprachlicher Kontext vielleicht nochmal eine größere Rolle spielen als  bei anderen Sprachen: die komplexe grammatische Morphologie mit Suffixen, Infixen, Präfixen und einem Wurzelsystem mit 10 Wortstämmen; ein hoher Grad an Mehrdeutigkeit durch die arabische Schrift, eine ausgeprägte Polysemie und ein enormer historischer Wortschatz; sowie eine sehr großzügige Syntax mit relativ freier Wortstellung, wenig Interpunktion und oft langen Sätzen.
  2. Mangel an Trainingsmaterial: NMÜ-Software funktioniert dann gut, wenn ausreichend Trainingsmaterial zur Verfügung steht. Im Vergleich zu anderen Sprachen und in Relation zur Größe des Sprachraums ist für Arabisch aber in vielen Themenbereichen nur wenig Trainingsmaterial digital verfügbar. Das liegt zum Teil daran, dass die Digitalisierung in einigen Ländern noch nicht so weit fortgeschritten ist, zum Teil aber auch daran, dass es in manchen Themengebieten überhaupt nicht genügend arabische Texte gibt. Beispiel Medizin: Während medizinische Informationen für Laien in großer Menge auf Arabisch im Internet verfügbar sind, gibt es nur relativ wenige medizinische Fachartikel, da an den medizinischen Fakultäten in der arabischen Welt häufig auf Englisch oder Französisch gelehrt und geforscht wird.
  3. Geographie und Diglossie: Hinzu kommen zwei weitere Besonderheiten des arabischen Sprachraums: Zum einen seine geographische Ausdehnung über mehr als 22 Länder vom Atlantik bis zum Indischen Ozean. Obwohl die gemeinsame Schriftsprache (Hocharabisch) strukturell dieselbe Sprache ist, gibt es von Land zu Land und von Region zu Region unterschiedliche Sprachgebräuche, z.B. bei der Benennung von Institutionen oder in der Rechtsterminologie. Hinzu kommt als zweites Phänomen die Diglossie, das Nebeneinander von geschriebener Hochsprache und gesprochenen Dialekten, die sich von Region zu Region stark unterscheiden. Für die maschinelle Übersetzung ist dies insofern relevant, als in sozialen Medien und Messengern mittlerweile eine große Menge an geschriebenen Dialekttexten existiert, die höchst heterogen sind und für die es kaum einheitliche Regeln gibt. Dadurch wird das Trainingsmaterial für die KI-Software „kontaminiert“ und die Übersetzungsqualität bei hochsprachlichen Texten sinkt.

Das bedeutet natürlich nicht, dass maschinelle Übersetzungen aus dem Arabischen und ins Arabische unmöglich sind, und natürlich hat auch jede andere Sprache ihre Eigenheiten. Diese drei Faktoren können jedoch erklären, warum das Arabische immer noch fehleranfälliger ist als andere Sprachen, obwohl es eine der großen Weltsprachen ist.

Meine Prognose

Eines ist klar: Neuronale Maschinenübersetzung ist ein zunehmend wichtigeres Werkzeug, auch für Übersetzungen Arabisch<>Deutsch. In bestimmten Fällen kann eine maschinelle Vorübersetzung sinnvoll sein und die Arbeit professioneller Übersetzerinnen und Übersetzer erleichtern. Im besten Fall werden sie von einfachen Aufgaben entlastet und können sich auf die eigentlichen Herausforderungen der Übertragung in die Zielsprache konzentrieren. Schließlich bleibt die Kernkompetenz „gesunder Menschenverstand“ erhalten: Professionelle Übersetzerinnen und Übersetzer sind beispielsweise in der Lage, reflektierte Übersetzungsentscheidungen zu treffen, Rückfragen zu stellen, Hintergründe zu recherchieren, Fußnoten zu setzen, Mehrdeutigkeiten zu erkennen und transparent zu machen.

Die Bereiche, in denen KI-Systeme sinnvoll eingesetzt werden können, werden sich im Laufe der Zeit erweitern. Die KI wird die sprachliche Komplexität des Arabischen besser beherrschen und die Menge des Trainingsmaterials wird zunehmen. In den Golfstaaten wird bereits intensiv an großen Sprachmodellen für Arabisch gearbeitet und geforscht und auch der deutsche Platzhirsch Deepl arbeitet seit einigen Jahren an einer Version für Arabisch. Allerdings wird dieser Prozess meiner Einschätzung nach eher in kleinen Schritten als in großen Sprüngen verlaufen und die Übersetzungsqualität wird aus den genannten Gründen vielleicht nie das Niveau anderer Sprachkombinationen erreichen. Denn die sprachstrukturellen Besonderheiten und Eigenheiten des arabischen Sprachraums bleiben bestehen.
Bildquelle: Pixabay