Wer übersetzt besser – Mensch oder Maschine? Ist künstliche Intelligenz die Zukunft der Übersetzungsbranche? Und kann sie auch Arabisch? Maschinelle Übersetzungssysteme sind weit fortgeschritten und liefern mittlerweile flüssige und natürlich klingende Texte – zumindest für einige Sprachen. Fehlerfrei arbeiten aber auch die „elektronischen Kollegen“ nicht und besonders schwer tun sie sich mit Arabisch. Das wird sich so schnell auch kaum ändern.

Hier geht es zu einem Update dieses Artikels im Jahr 2023.

Intelligent versteckte Fehler

Google Translator und ähnliche Programme wurden anfänglich noch belächelt. Mit Hilfe künstlicher Intelligenz haben sich die Ergebnisse von Anbietern wie DeepL allerdings erheblich verbessert. Hinter der größten Errungenschaft der künstlich-intelligenten Übersetzung verbirgt sich jedoch zugleich die größte Gefahr. Da die Texte sich flüssig und grammatikalisch fehlerfrei lesen, sind Falschübersetzungen noch viel schwieriger aufzufinden. Für Laien sind sie meist sogar unsichtbar. Meine Kollegin Andrea Bernard hat an einem anschaulichen Beispiel illustriert, wie gut sich gravierende Übersetzungsfehler gerade in Fachtexten verbergen können. Selbst erfahrene Fachübersetzer müssen zweimal hinsehen, um Fehler in der maschinellen Übersetzung zu erkennen.

Was daraus folgt: Die maschinelle Übersetzung kann zwar Übersetzungsarbeit abnehmen. Die Nachkontrolle durch einen professionellen Übersetzer – „Post-Editing“ genannt – bleibt jedoch unerlässlich.

Wo die maschinelle Übersetzung versagt

Neben klassischen Falschübersetzungen gibt es noch gravierendere Mängel. Selbst die klügsten neuronalen Netzwerke haben ein Problem gemeinsam: Sie sind zwar gut darin geworden, einzelne Sätze in die Zielsprache zu übertragen. Wenn man ihnen aber einen längeren Text vorlegt, bekommen sie Probleme mit der Kohärenz. Darauf deuten auch die Ergebnisse von Wissenschaftlern der der Universität Zürich.

Übersetzungsmaschinen fällt es schwer, über die Satzgrenzen hinauszublicken und den Gesamtkontext eines Textes zu erfassen. Kontext aber ist das A und O einer professionellen Übersetzung. Ein menschlicher Übersetzer kann beispielsweise den Autor fragen, wie unklare Stellen gemeint sind. Er erkennt Fehler im Ausgangstext. Er kann Texte in Beziehung zu ihrem historischen Kontext setzen und kulturelle Unterschiede zwischen den beiden Sprachräumen berücksichtigen. Als Mensch kann ich im Gegensatz zur Maschine auch erkennen, wenn ein Text Ironie, Sarkasmus oder feine Nuancen und Anspielungen enthält. Kurz: Ich kann zwischen den Zeilen lesen.

Hinzu kommt: Sprache ist ein lebendiges Gebilde, das sich weiterentwickelt. Bekannte Idiome, Wortspiele Metaphern können variiert oder so neu kombiniert werden, dass ein sprachlich einzigartiger Text entsteht. Schon allein diese Tatsache macht maschinell übersetzte Texte in einigen Bereichen höchst fehleranfällig.

Und Arabisch?

Der Fortschritt durch künstliche Intelligenz beschränkt sich bislang noch auf wichtige Übersetzungssprachen wie Englisch, Spanisch, Französisch, Russisch und auch Deutsch. Für andere Sprachen wie gibt es bislang keine überzeugenden Angebote. Dazu gehört Arabisch.

Meines Erachtens liegt die Ursache dafür auch in der Sprache selbst. Denn beim Arabischen potenzieren sich die genannten Probleme maschineller Übersetzungen. Ein paar erste Überlegungen zu diesem Thema:

  • Der arabische Sprachraum ist polyzentrisch und erstreckt sich über zahlreiche Länder und Regionen vom indischen Ozean bis zum persischen Golf. Trotz gemeinsamer schriftlicher Hochsprache gibt es je nach Land und Region charakteristische Eigenheiten. Das gleiche Wort kann in unterschiedlichen Regionen und Kontexten unterschiedliche Dinge bedeuten. Da es zudem keine vereinheitlichende Instanz gibt, haben sich in unterschiedlichen Fachbereichen keine einheitlichen Fachsprachen herausgebildet. Für manche Bereiche gibt es überhaupt keine länderübergreifende wissenschaftliche Fachsprache, da z.B. wie in der Medizin häufig in der Fremdsprache studiert geschrieben und publiziert wird.
  • Die arabische Schrift ist eine Konsonantenschrift, bei der bedeutungsentscheidende Vokale nicht geschrieben, sondern mitgedacht werden müssen. Die Bedeutung einzelner Wörter und des einzelnen Satzes ergibt sich daher oft nur aus dem Kontext. Durch die Verbstämme und ihre Ableitungen ergeben sich zudem zahlreiche Homographe: Wörter die im Schriftbild gleich, in Aussprache oder Bedeutung aber sehr verschieden sein können. Unter anderem deswegen existiert bislang auch keine zuverlässige Texterkennungssoftware (OCR) für Arabisch.
  • Arabisch zeichnet sich durch hochgradige Polysemie aus: Einzelne Wörter können zahlreiche Bedeutungen tragen. Auch hier muss der Leser oder Übersetzer aus dem Kontext die gemeinte Bedeutung erschließen.
  • Im arabischen Sprachraum herrscht Diglossie. Die unterschiedlichen arabischen Dialekte können die Hochsprache beeinflussen, was die oben geschilderte Polyzentrik verstärkt. Hinzu kommt: Im informellen Bereich –  wie in sozialen Medien – schreiben viele arabischen Muttersprachler in einem Gemisch aus Hochsprache und Dialekt oder – wenn sie mit Arabern anderer Länder kommunizieren – aus verschiedenen arabischen Dialekten. Die Schreibweisen sind sehr uneinheitlich, da Dialekte eigentlich nicht geschrieben werden und keine normierte Rechtschreibung dafür existiert. Dass Übersetzungstools damit gravierende Probleme haben zeigte ein Vorfall im Jahr 2017, als Facebook aus dem arabischen „Guten Morgen“ in der Übersetzung ein „greift sie an“ machte und der Verfasser des Posts anschließend verhaftet wurde.

Ganz abgesehen davon stellen maschinelle Übersetzungen ein Grundprinzip des Übersetzens auf den Kopf: Als Übersetzer übertrage ich Sinneinheiten und nicht einzelne Wörter oder Sätze. Das lässt sich am Beispiel unterschiedlicher Stilnormen sehr schön veranschaulichen: Ein arabischer Geschäftsbrief beginnt häufig mit mehreren religiösen oder weltlichen Gruß-, Dank, und -Wunschformeln. Diese – aus deutscher Sicht sehr blumigen und repetitiven Phrasen –  können sich über viele Zeilen erstrecken. Als Übersetzer kenne ich diese Praxis und weiß, dass ich das unmöglich eins zu eins ins Deutsche übertragen kann. Ein Übersetzungstool dagegen würde die blumigen Worte wortwörtlich ins Deutsche übertragen. Ein Leser der Übersetzung, der die Eigenheiten der arabischen Stilistik nicht kennt, würde sich mindestens wundern, im schlimmsten Fall aber falsche Schlussfolgerungen ziehen oder sich über die umständliche und wenig zielführende Ausdrucksweise ärgern.

Update: In der Fachzeitschrift MDÜ (Ausgabe 6/2018) ist ein ausführlicher Artikel erschienen, in dem ich die Thematik vertiefe.

Bildquelle: Pixabay