Warum übersetzen Übersetzungscomputer so schlecht?#

Ernst Buchberger

Computer sind in den letzten Jahren immer leistungsfähiger geworden und die von ihnen verwendeten Programme immer besser. Trotzdem scheint bei Übersetzungsprogrammen kein merkbarer Fortschritt stattgefunden zu haben. Womit hängt das zusammen?

Das Hauptproblem liegt in der Vieldeutigkeit der menschlichen Sprache. Wir alle kennen mehrdeutige Wörter – ist mit „Schloss“ die Burg oder die Schließvorrichtung gemeint? Je nachdem lautet die Übersetzung ins Englische „castle“ oder „lock“. Auch Sätze oder Satzteile können mehrdeutig sein. Oft bemerken wir die Mehrdeutigkeit gar nicht, etwa die des kleinen Wörtchens „mit“: „Ich fahre mit Maria ins Schwimmbad“ und „Ich fahre mit dem Bus ins Schwimmbad“. Aber: Maria kommt mit ins Bad, der Bus bleibt draußen. Das wirkt sich auf die Übersetzung aus: „with Mary“, aber „by bus“.

Die in der Frühzeit der automatischen Übersetzung angewandte Methode – die Wort für- Wort-Übersetzung – kann nicht funktionieren: Wähle ich jeweils eine Lesart beliebig aus, ist die Wahrscheinlichkeit, die richtige zu finden, gering. Wähle ich hingegen alle, gibt es eine kombinatorische Explosion: Bei einem Satz mit 10 Wörtern beispielsweise, von denen jedes nur 3 Bedeutungen hat, ergäben sich 3 hoch 10, also rund 60.000 unterschiedliche Lesarten.

Heutige Übersetzungscomputer arbeiten mit unterschiedlichen Methoden, die alle ihre Probleme aufweisen. Im Unterschied zu mathematischen Problemen, für die es exakte Lösungsvorschriften, so genannte Algorithmen, gibt, existieren für die automatische Übersetzung nur Näherungslösungen.

Eine Methode stellt das „transferbasierte Verfahren“ dar, bei dem der Text der Ausgangssprache analysiert wird und die entstehenden Strukturen in Strukturen der Zielsprache übergeführt werden (Transfer), woraus dann der Text in der Zielsprache generiert wird. Das so genannte „Interlingua-Verfahren“ ist ähnlich, nur dass dabei die Analyse sehr tief durchgeführt wird, bis man zu einer Art Zwischensprache, der Interlingua, gelangt, die man sich als Art Universal- oder Logiksprache vorstellen muss, die unabhängig von der Ausgangs- oder Zielsprache ist. Diese enthält alle Informationen, die für die Generierung des Zieltextes nötig sind, sodass der Transferschritt entfallen kann. Neuere Übersetzungscomputer verwenden statistische oder beispielbasierte Verfahren. Bei Letzteren werden aus einer großen Anzahl abgespeicherter Beispielübersetzungen Teile neu kombiniert. Der Sinnzusammenhang kann aber nicht automatisch erkannt werden.

Ein wichtiger Unterschied besteht natürlich zwischen literarischen Übersetzungen, wo es nicht nur auf den Inhalt, sondern auch auf die elegante Form des Ausdrucks ankommt, und technischen oder informativen Übersetzungen, bei denen es hauptsächlich um den Inhalt geht. Kein vernünftiger Mensch würde sich etwa einfallen lassen, Goethes Faust mit dem Computer zu übersetzen. Bei einer maschinellen Übersetzung einer fremdsprachigen Webseite aber kann eine schlechte Übersetzung trotzdem ausreichend sein, um die benötigten Informationen zu erhalten.

Dieser Essay stammt mit freundlicher Genehmigung des Verlags aus dem Buch:

© 2007 by Styria Verlag in der Verlagsgruppe Styria GmbH & Co KG, Wien