Seite - 198 - in Künstliche Intelligenz - Technologie | Anwendung | Gesellschaft
Bild der Seite - 198 -
Text der Seite - 198 -
198 B Anwendung
Statistische Maschinelle Übersetzung (SMT)
Im Jahr 2007 führte Google als einer der ersten Anbieter ein selbstlernendes Über-
setzungssystem ein, das Datenbanken statistisch auswertete (Statistical Machine
Translation, SMT) und so die wahrscheinlichsten Übersetzungen eruierte. Aktuell
werden bei der statistischen Übersetzung jeweils eine Reihe von aufeinanderfolgen-
den Wörtern gleichzeitig betrachtet (Phrase-based Machine Translation, PBMT) und
damit auch die Häufigkeit von Wortkombinationen evaluiert, wodurch implizit auch
der Kontext zu einem geringen Grad berücksichtigt wird, wenn die sinnrelevanten
Wörter eng genug beisammenstehen.
Probleme treten hier vor allem bei Sprachpaaren auf, bei denen sich die Wortreihen-
folge und/oder die grammatikalische Struktur stark unterscheiden. Durch die Einbin-
dung zusätzlicher Sprachmodelle, „Reordering“-(Umsortierungs-)Modellen und wei-
terer unterstützender Algorithmen wird diesen Defiziten entgegengewirkt. Durch
den statistischen Ansatz entsteht außerdem eine starke Abhängigkeit vom Trainings-
material. Trainiert man etwa als Extrembeispiel einen Algorithmus ausschließlich mit
Texten aus der Zoologie, wird in der anschließenden Übersetzung eines Berichts über
ein Baseballspiel das englische Wort „bat“ trotzdem immer als „Fledermaus“, nicht
aber als „Schläger“ wiedergegeben werden. Im ersten Hype um das damals neue
Verfahren zitiert die Zeitschrift Computerbild (Hülsbörner, 2007) Philipp Köhn, einen
der Mitentwickler der SMT: „Technische und politische Texte können wir völlig prob-
lemlos übersetzen lassen – von Sportberichten und Kochrezepten lassen wir dagegen
lieber die Finger“. Ursache dieser Einschätzung war die thematische Beschränkung
der Themen, die in den frei verfügbaren und zum Training nutzbaren Texten der Ver-
einten Nationen oder Europäischen Union existiert.
Neuronale Maschinelle Übersetzung (NMT)
Im November 2016 führte Google dann mit großer Medienresonanz das erste Über-
setzungssystem ein, das sich eines neuronalen Netzes (Neural Maschine Translation,
NMT) bediente und versprach, mit natürlicheren Sätzen die Lücke zwischen mensch-
licher und maschineller Übersetzung zu schließen („Bridging the Gap between Human
and Machine Translation“; (Yonghui Wu et al., 2016)). Bis dato gab es zwar vielver-
sprechende Arbeiten zur Nutzung neuronaler Netze, die NMT-Systeme schnitten aber
im Praxistest schlechter ab als ausgereifte SMT-Übersetzer. Google konnte erstmals
verschiedene Schwächen, wie etwa die langsamere Trainingsgeschwindigkeit, die
ineffiziente Behandlung von seltenen Wörtern oder das Problem, dass manchmal
nicht alle Wörter des Ursprungssatzes übersetzt wurden, erfolgreich ausgleichen.
Anders als bei der SMT wird bei der NMT immer ein vollständiger Satz gleichzeitig
betrachtet. Mathematisch wird von einer linearen Abbildung zwischen Eingangs-
Künstliche Intelligenz
Technologie | Anwendung | Gesellschaft
- Titel
- Künstliche Intelligenz
- Untertitel
- Technologie | Anwendung | Gesellschaft
- Herausgeber
- Volker Wittpahl
- Verlag
- Springer Vieweg
- Datum
- 2019
- Sprache
- deutsch
- Lizenz
- CC BY 4.0
- ISBN
- 978-3-662-58042-4
- Abmessungen
- 16.8 x 24.0 cm
- Seiten
- 286
- Schlagwörter
- Elektrische Antriebssysteme, Intelligentes Gesamtmaschinenmanagement, Künstliche Intelligenz, Data Mining, Maschinelles Lernen, Deep Learning, artificial intelligence, data mining, machine learning, deep learning
- Kategorie
- Technik
Inhaltsverzeichnis
- Vorwort 7
- Inhaltsverzeichnis 15
- A Technologie 18
- B Anwendung 92
- Einleitung: KI ohne Grenzen? 95
- 5. Neue Möglichkeiten für die Servicerobotik durch KI 99
- 6. E-Governance: Digitalisierung und KI in der öffentlichen Verwaltung 122
- 7. Learning Analytics an Hochschulen 142
- 8. Perspektiven der KI in der Medizin 161
- 9. Die Rolle der KI beim automatisierten Fahren 176
- 10. Maschinelle Übersetzung 194
- C Gesellschaft 212
- Ausblick 273
- Anhang 277
- Autorinnen und Autoren 277
- Abkürzungsverzeichnis 286