Seite - 9 - in Künstliche Intelligenz - Technologie | Anwendung | Gesellschaft
Bild der Seite - 9 -
Text der Seite - 9 -
iit-Themenband – Künstliche Intelligenz 9
KI-Anwendung „Deep Voice“ in der Lage, anhand von wenigen Sekunden Aus-
gangsmaterial eine Stimme zu klonen. Dass ein System so schnell arbeitet, ist schon
besonders, wenn man bedenkt, dass im Jahr 2017 noch 30 Minuten Trainingsmate-
rial benötigt wurden und Adobe im Jahr 2016 ein Stimmklonverfahren vorgestellt
hat, das 20 Minuten benötigte. Mit der KI-Klonstimme von Baidu lässt sich mittels
Text-zu-Sprache-Software jede Aussage mit der Intonation und in der Stimmlage des
Originalsprechers wiedergeben, unabhängig vom Inhalt der Aussage, mit der sie trai-
niert wurde (Bastian 2018b).
Nicht nur Stimmen lassen sich mittels KI klonen, sondern auch Personen in Filmen. Im
Frühjahr 2018 stellten Forschende auf der Siggraph „Deep Video Portrait” vor. „Deep
Video Portrait” ist eine Methode zur Video-Manipulation mittels DL-Verfahren.
Anders als bei existierender kostenfreier Software1 zur Videomanipulation wird die
Mimik samt Kopfbewegungen von einer Person auf das Gesicht einer zweiten Person
in einem Video projiziert. Kopfbewegungen in drei Dimensionen, Kopfdrehung, den
Gesichtsausdruck, die Blickrichtung und Blinzler erkennt das KI-System und kann
sogar den Schatten, den der Kopf auf den Hintergrund wirft, im Nachhinein perspek-
tivisch korrekt in das Video rechnen (Kim et al. 2018).
KI-Systeme unterstützen nicht nur Sprachassistenten oder klonen Stimmen und
Gesichter, inzwischen sind sie auch in der Lage, eigenständig mit Menschen zu kom-
munizieren. So zeigte Google mit seinem Duplex-System, wie ein KI-System als
Kunde am Telefon einen Friseurtermin bucht und einen Tisch im Restaurant reser-
viert. Bei der natürlich erscheinenden Stimme am Telefon hätte man keine KI vermu-
tet. Anders als die klassischen Roboterstimmen fügt Google Duplex Unregelmäßig-
keiten in die Sätze ein. So sind scheinbare Denkpausen zu hören oder ein hin und
wieder gemurmeltes „Mhmm“ und unvermittelt auftretende Sprechpausen. Hier-
durch ergibt sich das Gefühl, die KI geht auf Gesprächspartner ein oder denkt nach
(Kremp 2018). Duplex soll ab 2018 zunächst testweise in den Google Assistant inte-
griert werden (Herbig 2018). Ebenfalls KI-basiert eruiert Googles E-Mail-Dienst Gmail
mit der „Smart Compose“-Funktion, was die Nutzenden sagen wollen (Schwan
2018a).
Eine ganz andere Dimension der KI-Anwendung in der Kommunikation ist der 2016
vorgestellte Smart Speaker MOODBOX. Die MOODBOX besitzt eine KI zur Emotions-
erkennung. Der Smart Speaker prüft, wie sich der Besitzer fühlt und spielt Musik
passend zur Gefühlslage (Gineers Now 2018).
1 z. B. FakeApp, https://www.chip.de/news/FakeApp-kostenlos-Software-tauscht-Personen-
in-Videos_133462513.html, zuletzt geprüft am 22.07.2018.
Künstliche Intelligenz
Technologie | Anwendung | Gesellschaft
- Titel
- Künstliche Intelligenz
- Untertitel
- Technologie | Anwendung | Gesellschaft
- Herausgeber
- Volker Wittpahl
- Verlag
- Springer Vieweg
- Datum
- 2019
- Sprache
- deutsch
- Lizenz
- CC BY 4.0
- ISBN
- 978-3-662-58042-4
- Abmessungen
- 16.8 x 24.0 cm
- Seiten
- 286
- Schlagwörter
- Elektrische Antriebssysteme, Intelligentes Gesamtmaschinenmanagement, Künstliche Intelligenz, Data Mining, Maschinelles Lernen, Deep Learning, artificial intelligence, data mining, machine learning, deep learning
- Kategorie
- Technik
Inhaltsverzeichnis
- Vorwort 7
- Inhaltsverzeichnis 15
- A Technologie 18
- B Anwendung 92
- Einleitung: KI ohne Grenzen? 95
- 5. Neue Möglichkeiten für die Servicerobotik durch KI 99
- 6. E-Governance: Digitalisierung und KI in der öffentlichen Verwaltung 122
- 7. Learning Analytics an Hochschulen 142
- 8. Perspektiven der KI in der Medizin 161
- 9. Die Rolle der KI beim automatisierten Fahren 176
- 10. Maschinelle Übersetzung 194
- C Gesellschaft 212
- Ausblick 273
- Anhang 277
- Autorinnen und Autoren 277
- Abkürzungsverzeichnis 286