Page - 70 - in Pflegeroboter
Image of the Page - 70 -
Text of the Page - 70 -
70 K. Janowski et al.
4.3.1 Sprachliche FĂ€higkeiten
Die erste HĂŒrde bei der natĂŒrlichsprachlichen Kommunikation ist, ein klares Audio-
signal von einer einzelnen Person zu erhalten. Dazu werden meistens mehrere Mikrofone
gleichzeitig genutzt, um den Sprecher zuerst im Raum zu lokalisieren. AnschlieĂend
ist es möglich, die Mikrofone optimal auf diese Person auszurichten (zum Beispiel
durch Drehung des Roboterkopfes) oder StörgerÀusche aus anderen Richtungen rech-
nerisch auszufiltern. Der Roboter Reeti1 hat beispielsweise zwei Mikrofone unterhalb
der Augenkameras, wĂ€hrend bei Nao2 und Pepper3 jeweils vier ĂŒber die Oberseite des
Kopfes verteilt sind. GerÀte aus Amazons Echo-Reihe4, der Schnittstelle zu Alexa, ver-
wenden je nach Modell vier, sieben oder sogar acht Mikrofone.
Menschliche Sprache ist umfangreich und komplex, sodass es kaum möglich ist, den
gesamten Wortschatz und alle grammatikalisch möglichen Formulierungen in einem
Rechenmodell abzudecken. Umgangssprache oder regionale Dialekte erschweren dies
zusÀtzlich, und manche Nutzer halten sich schlichtweg nicht an sprachliche Gepflogen-
heiten, sei es aus Bequemlichkeit oder mangelnder Kenntnis. In der Praxis ist der
Dialog mit solchen Systemen daher oft noch auf einfach strukturierte Fragen und kon-
krete Befehle begrenzt. Aktuelle Sprachassistenten nutzen die Rechenzentren der
zugehörigen Firmen, um derartige Funktionen anzubieten (Chung et al. 2017). Durch
Zugriff auf deren umfangreiche DatensÀtze und hohe Rechenleistung ist es möglich,
aufwendigere maschinelle Lernverfahren zur Interpretation natĂŒrlicher Sprache einzu-
setzen, fĂŒr welche kleineren GerĂ€ten wie Mobiltelefonen oder dem Amazon Echo die
nötige Hardware fehlt. Auch Roboter wie Nao und Pepper verwenden diesen Ansatz
zur Spracherkennung.5 Ein Nachteil dieser Lösung ist allerdings die AbhÀngigkeit von
einer stabilen Internetverbindung, was besonders in lÀndlichen Gegenden oft schwierig
ist. Dazu kommen massive Bedenken bezĂŒglich PrivatsphĂ€re und Datenschutz, da der-
artige GerÀte theoretisch jederzeit Tonaufnahmen an die Herstellerfirma senden kön-
nen. Falls die Verbindung nicht ausreichend gesichert ist, besteht auĂerdem die Gefahr
von unautorisierten Zugriffen oder Manipulation durch AuĂenstehende (Chung et al.
2017). Diese Nachteile können durch die Verwendung quelloffener Software oder pri-
vat eingerichteter Server umgangen werden, was allerdings mit deutlich höherem Ent-
wicklungsaufwand verbunden ist.
Damit ein sozialer Agent dem Nutzer in natĂŒrlicher Sprache antworten kann, muss zuerst
ein Text dafĂŒr erzeugt werden. Dazu kann beispielsweise ein vorgegebenes TextgerĂŒst
mit aktuellen Informationen vervollstĂ€ndigt werden, was sich besonders fĂŒr funktionale
1http://reeti.fr/index.php/en/detailen.
2http://doc.aldebaran.com/2-1/family/robots/microphone_robot.html.
3http://doc.aldebaran.com/2-5/family/pepper_technical/microphone_pep.html.
4https://www.amazon.de/dp/B06ZXQV6P8.
5https://developer.softbankrobotics.com/us-en/documents/top-100-questions.
back to the
book Pflegeroboter"