Page - 74 - in Pflegeroboter
Image of the Page - 74 -
Text of the Page - 74 -
74 K. Janowski et al.
eine Belohnung oder Bestrafung. Beispielsweise benutzen Tapus et al. (2008) im Kon-
text eines Therapieroboters für Schlaganfallpatienten bestärkendes Lernen, um das Ver-
halten des Roboters entsprechend der Persönlichkeit und Performanz des Nutzers an sein
Profil anzupassen. Dabei werden Introversion und Extraversion in der Sprache manipu-
liert sowie die Geschwindigkeit des Roboters und der Abstand zum Nutzer, wobei die
Belohnung von der Anzahl der vom Nutzer ausgeführten Übungen abhängt.
Der Belohnung bzw. Bestrafung kommt hierbei eine Schlüsselrolle zu. Dieser posi-
tive oder negative Zahlenwert ist die einzige Information, anhand derer der Roboter
erkennen kann, ob sein gezeigtes Verhalten in der entsprechenden Situation zielführend
ist oder nicht. Eine einfache, aber gleichzeitig auch sehr aufdringliche und unelegante
Möglichkeit stellt zu diesem Zweck die explizite Befragung des Nutzers dar. Um dies zu
umgehen, können einerseits aufgabenspezifische Informationen – wie im Falle von Tapus
et al. (2008) die Anzahl der absolvierten Rehabilitationsübungen – herangezogen werden.
Andererseits sind aber auch menschliche soziale Signale eine reiche Informations-
quelle, um Wissen über den aktuellen Zustand der Person einfließen zu lassen und/oder
die Belohnung abhängig von sozialen Hinweisreizen des Menschen zu gestalten, etwa
menschliches Engagement (Ritsche 2017), taktiles (Barraquand und Crowley 2008)
oder prosodisches (Kim und Scassellati 2007) Feedback, Blickverhalten (Mitsunaga
et al. 2008), Lächeln (Leite et al. 2011; Gordon et al. 2016; Knight 2011) oder Lachen
(Hayashi et al. 2008; Knight 2011; Katevas et al. 2015; Weber et al. 2018). Ein wichtiger
Vorteil sozialer Signale ist hierbei der Fakt, dass diese unterbewusst und über die gesamte
Zeit einer Interaktion auftreten, ohne dass der Mensch explizit befragt werden muss.
Abb. 4.3 veranschaulicht diesen Ansatz: Während der Interaktion zwischen Mensch
und Roboter sendet der Nutzer permanent soziale Signale aus, die sich beispielsweise
in Form von Gestik, Mimik oder Blickverhalten äußern. Mithilfe geeigneter Sensoren
(Mikrofone, Webcams, Microsoft Kinect, Gaze Tracker etc.) können diese in Form von
Audio und Video wahrgenommen und mithilfe geeigneter Software ausgewertet wer-
den. Die Signalverarbeitung stellt hierbei eine erste Hürde dar, schließlich unterliegen
alle Sensoren physikalischen Beschränkungen. Die daraus extrahierte Information kann
Abb. 4.3 Bestärkendes
Lernen auf Basis sozialer
Signale
back to the
book Pflegeroboter"