unbekannter Gast

Unter Dumpfbacken#

Künstliche Intelligenzen werden immer intelligenter, heißt es. Doch was heißt intelligent? Und wie misst man das?#


Mit freundlicher Genehmigung übernommen aus der Wiener Zeitung, 18. Jänner 2019

Von

Adrian Lobe


Die Entwicklung der Künstlichen Intelligenz schreitet immer schneller voran. Computer übertreffen den Menschen mittlerweile in Disziplinen wie Schach, Go und Poker, die als Bastionen menschlichen Denkens galten. Doch wie intelligent sind diese Systeme wirklich?

Im vergangenen Jahr sorgte eine Studie chinesischer Wissenschafter für Aufsehen, wonach Sprachassistenten wie Siri den IQ eines Kleinkinds hätten. Schaut man sich die Untersuchung genauer an, sprechen die Forscher aber nicht vom Intelligenzquotienten, sondern von einem "KI-IQ". Zur Intelligenzmessung wird hier ein anderes Verfahren angewendet.

Die Funktionalität künstlich intelligenter Systeme verglichen die Wissenschafter anhand verschiedener Fragen: Kann das System Informationen mit dem menschlichen Tester austauschen? Kann sich die Wissensdatenbank updaten und ihre Speicherkapazitäten vergrößern? Vermag das System neues Wissen zu produzieren? Anhand dieser Kriterien entwickelten die Forscher ein mathematisches Modell, das als Vergleichsmaßstab dienen sollte. Auf Grundlage von Testergebnissen erstellten die Wissenschafter ein Ranking, das dann in IQ-Werte umgerechnet wurde. Demnach besitzt Googles Sprachsoftware einen IQ von 47, Microsofts Suchmaschine Bing kommt auf einen IQ von 32, Apples Siri erreicht dagegen lediglich einen IQ von 24. Zum Vergleich: Ein sechsjähriges Kind hat im Schnitt einen IQ von 55,5.

IQ-Tests sind umstritten#

Als IBM 1961 seine legendäre Shoebox, den Prototypen einer Spracherkennung, präsentierte, war der Wortschatz der Maschine auf 16 Wörter begrenzt, inklusive der zehn Ziffern von 0 bis 9. Die Forschungsabteilung des US-Verteidigungsministeriums finanzierte ab 1971 eine Spracherkennung, die 1000 Wörter verstand. Ein sechsjähriges Kind kennt etwa 13.000 Wörter, ein gebildeter Mensch besitzt ein Repertoire von rund 60.000 Vokabeln. Die Maschine "sprach" also wie ein Kleinkind.

Amazons Sprachsoftware Alexa hat mittlerweile ein paar tausend Wörter in dutzenden Sprachen im Repertoire, erst im vergangenen Jahr wurden umgangssprachliche Formulierungen wie "woohoo" dem englischen Vokabular hinzugefügt. Der Wortschatz scheint eine geeignete, quantifizierbare Größe, mit der sich die Intelligenz von Mensch und Maschine vergleichen ließe. Doch letztlich werden hier Birnen mit Äpfeln verglichen.

Die Methodik des IQ gilt in der Wissenschaft als umstritten, die Aussagekraft der Tests ist begrenzt. Nur weil jemand Zahlenreihen nicht schnell vervollständigen kann, sagt das noch nichts über sein logisches Verständnis oder sein Sprachgefühl aus. Es gibt viele Arten von Intelligenz: emotionale, soziale oder eben künstliche.

Der amerikanische Computerwissenschafter Michael L. Littman, der an der renommierten Brown University lehrt und ein Spezialist für maschinelles Lernen ist, betont, dass die Studie der chinesischen Forscher in der Wissenschaftsgemeinde kaum rezipiert wurde. Im Gespräch mit der "Wiener Zeitung" sagt er: "Diese Arbeit sollte von der KI-Community als nicht geprüft gelten - sie sollte wahrscheinlich komplett ignoriert werden." Das Paper wird in Google Scholar, einem Indikator für wissenschaftliche Resonanz, gerade zweimal zitiert, zudem war die Fachzeitschrift nicht Peer-Review-geprüft, was als Qualitätsstandard gilt. Fragt man Siri nach ihrem IQ, antwortet die Sprachsoftware durchaus tiefsinnig: "Ich versuche, nicht alles zu quantifizieren." Auf die Frage "Wie intelligent bist du?" erwidert die virtuelle Assistentin: "Auf einer Skala von 1 bis 10 haargenau 11." Doch wenn eine KI die Hauptstadt von Uganda benennen und Begriffe aus dem Finnischen ins Deutsche übersetzen kann, ist das ein Zeichen von Intelligenz?

Welcher Maßstab gilt?#

Ist es intelligent, Dinge auswendig zu lernen und in Prüfungen Faktengeröll abzuladen, das man danach wieder vergessen hat? Kann man die Maßstäbe menschlicher Intelligenz überhaupt an künstliche Intelligenz anlegen?

Informatiker Littman sagt: "IQ-Tests fragen typischerweise nicht nach den Hauptstädten von Ländern, weil unsere Konzeptualisierung von Intelligenz sich zu einem erheblichen Teil von der Memorisierung von Fakten unterscheidet." Intelligenz bedeutet auch, Wissen situativ abzurufen und Transfers herzustellen. Maschinelles Lernen dagegen beruht auf Routinen. Beim sogenannten "überwachten Lernen" bringt man Algorithmen die Klassifizierung von Katzen auf Bildern ähnlich wie Kleinkindern bei, wobei die Lernkurve der KI-Systeme deutlich steiler ist. Die Journalistin Manuela Lenzen schreibt in ihrem Buch "Künstliche Intelligenz", dass die Lösung einer Divisionsaufgabe beim Menschen als intelligente Rechenleistung qualifiziert werde, bei einer Maschine jedoch nicht. Lenzen fragt: "Warum ist ein rechnender Mensch intelligent, ein Taschenrechner aber nicht?" Man misst hier mit zweierlei Maß.

Bei der Bewertung von Intelligenz kommt es nicht nur auf das Ergebnis, sondern auch auf das Verfahren an. Das Moravec’sche Paradox, das der Computerwissenschaftler Hans Moravec in den 1980er Jahren formulierte, besagt grob, dass die Komplexität der Programmierung mit der Leichtigkeit der Aufgaben zunimmt. Komplexe Dinge wie Schach oder Rechnen, die auf Logik basieren, bringt man Computern leichter bei als die (vermeintliche einfache) Erkennung von Gesichtern. Jedes Baby erkennt seine Mutter in einer Menschenmenge. Maschinelle Systeme haben noch immer Probleme, Alterungsprozesse im Gesicht oder eine neue Frisur zu erkennen. Der Bilderkennungsalgorithmus von Googles Foto-App kategorisierte 2015 einen Afro-Amerikaner als Gorilla, was weltweit Empörung auslöste. Es scheint, als müsste die Maschine noch einiges lernen.

Wiener Zeitung, 18. Jänner 2019

Weiterführendes#