Topologische Datenanalyse: Licht in komplexen Datenwäldern#
Mithilfe topologischer Methoden – einem Teilgebiet der Mathematik und Geometrie – entlockt Michael Kerber vom Institut für Geometrie komplexen Datenmengen ihre Geheimnisse. #
Stellt man Michael Kerber eine Frage, dann ist es, als würde man an eine Türe klopfen und die Person dahinter aus ihren Gedanken reißen. Und wenn er antwortet, dann fühlt es sich an, als würde er diese Türe öffnen und einen Blick in eine verborgene Welt der Zahlen, Formen und hochdimensionalen Räume gewähren.
Michael Kerber ist häufig in der gut sortierten Bibliothek des Instituts für Geometrie anzutreffen – einer ganzen Landschaft an Regalbergen und Bücherwäldern zu Mathematik, Geometrie und Topologie, die von Schreibtischen und Computerbildschirmen durchtrennt wird. Hier steht er mit seiner Arbeitsgruppe zusammen, bespricht Probleme und lacht fast ununterbrochen. Über Witze und kleine mathematische Anspielungen, die fachfremden Personen schwer zugänglich sind und wie aus einer unbekannten Welt herübertröpfeln.
Topologie – zwischen Mathematik und Geometrie#
Michael Kerbers Forschungsgebiet ist die Topologie – ein Fachgebiet der Mathematik und Geometrie. Die Topologie beschäftigt sich mit den Verbindungen zwischen Datenpunkten. Zum Beispiel lässt sich die Oberfläche einer Kugel auch als die Menge aller Datenpunkte im dreidimensionalen Raum betrachten, die von einem definierten Mittelpunkt einen exakten Abstand einnehmen – den Radius der Kugel. Im Gegensatz zur Geometrie beschäftigt sich die Topologie aber nicht mit der Länge des Abstandes, sondern mit der Verbindung zwischen den Punkten. Um topologisch eine Form zu erhalten, dürfen diese Verbindungen nicht getrennt, sehr wohl aber verformt, gestaucht oder auch gestreckt werden. Zum Beispiel wenn man sich die Kugel von vorher als einen Luftballon vorstellt. Egal, ob er leer oder aufgeblasen ist: Es wird immer ein Luftballon bleiben – seine Oberfläche wird nur gestreckt. Platzt der Luftballon – verlieren die unterschiedlichen Punkte also ihre Verbindung –, dann ist es eben kein Luftballon mehr. So wie beim Luftballon verhält es sich mit topologischen Formen – nur eben nicht nur im dreidimensionalen Raum, sondern auch in viel höherdimensionalen mathematischen Räumen.
Michael Kerber steht vor einem auf die Wand gebeamten wissenschaftlichen Paper. Das Paper zeigt zwei Formen, daneben stehen Formeln.
Komplexe Datenwälder#
Hier kommt Michael Kerbers Spezialgebiet ins Spiel: die topologische Datenanalyse. Topologische Methoden werden seit den frühen 2000er-Jahren nämlich auch für die Analyse von großen und komplexen Datensätzen angewendet. „Wir können mit diesen Methoden Dinge aus den Daten herauslesen, die mit herkömmlichen Analysemethoden niemals möglich wären“, ist der Forscher begeistert. Kerber erklärt den Zugang anhand eines Forschungsprojekts von US-amerikanischen Kollegen: „Sie messen bei Mäusen, die sich in einem quadratischen Kasten bewegen, die Neuronenaktivitäten – ob die Neuronen also aktiv sind oder nicht. So erhält das Team eine große Datenmenge, die in einem Raum dargestellt werden kann. Sieht man sich die Form dieser Datenpunkte an, dann könnte diese zum Beispiel rund sein. Jedem dieser Punkte kann dann ein Winkel zugeordnet werden. Und die Winkelfunktion korreliert mit der Blickrichtung der Mäuse. Die Forschenden können also allein anhand der Neuronenaktivität sagen, in welche Richtung die Maus gerade schaut.“
Wir können mit diesen Methoden Dinge aus den Daten herauslesen, die mit herkömmlichen Analysemethoden niemals möglich wären.
Kerber selbst arbeitet an Algorithmen, die große Datenmengen effizient durchkämmen und analysieren. Derzeit simplifiziert er Terrain-Daten: „Ein im Vermessungsamt gespeichertes Landschaftsrelief, wie beispielsweise jenes von Österreich, ist für gewöhnlich mehrere Gigabyte groß“, erklärt er. „Wir versuchen, die Menge an Datenpunkten zu reduzieren, ohne die wichtigsten Eigenschaften der Landschaft zu verlieren. Hierfür gibt es derzeit keine effizienten Algorithmen.“ Mit der Methode können Datenpunkte beispielsweise um eine bestimmte Summe nach oben oder nach unten verschoben werden – so wird eine leicht hügelige Landschaft „gerade“, wodurch viele Datenpunkte eingespart werden. „Wir können die Landschaftsreliefs so wesentlich kleiner und einfacher machen, ohne die wichtigen topologischen Eigenschaften – wie Berge und Täler – zu verlieren. Freilich wird die Karte ungenauer – aber für das freie Auge ändert sich kaum etwas.“ Mit dem neuen Algorithmus von Kerbers Team kann die Simplifizierung in wenigen Minuten automatisch generiert werden und die daraus resultierende Karte ist wesentlich kleiner als das Original.
Die Türe schließt sich#
Am Ende von Michael Kerbers Antwort schließt sich die Tür in seine Welt der Zahlen, Daten und Formen wieder. Bis zur nächsten Frage, die zaghaft an die Türe klopft und eine Antwort sucht.
Kontakt#
Michael KERBER
Univ.-Prof. Dr.-Ing.
Institut für Geometrie
Kopernikusgasse 24/IV
8010 Graz
Tel.: +43 316 873 8446
kerber@tugraz.at