Page - 315 - in Digitale Datenbanken - Eine Medientheorie im Zeitalter von Big Data
Image of the Page - 315 -
Text of the Page - 315 -
Phänomeno-Logik 315
Wie am Beispiel des Neun-Punkte-Problems gezeigt wurde, sind dem auto-
matischen Entdecken von Zusammenhängen mit spezifischen Auswertungsver-
fahren jedoch stets Grenzen gesetzt. Daher gilt es zu fragen, welche Auswertungs-
verfahren aus welchen Gründen auf welche Datenbestände angewandt werden
und wie die entdeckten Korrelationen interpretiert, verifiziert und nicht zuletzt
theoretisiert werden. So mögen Algorithmen überraschende, d.h. nicht durch
Hypothesen vorhergesagte Zusammenhänge zwischen spezifischen Variablen
freilegen können, dass aber mit bestimmten Verfahren in bestimmten Datensätzen
Korrelationen entdeckt werden können, bedarf eines Vorwissens, welches sich
in die Auswertung einschreibt und die Interpretation der Ergebnisse bedingt. Es
handelt sich, wenn man so will, um prozedurale Hypothesen, die von thematischen
Hypothesen zu unterscheiden sind.64 Während thematische Hypothesen einen Zu-
sammenhang zwischen spezifischen Variablen behaupten, beruhen prozedurale
Hypothesen auf der Annahme, dass mit spezifischen Verfahren bestimmte Zu-
sammenhänge entdeckt werden können. Insofern markiert Big Data nicht den
Anbruch einer Ära theorie- und hypothesenfreier Forschung. Vorläufig könnte
zumindest eine zunehmende Verdrängung thematischer Hypothesen durch pro-
zedurale Hypothesen diagnostiziert werden, welche der Analyse vorausgehen und
sie anleiten. Diese prozeduralen Hypothesen sind den Auswertungsverfahren bis-
lang weitgehend implizit. Aufgabe kĂĽnftiger medientheoretischer Analysen von Big
Data ist es daher, diese impliziten Annahmen zu explizieren.
Visuelles Erkunden mit Informationsvisualisierungen
Ziel der Auswertung von Datenbanken ist es Manovich zufolge, ein Verständnis
von Informationssammlungen zu entwickeln sowie Muster und Zusammenhänge
darin zu entdecken, »[to] understand the ›shape‹ of [the] overall collection and
notice interesting patter[n]s« (Manovich 2011). Von zentraler Bedeutung sind die
im Data Mining angewandten mathematischen Analyseverfahren. Fayyad et al.
nennen sechs Methoden, die typischerweise zum Einsatz kommen: Klassifikation,
Clusterbildung, Regression, Assoziationsanalyse, Anomalieerkennung und die Zu-
sammenfassung respektive Verdichtung (vgl. Fayyad et al. 1996: 44f.). Obwohl es
sich hierbei um automatische Auswertungsverfahren handelt, fĂĽhren diese nicht
64 | Dieser Unterscheidungsvorschlag lehnt sich lose an Herbert A. Simons Unter-
scheidung von substanzieller und prozeduraler Rationalität an, die dieser im Kontext
seiner Diskussion ökonomischer Theorien einführt. Verhalten beruht Simon zufolge
auf substanzieller Rationalität, »when it is appropriate to the achievement of given
goals within the Iimits imposed by given conditions and constraints« (Simon 1976:
131). Bei prozeduraler Rationalität stehen demgegenüber die Problemlösungsver-
fahren im Vordergrund: »From a procedural standpoint, our interest would lie not in
the problem solution – the prescribed diet itself – but in the method used to discover
it« (Simon 1976: 132).
Digitale Datenbanken
Eine Medientheorie im Zeitalter von Big Data
- Title
- Digitale Datenbanken
- Subtitle
- Eine Medientheorie im Zeitalter von Big Data
- Author
- Marcus Burkhardt
- Publisher
- transcript Verlag
- Date
- 2015
- Language
- German
- License
- CC BY-SA 4.0
- ISBN
- 978-3-8394-3028-6
- Size
- 14.7 x 22.4 cm
- Pages
- 392
- Category
- Informatik
Table of contents
- Medium: Zwischen Konstellationen und Konfigurationen 21
- Die Frage nach den Medien 22
- Wann sind Medien? 33
- Ăśber Medien reden: Medienepistemologie 58
- Computer: Zwischen Oberfläche und Tiefe 73
- Phänomeno-Technische Konfigurationen 75
- Spielräume der computertechnischen Informationsvermittlung 95
- Datenbank: Zwischen digitalen Sammlungen und Sammlungstechnologien 117
- Was sind Datenbanken? 121
- Datenbanklogiken: Zur Datenbank als symbolischer Form 131
- Gegen die Datenbank als Prinzip: Mikrologiken der digitalen Datenhaltung 145
- Banken, Basen, Reservoirs: Information Storage and Retrieval 149
- Information: Zwischen begrifflicher Abstraktion und technischer Konkretion 150
- Kommunikation mit Informationssammlungen 167
- Daten und Information: Begriffsklärung 187
- Techno-Logik: Apparaturen, Architekturen, Verfahren 205
- Direct Access: Zur Festplatte als Herausforderung digitaler Datenbanken 206
- Datenbankmodelle: Architekturen für Datenunabhängigkeit 221
- Data + Access: Datenmodelle und Algorithmen 242