Page - 260 - in Digitale Datenbanken - Eine Medientheorie im Zeitalter von Big Data
Image of the Page - 260 -
Text of the Page - 260 -
Digitale
Datenbanken260
der Formulierung von SQL-Anfragen hingegen kein Geheimnis dar, welches bei
der Interaktion mit der Black Box Datenbank gelüftet werden müsste.87 Hierin
unterscheidet sich die Suche in relationalen Datenbanken beispielsweise von der
Suche mit Websuchmaschinen. Dies soll im Folgenden genauer erklärt werden.
Websuchmaschinen: Algorithmische Relevanzzuschreibung
Internetsuchmaschinen wie z.B. Google, Bing, Baidu, Yandex etc. machen es sich zur
Aufgabe, die Gesamtheit der im World Wide Web verfügbaren Informationen auf-
findbar zu machen. Die Effektivität derartiger Suchmaschinen beruht auf algorith-
mischen Verfahren der Zuschreibung von Bedeutung. Unbekannt sind nicht nur die
potenziell auffindbaren Informationen, sondern auch die Regeln der Attribuierung
von Bedeutung sowie der Selektion von Information, weshalb die Suche als eine
Black Box zu behandeln ist. Auch Websuchmaschinen dienen der Verarbeitung von
Bedeutung. Im Vordergrund steht jedoch nicht der Sinn oder Gehalt von digitalen
Informationen, sondern die Relevanz von Webdokumenten für den Suchenden.
Dies haben Sergey Brin und Lawrence Page erkannt, die mit der Formulierung
des PageRank-Algorithmus die Grundlage zeitgenössischer Websuchmaschinen
geschaffen haben. Die praktische Leistungsfähigkeit des PageRank-Verfahrens
haben Brin und Page mit ihrer Suchmaschine Google unter Beweis gestellt, welche
seit mehr als einem Jahrzehnt eine Vormachtstellung auf dem Suchmaschinenmarkt
innehat (Brin et al. 1998; Brin/Page 1998; Page et al. 1998).
Der PageRank-Algorithmus, wie er Ende der 1990er Jahre entwickelt und
angewendet wurde, bewertet die Relevanz eines Webdokuments am Grad seiner
Verlinkung, d.h. an der relativen Häufigkeit, mit der andere Webseiten auf dieses
Dokument verweisen.88 Ein Vorbild des PageRank ist die Berechnung des Einfluss-
faktors (Impact Factor) wissenschaftlicher Publikationen auf Basis der Zahl der
Zitationen eines Artikels.89 Brin und Page haben diese Idee auf das Web übertragen
richten ließen, deren Beantwortbarkeit bislang nicht getestet worden war« (Gugerli
2009: 72).
87 | Eine Unbekannte wird auf der Oberfläche allenfalls bei der Gestaltung von
Benutzerschnittstellen eingeführt, welche den Nutzer auf bestimmte Suchmöglich-
keiten festlegen, indem sie bestimmte Anfrageformen im Interface vorgeben. Siehe
hierzu S. 296ff. im Kapitel »Phänomeno-Logik«.
88 | Ein ähnliches Verfahren wie der PageRank-Algorithmus wurde ungefähr zur
gleichen Zeit von Jon Kleinberg entwickelt, welches Hyerlink-Induced Topic Search,
kurz HITS, genannt wird (Kleinberg 1999, 2000). Ein Vergleich zwischen dem HITS-
und dem PageRank-Algorithmus findet sich in Rieder (2012).
89 | Page verweist in den beiden Patenten zum PageRank-Algorithmus explizit auf
Eugene Garfield, den Erfinder des Science Citation Index (vgl. Page 2001, 2004).
Die Wurzeln des PageRank in der Soziometrie und Bibliometrie werden von Mayer
(2009) rekonstruiert.
Digitale Datenbanken
Eine Medientheorie im Zeitalter von Big Data
- Title
- Digitale Datenbanken
- Subtitle
- Eine Medientheorie im Zeitalter von Big Data
- Author
- Marcus Burkhardt
- Publisher
- transcript Verlag
- Date
- 2015
- Language
- German
- License
- CC BY-SA 4.0
- ISBN
- 978-3-8394-3028-6
- Size
- 14.7 x 22.4 cm
- Pages
- 392
- Category
- Informatik
Table of contents
- Medium: Zwischen Konstellationen und Konfigurationen 21
- Die Frage nach den Medien 22
- Wann sind Medien? 33
- Über Medien reden: Medienepistemologie 58
- Computer: Zwischen Oberfläche und Tiefe 73
- Phänomeno-Technische Konfigurationen 75
- Spielräume der computertechnischen Informationsvermittlung 95
- Datenbank: Zwischen digitalen Sammlungen und Sammlungstechnologien 117
- Was sind Datenbanken? 121
- Datenbanklogiken: Zur Datenbank als symbolischer Form 131
- Gegen die Datenbank als Prinzip: Mikrologiken der digitalen Datenhaltung 145
- Banken, Basen, Reservoirs: Information Storage and Retrieval 149
- Information: Zwischen begrifflicher Abstraktion und technischer Konkretion 150
- Kommunikation mit Informationssammlungen 167
- Daten und Information: Begriffsklärung 187
- Techno-Logik: Apparaturen, Architekturen, Verfahren 205
- Direct Access: Zur Festplatte als Herausforderung digitaler Datenbanken 206
- Datenbankmodelle: Architekturen für Datenunabhängigkeit 221
- Data + Access: Datenmodelle und Algorithmen 242