Page - 261 - in Digitale Datenbanken - Eine Medientheorie im Zeitalter von Big Data
Image of the Page - 261 -
Text of the Page - 261 -
Techno-Logik 261
und behandeln Hyperlinks analog zu Zitaten: »One can simply think of every link
as being like an academic citation« (Page et al. 1998: 2). Die Qualität oder Relevanz
einer Webseite wird nicht anhand inhaltlicher Kriterien bewertet, sondern aus der
»hypertextual citation structure« (Page et al. 1998: 2) des gesamten Web abgeleitet,
d.h. das gleichwertige Nebeneinander von Webseiten wird im Rückgriff auf die
Linkstruktur gewichtet (siehe Abb. 16). Dadurch wird der ungeordneten Vielfalt
von Dokumenten im WWW eine Ordnung gegeben, die sich in der Anordnung der
Suchergebnisse widerspiegelt.
Webseiten, die in den Ergebnislisten weit vorn erscheinen, wird eine höhere
Relevanz beigemessen als anderen weiter hinten aufgeführten Seiten. Diese Relevanz-
ordnung ist für den Umgang mit Websuchmaschinen von zentraler Bedeutung. Für
das Suchwort Datenbank findet Google beispielsweise circa 135 Millionen Ergeb-
nisse, eine für menschliche Nutzer nicht zu überschauende Treffermenge.90 Hand-
habbar werden die Ergebnisse für den Suchenden erst durch deren Anordnung in
der Ergebnisliste anhand von Relevanzkriterien.
Abb. 16: Beispiel der Gewichtung von Webseiten mithilfe des PageRank-Verfahrens91
Websuchmaschinen operieren mit der Annahme, dass ihre Nutzer nicht an der
Gesamtheit der Webseiten interessiert sind, die einem bestimmten Suchkriterium
entsprechen, sondern nur an einer oder zumindest an relativ wenigen Seiten. Dem-
entsprechend gibt Google ungeachtet der angezeigten Gesamtzahl von Ergeb-
nissen dem Nutzer je Suchanfrage maximal 1000 Ergebnisse zurück. Die bereits
erwähnte Suche nach dem Stichwort Datenbank fördert nur 905 tatsächliche Ergeb-
90 | Suche vom 3.2.2012.
91 | Der PageRank PR einer Webseite A ist rekursiv definiert und berechnet sich wie
folgt: PR(A)=(1-d) + d[PR(T1)/C(T1) + ... + PR(Tn)/C(Tn)]. Parameter d ist ein Dämp-
fungsfaktor, der typischerweise auf 0,85 festgelegt wird. T1 bis Tn sind die Web-
seiten, die auf Seite A verweisen. C(Ti) ist die Summe der Links, die von einer Seite
Ti auf andere Webseiten verweisen (vgl. Brin/Page 1998: 109f.). Der PageRank
einer Webseite ist demzufolge nicht nur abhängig von der Zahl der Links, die auf
diese zeigen, sondern auch von dem PageRank der Seiten, die diese Links be-
inhalten. Ein Link von einer höher bewerteten Webseite hat mehr Gewicht als ein
Link von einer Seite mit niedrigem PageRank.
Digitale Datenbanken
Eine Medientheorie im Zeitalter von Big Data
- Title
- Digitale Datenbanken
- Subtitle
- Eine Medientheorie im Zeitalter von Big Data
- Author
- Marcus Burkhardt
- Publisher
- transcript Verlag
- Date
- 2015
- Language
- German
- License
- CC BY-SA 4.0
- ISBN
- 978-3-8394-3028-6
- Size
- 14.7 x 22.4 cm
- Pages
- 392
- Category
- Informatik
Table of contents
- Medium: Zwischen Konstellationen und Konfigurationen 21
- Die Frage nach den Medien 22
- Wann sind Medien? 33
- Über Medien reden: Medienepistemologie 58
- Computer: Zwischen Oberfläche und Tiefe 73
- Phänomeno-Technische Konfigurationen 75
- Spielräume der computertechnischen Informationsvermittlung 95
- Datenbank: Zwischen digitalen Sammlungen und Sammlungstechnologien 117
- Was sind Datenbanken? 121
- Datenbanklogiken: Zur Datenbank als symbolischer Form 131
- Gegen die Datenbank als Prinzip: Mikrologiken der digitalen Datenhaltung 145
- Banken, Basen, Reservoirs: Information Storage and Retrieval 149
- Information: Zwischen begrifflicher Abstraktion und technischer Konkretion 150
- Kommunikation mit Informationssammlungen 167
- Daten und Information: Begriffsklärung 187
- Techno-Logik: Apparaturen, Architekturen, Verfahren 205
- Direct Access: Zur Festplatte als Herausforderung digitaler Datenbanken 206
- Datenbankmodelle: Architekturen für Datenunabhängigkeit 221
- Data + Access: Datenmodelle und Algorithmen 242