Page - 264 - in Digitale Datenbanken - Eine Medientheorie im Zeitalter von Big Data
Image of the Page - 264 -
Text of the Page - 264 -
Digitale
Datenbanken264
ist, lÀsst sich an dem von Google-Mitarbeitern publizierten Beispiel der Webtable
die Funktion verdeutlichen, die diese Datenbank fĂŒr die Realisierung der Websuche
hat.
Eine Zeile beinhaltet Informationen zu einer Webpage, welche durch ihre URL
identifiziert wird. In der ersten Spalte der Bigtable wird der gesamte Inhalt der
Webseite als HTML-Code gespeichert.98 Die ĂŒbrigen Spalten des Beispiels beinhal-
ten die Links, welche von der jeweiligen Webpage aus auf andere Seiten verweisen.
Jedes Linkziel, d.h. jede verlinkte URL, wird in einer eigenen Spalte gespeichert
und die Tabellenzellen beinhalten den Ankertext des Links. Gruppiert sind diese
Spalten zu der Spaltenfamilie »anchor«, welche die unterschiedlichen Spalten, die
Links enthalten, zu einem Typ zusammenfasst und ihnen hierdurch eine Bedeutung
zuweist. In einer solchen Datenstruktur lÀsst sich die stÀndig wandelnde Topologie
des Web abbilden. Indem Google sÀmtliche von Webcrawlern, also Suchrobotern,
gefundenen Webseiten in der Webtable speichert, wird das WWW in eine Daten-
bank transformiert und somit als Ganzes verwalt- und verarbeitbar.
Die Websuche von Google basiert maĂgeblich auf der Versammlung des WWW
in einer Datenbank. FĂŒr die Realisierung der SuchfunktionalitĂ€t ist diese Ăber-
setzung jedoch nur ein erster Schritt, sodass die Nutzer der Suchmaschine Google
allenfalls mittelbar mit der Webtable-Datenbank interagieren. Entscheidend ist
vielmehr, dass durch die Ăbersetzung der offenen Netzarchitektur des WWW in
eine geschlossene Datenbankstruktur das Web als Ganzes handhabbar wird. Dies
ist die Voraussetzung fĂŒr die Berechnung des PageRank von Webseiten aus dem
Grad ihrer Verlinkung mit anderen Webseiten, der, wie bereits dargelegt, als ein
wichtiger Relevanz- bzw. QualitÀtsindikator einer Webseite fungiert und die An-
ordnung von Suchergebnissen in der Ergebnisliste grundlegend beeinflusst. Das
Informationsmodell, welches der Webtable zugrunde liegt, dient demzufolge nicht
der semantischen Beschreibung der auf Webseiten enthaltenen Informationen,
sondern bildet eine Metastruktur fĂŒr die nachtrĂ€gliche algorithmische Zuschrei-
bung eines Relevanzwerts zu einer Webseite. Das Resultat der dem PageRank-Ver-
fahren eingeschriebenen Hypothese ist, dass sich die QualitÀt einer Webseite in
ihrer LinkpopularitÀt, d.h. der QuantitÀt ihrer Referenzen widerspiegelt, welche
durch die Transformation des Web in eine Datenbank berechenbar wird.
Was die nutzerseitige Suche nach Informationen anbelangt, stehen bei Websuch-
maschinen algorithmische Verfahren der Auswertung von Information und der
Zuschreibung von Bedeutung im Vordergrund. Welche Ergebnisse in welcher
Reihenfolge fĂŒr Suchanfragen zurĂŒckgegeben werden, basiert demzufolge auf
Algorithmen. Insofern lÀsst sich die Suche mit Websuchmaschinen als ein algorith-
mischer Selektionsprozess verstehen. Google bezieht eigenen Angaben zufolge der-
zeit nicht weniger als 200 Faktoren in die Bewertung von Webseiten ein, wobei die
98 | Neben HTML-Dateien indexiert Google eine Reihe weiterer gebrÀuchlicher Datei-
typen, die im Web gespeichert und durch eine URL abgerufen werden können. Eine
Liste findet sich in den Google Webmaster Tools (vgl. Google).
Digitale Datenbanken
Eine Medientheorie im Zeitalter von Big Data
- Title
- Digitale Datenbanken
- Subtitle
- Eine Medientheorie im Zeitalter von Big Data
- Author
- Marcus Burkhardt
- Publisher
- transcript Verlag
- Date
- 2015
- Language
- German
- License
- CC BY-SA 4.0
- ISBN
- 978-3-8394-3028-6
- Size
- 14.7 x 22.4 cm
- Pages
- 392
- Category
- Informatik
Table of contents
- Medium: Zwischen Konstellationen und Konfigurationen 21
- Die Frage nach den Medien 22
- Wann sind Medien? 33
- Ăber Medien reden: Medienepistemologie 58
- Computer: Zwischen OberflÀche und Tiefe 73
- PhÀnomeno-Technische Konfigurationen 75
- SpielrÀume der computertechnischen Informationsvermittlung 95
- Datenbank: Zwischen digitalen Sammlungen und Sammlungstechnologien 117
- Was sind Datenbanken? 121
- Datenbanklogiken: Zur Datenbank als symbolischer Form 131
- Gegen die Datenbank als Prinzip: Mikrologiken der digitalen Datenhaltung 145
- Banken, Basen, Reservoirs: Information Storage and Retrieval 149
- Information: Zwischen begrifflicher Abstraktion und technischer Konkretion 150
- Kommunikation mit Informationssammlungen 167
- Daten und Information: BegriffsklÀrung 187
- Techno-Logik: Apparaturen, Architekturen, Verfahren 205
- Direct Access: Zur Festplatte als Herausforderung digitaler Datenbanken 206
- Datenbankmodelle: Architekturen fĂŒr DatenunabhĂ€ngigkeit 221
- Data + Access: Datenmodelle und Algorithmen 242