Seite - 264 - in Digitale Datenbanken - Eine Medientheorie im Zeitalter von Big Data
Bild der Seite - 264 -
Text der Seite - 264 -
Digitale
Datenbanken264
ist, lässt sich an dem von Google-Mitarbeitern publizierten Beispiel der Webtable
die Funktion verdeutlichen, die diese Datenbank für die Realisierung der Websuche
hat.
Eine Zeile beinhaltet Informationen zu einer Webpage, welche durch ihre URL
identifiziert wird. In der ersten Spalte der Bigtable wird der gesamte Inhalt der
Webseite als HTML-Code gespeichert.98 Die übrigen Spalten des Beispiels beinhal-
ten die Links, welche von der jeweiligen Webpage aus auf andere Seiten verweisen.
Jedes Linkziel, d.h. jede verlinkte URL, wird in einer eigenen Spalte gespeichert
und die Tabellenzellen beinhalten den Ankertext des Links. Gruppiert sind diese
Spalten zu der Spaltenfamilie »anchor«, welche die unterschiedlichen Spalten, die
Links enthalten, zu einem Typ zusammenfasst und ihnen hierdurch eine Bedeutung
zuweist. In einer solchen Datenstruktur lässt sich die ständig wandelnde Topologie
des Web abbilden. Indem Google sämtliche von Webcrawlern, also Suchrobotern,
gefundenen Webseiten in der Webtable speichert, wird das WWW in eine Daten-
bank transformiert und somit als Ganzes verwalt- und verarbeitbar.
Die Websuche von Google basiert maßgeblich auf der Versammlung des WWW
in einer Datenbank. Für die Realisierung der Suchfunktionalität ist diese Über-
setzung jedoch nur ein erster Schritt, sodass die Nutzer der Suchmaschine Google
allenfalls mittelbar mit der Webtable-Datenbank interagieren. Entscheidend ist
vielmehr, dass durch die Übersetzung der offenen Netzarchitektur des WWW in
eine geschlossene Datenbankstruktur das Web als Ganzes handhabbar wird. Dies
ist die Voraussetzung für die Berechnung des PageRank von Webseiten aus dem
Grad ihrer Verlinkung mit anderen Webseiten, der, wie bereits dargelegt, als ein
wichtiger Relevanz- bzw. Qualitätsindikator einer Webseite fungiert und die An-
ordnung von Suchergebnissen in der Ergebnisliste grundlegend beeinflusst. Das
Informationsmodell, welches der Webtable zugrunde liegt, dient demzufolge nicht
der semantischen Beschreibung der auf Webseiten enthaltenen Informationen,
sondern bildet eine Metastruktur für die nachträgliche algorithmische Zuschrei-
bung eines Relevanzwerts zu einer Webseite. Das Resultat der dem PageRank-Ver-
fahren eingeschriebenen Hypothese ist, dass sich die Qualität einer Webseite in
ihrer Linkpopularität, d.h. der Quantität ihrer Referenzen widerspiegelt, welche
durch die Transformation des Web in eine Datenbank berechenbar wird.
Was die nutzerseitige Suche nach Informationen anbelangt, stehen bei Websuch-
maschinen algorithmische Verfahren der Auswertung von Information und der
Zuschreibung von Bedeutung im Vordergrund. Welche Ergebnisse in welcher
Reihenfolge für Suchanfragen zurückgegeben werden, basiert demzufolge auf
Algorithmen. Insofern lässt sich die Suche mit Websuchmaschinen als ein algorith-
mischer Selektionsprozess verstehen. Google bezieht eigenen Angaben zufolge der-
zeit nicht weniger als 200 Faktoren in die Bewertung von Webseiten ein, wobei die
98 | Neben HTML-Dateien indexiert Google eine Reihe weiterer gebräuchlicher Datei-
typen, die im Web gespeichert und durch eine URL abgerufen werden können. Eine
Liste findet sich in den Google Webmaster Tools (vgl. Google).
Digitale Datenbanken
Eine Medientheorie im Zeitalter von Big Data
- Titel
- Digitale Datenbanken
- Untertitel
- Eine Medientheorie im Zeitalter von Big Data
- Autor
- Marcus Burkhardt
- Verlag
- transcript Verlag
- Datum
- 2015
- Sprache
- deutsch
- Lizenz
- CC BY-SA 4.0
- ISBN
- 978-3-8394-3028-6
- Abmessungen
- 14.7 x 22.4 cm
- Seiten
- 392
- Kategorie
- Informatik
Inhaltsverzeichnis
- Medium: Zwischen Konstellationen und Konfigurationen 21
- Die Frage nach den Medien 22
- Wann sind Medien? 33
- Über Medien reden: Medienepistemologie 58
- Computer: Zwischen Oberfläche und Tiefe 73
- Phänomeno-Technische Konfigurationen 75
- Spielräume der computertechnischen Informationsvermittlung 95
- Datenbank: Zwischen digitalen Sammlungen und Sammlungstechnologien 117
- Was sind Datenbanken? 121
- Datenbanklogiken: Zur Datenbank als symbolischer Form 131
- Gegen die Datenbank als Prinzip: Mikrologiken der digitalen Datenhaltung 145
- Banken, Basen, Reservoirs: Information Storage and Retrieval 149
- Information: Zwischen begrifflicher Abstraktion und technischer Konkretion 150
- Kommunikation mit Informationssammlungen 167
- Daten und Information: Begriffsklärung 187
- Techno-Logik: Apparaturen, Architekturen, Verfahren 205
- Direct Access: Zur Festplatte als Herausforderung digitaler Datenbanken 206
- Datenbankmodelle: Architekturen für Datenunabhängigkeit 221
- Data + Access: Datenmodelle und Algorithmen 242