Seite - 338 - in Digitale Datenbanken - Eine Medientheorie im Zeitalter von Big Data
Bild der Seite - 338 -
Text der Seite - 338 -
Digitale
Datenbanken338
Zugriff zum Gesamtwissensbestand der Menschheit zu gewähren, bricht sich an
der Realität partikularer Informationssysteme, in denen Informationen stets nur
auf bestimmte Weise versammelt, verwaltet und verarbeitet werden können. Dass
dem Webarchiv des Internet Archive Grenzen gesetzt sind, gesteht dessen Mit-
begründer Brewster Kahle durchaus ein:
»The text, graphics, audio clips and other data collected from the Web will never be
comprehensive, because the crawler software cannot gain access to many of the
hundreds of thousands of sites. Publishers restrict access to data or store docu-
ments in a format inaccessible to simple crawler programs. Still, the archive gives
a feel of what the Web looks like during a given period of time even though it does
not constitute a full record.« (Kahle 1997: 83)
Anders als Kahle nahelegt, sind Zugriffsbeschränkungen und ähnliche Restrikti-
onen jedoch nicht die einzigen Schranken der Archivierung des WWW. Vielmehr
ist dem Webarchiv eine spezifische Sammel-, Speicher- und Zugriffslogik inhärent,
die es zu untersuchen gilt. Dies erlaubt es, die »scheinbar so unschuldige Tätigkeit
der Aufbewahrung von Dokumenten« (Ricœur 1991: 187) kritisch zu beleuchten.
An dieser Stelle muss eine umfassende Analyse der Archivlogik des Internet
Archive ausbleiben. Dennoch sollen an diesem Beispiel schlaglichtartig mögliche
Perspektiven einer medientheoretisch informierten Archivkritik aufgezei gt werden.
Einer solchen Kritik kann es nicht darum gehen, die Legitimität des Webarchivs
grundsätzlich in Frage zu stellen. Im Gegenteil, das Internet Archive stellt eine
wichtige Ressource für die Erforschung und künftige Erinnerung der Vergangenheit
des Web dar, wie beispielsweise die von Richard Rogers gegründete Digital Methods
Initiative gezeigt hat (vgl. Rogers 2013: 61f.).16
Die Grenzen, aber auch Möglichkeiten von digitalen Archiven im Allgemeinen
und des Internet Archive im Besonderen treten zum Vorschein, wenn man nach
den Vorentscheidungen fragt, auf denen die Archivierung beruht und welche die
Archivpraxis strukturieren. Hinsichtlich des Internet Archive ist zunächst fest-
zustellen, dass dieses ähnlich wie Google und andere Websuchmaschinen einer
Dokumentlogik folgt. Das WWW wird mithilfe von Webcrawlern durchsucht,
kopiert und hierdurch archiviert. Infolgedessen kann prinzipiell nur das ins Web-
archiv eingehen, was im WWW als Webseite abgefragt werden kann. Da heute eine
Vielzahl von Webseiten nicht als statische Dokumente gespeichert sind, sondern bei
der Abfrage durch datenbankgestützte CMS dynamisch erstellt werden, drängt sich
mit Metadaten versehen. Hieraus resultieren jedoch andere Herausforderungen.
So werden z.B. immer wieder Werbung und Spam zu diesem Dokumentarchiv hin-
zu gefügt.
16 | Eine anwendungsorientierte Beschreibung der Nutzungsmöglichkeiten des
Internet Archive für Forschungszwecke findet sich auf der Webseite der Digital
Methods Initiative (2012).
Digitale Datenbanken
Eine Medientheorie im Zeitalter von Big Data
- Titel
- Digitale Datenbanken
- Untertitel
- Eine Medientheorie im Zeitalter von Big Data
- Autor
- Marcus Burkhardt
- Verlag
- transcript Verlag
- Datum
- 2015
- Sprache
- deutsch
- Lizenz
- CC BY-SA 4.0
- ISBN
- 978-3-8394-3028-6
- Abmessungen
- 14.7 x 22.4 cm
- Seiten
- 392
- Kategorie
- Informatik
Inhaltsverzeichnis
- Medium: Zwischen Konstellationen und Konfigurationen 21
- Die Frage nach den Medien 22
- Wann sind Medien? 33
- Über Medien reden: Medienepistemologie 58
- Computer: Zwischen Oberfläche und Tiefe 73
- Phänomeno-Technische Konfigurationen 75
- Spielräume der computertechnischen Informationsvermittlung 95
- Datenbank: Zwischen digitalen Sammlungen und Sammlungstechnologien 117
- Was sind Datenbanken? 121
- Datenbanklogiken: Zur Datenbank als symbolischer Form 131
- Gegen die Datenbank als Prinzip: Mikrologiken der digitalen Datenhaltung 145
- Banken, Basen, Reservoirs: Information Storage and Retrieval 149
- Information: Zwischen begrifflicher Abstraktion und technischer Konkretion 150
- Kommunikation mit Informationssammlungen 167
- Daten und Information: Begriffsklärung 187
- Techno-Logik: Apparaturen, Architekturen, Verfahren 205
- Direct Access: Zur Festplatte als Herausforderung digitaler Datenbanken 206
- Datenbankmodelle: Architekturen für Datenunabhängigkeit 221
- Data + Access: Datenmodelle und Algorithmen 242