Seite - 276 - in Digitale Datenbanken - Eine Medientheorie im Zeitalter von Big Data
Bild der Seite - 276 -
Text der Seite - 276 -
Digitale
Datenbanken276
Das Ziel dieser Best Practice-Richtlinien ist es, die isolierten Inseln strukturierter
Daten im Internet zu einem »Global Data Space« (Heath/Bizer 2011: 4) zusammen-
zuführen, den Berners-Lee als »web of data« bezeichnet und in dem der »un-
expected re-use of information« (Berners-Lee 2006) möglich werde. Im Anschluss
an die Formulierung der Linked Data-Regeln wurde im Januar 2007 vom W3C das
Linking Open Data-Gemeinschaftsprojekt initiiert, welches die Bemühungen im
Bereich von Linked Data koordiniert und einen Überblick über die derzeit verfüg-
baren Datenbestände gibt. Dies hat dazu geführt, dass die Zahl der frei zugäng-
lichen Linked Data-Datenbestände von anfänglich zwölf auf 570 angestiegen ist
(W3C 2014). Durch diese Entwicklung ist die oben genannte Voraussetzung für die
Entwicklung von Endnutzeranwendungen im Semantic Web gegeben. Jedoch sind
mit der zunehmenden Zahl an verfügbaren Linked Data-Datensätzen zwei neue
Herausforderungen entstanden, deren Lösung noch aussteht.
Auf der Datenebene erweist sich die konsistente Vernetzung heterogener Daten-
bestände als Herausforderung. Im Rahmen eines Bestands werden Entitäten als
Ressourcen behandelt, die durch einen Uniform Resource Identifier (URI) eindeu
tig
identifiziert werden. Diese Ressourcen werden mithilfe von Prädikaten beschrie-
ben, die ebenfalls eindeutig durch URIs adressiert werden können. Da denselben
Res sourcen in verschiedenen Datenbeständen unterschiedliche Identifikatoren
zugewiesen werden können und diese zudem häufig mithilfe verschiedener Voka-
bulare beschrieben werden, ist es sowohl auf der Ebene der Ressourcen als auch
auf der Ebene der Vokabulare bedeutsam, Identitätsbeziehungen durch typisierte
Links explizit zu machen (vgl. Heath/Bizer 2011: 22f.).119 Um anzuzeigen, dass
sich verschiedene URIs auf dieselbe Ressource beziehen und somit über dasselbe
informieren, werden konventionell Identitätslinks – owl:sameAs – gebraucht, deren
Bedeutung in der zweiten Version der Web Ontology Language (OWL 2) wie folgt
definiert ist: »The property that determines that two given individuals are equal«
(W3C 2009). Die formallogische Semantik des owl:sameAs-Prädikats orientiert sich
an dem von Leibniz formulierten Prinzip der Ununterscheidbarkeit, welches besagt,
dass zwei Entitäten x und y dann identisch sind, wenn sämtliche wahren Aussagen
über x ebenfalls auf y zutreffen und umgekehrt sämtliche wahren Aussagen über
y auch für x gelten (vgl. Halpin/Hayes 2010). Identität ist diesem Verständnis zu-
folge symmetrisch und transitiv. Dies hat, wie Halpin und Hayes darlegen, zur Kon-
sequenz, dass derart formal-semantisch spezifizierte owl:sameAs-Links nicht als
Identitätsbehauptungen begriffen werden, sondern als Faktum:
119 | Um die Vielfalt unterschiedlicher Beschreibungsvokabulare einzugrenzen,
wird empfohlen, auf bereits etablierte Vokabulare zurückzugreifen, wie z.B. das
Dublin Core-Metadatenvokabular, das Friend-of-a-Friend (FOAF)-Vokabular und das
Semantically-Interlinked Online Communities (SIOC)-Vokabular (vgl. Heath/Bizer
2011: 24f. und 61f.).
Digitale Datenbanken
Eine Medientheorie im Zeitalter von Big Data
- Titel
- Digitale Datenbanken
- Untertitel
- Eine Medientheorie im Zeitalter von Big Data
- Autor
- Marcus Burkhardt
- Verlag
- transcript Verlag
- Datum
- 2015
- Sprache
- deutsch
- Lizenz
- CC BY-SA 4.0
- ISBN
- 978-3-8394-3028-6
- Abmessungen
- 14.7 x 22.4 cm
- Seiten
- 392
- Kategorie
- Informatik
Inhaltsverzeichnis
- Medium: Zwischen Konstellationen und Konfigurationen 21
- Die Frage nach den Medien 22
- Wann sind Medien? 33
- Über Medien reden: Medienepistemologie 58
- Computer: Zwischen Oberfläche und Tiefe 73
- Phänomeno-Technische Konfigurationen 75
- Spielräume der computertechnischen Informationsvermittlung 95
- Datenbank: Zwischen digitalen Sammlungen und Sammlungstechnologien 117
- Was sind Datenbanken? 121
- Datenbanklogiken: Zur Datenbank als symbolischer Form 131
- Gegen die Datenbank als Prinzip: Mikrologiken der digitalen Datenhaltung 145
- Banken, Basen, Reservoirs: Information Storage and Retrieval 149
- Information: Zwischen begrifflicher Abstraktion und technischer Konkretion 150
- Kommunikation mit Informationssammlungen 167
- Daten und Information: Begriffsklärung 187
- Techno-Logik: Apparaturen, Architekturen, Verfahren 205
- Direct Access: Zur Festplatte als Herausforderung digitaler Datenbanken 206
- Datenbankmodelle: Architekturen für Datenunabhängigkeit 221
- Data + Access: Datenmodelle und Algorithmen 242