Seite - 69 - in Austrian Law Journal, Band 1/2016
Bild der Seite - 69 -
Text der Seite - 69 -
ALJ 1/2016 Jörg Fuchslueger 69
zu können. Die zunehmenden Datenmengen erfordern zusätzlich einen Umdenkprozess – klas-
sisch lesen, selbst nach aufwendigen Verfahren der Datenreduktion, funktioniert nicht mehr.
II. Grundlagen
Ehe die semantische Analyse unstrukturierter Daten am konkreten Beispiel dargestellt wird, sollen
die einschlägigen Grundbegriffe geklärt werden, um so das Verständnis sowohl der Herausfor-
derung als auch der Lösung durch BIConcepts zu ermöglichen.
A. Strukturierte versus unstrukturierte Daten
Strukturierte Daten sind zumeist in Datenbanken gespeichert und werden mit genormten Abfra-
gesprachen recherchiert und analysiert. Um auch Nicht-Datenbank-Spezialisten und -Anwendern
einen benutzerfreundlichen Zugriff zu ermöglichen, wird mit semantischen Modellen gearbeitet.
Semantische Modelle ermöglichen – ohne Detailkenntnis der Datenstruktur – auch Datenbank-
Laien, selbstständig Abfragen durchzuführen und Berichte und Auswertungen zu erstellen. Data-
mining-Modelle berechnen bei Bedarf Muster und daraus wiederum Abhängigkeiten oder Auffäl-
ligkeiten. In der strukturierten Datenwelt haben wir gelernt, mit entsprechenden Abfragen und
Auswertungen Antworten auf unsere Fragen zu bekommen. Selbst bei umfangreichen Daten-
banken oder sehr komplexen Verknüpfungen zwischen Tabellen ist bei vielen Unternehmen
Technologie und Know-how vorhanden, um selbstständig Recherchen durchzuführen. Ad-hoc-
Abfragen und Analysen in strukturierten Daten sind etablierte Methoden der Informationsgewin-
nung. Neue Erkenntnisse entstehen nicht durch das Lesen einzelner Datensätze, sondern durch
Interpretation von Berichten, Auswertungen, Statistiken, Diagrammen und Visualisierungen.
Kann dieser Ansatz auch bei unstrukturierten Daten funktionieren? Können Dokumenttypen aller
Art, wie Millionen von E-Mails samt deren Anhängen, zumeist PDF, Office-Dokumente oder, fach-
lich und inhaltlich gesprochen, Verträge, Rechnungen, Angebote, Präsentationen oder Berichte,
ähnlich einer Datenbank inhaltlich ausgewertet werden? Wir sind davon überzeugt und unsere
Antwort lautet: Ja. Über semantische Analysemodelle können unstrukturierte Daten entspre-
chend strukturiert werden. Damit lässt sich auch diese Art von unstrukturierter Datenvielfalt
selbst bei enormen Datenmengen in angemessener Zeit abfragen und inhaltlich auswerten. Ohne
jedes einzelne Dokument lesen zu müssen, werden Auffälligkeiten automatisiert erkannt, Zusam-
menhänge visualisiert und umgehend verwertbare Ergebnisse gewonnen. Mit diesem praktikablen
Ansatz kann der Datenexplosion bei internen Untersuchungen begegnet werden. Die technische
Grundlage natürlich-sprachlicher Informationsverarbeitung liefert dabei die IBM Watson Explorer
Analytical Components.
B. IBM Watson Explorer Analytical Components
BIConcepts ist ein Software Entwicklungs- und IT-Dienstleistungsunternehmen in Wien. BI steht für
Business Intelligence, das Unternehmen beschäftigt sich mit der Informationsaufbereitung aus
großen Datenmengen. In diesem Technologieumfeld ist BIConcepts langjähriger IBM Premium
Business Partner. IBM investiert laufend in den Bereich Analytik und seit einigen Jahren auch
massiv in den Bereich Cognitive Computing. Basierend auf spezieller Software, die ua auch
„Sprachverständnis“ (Natural Language Processing, NLP) einsetzt, werden diverse innovative
zurück zum
Buch Austrian Law Journal, Band 1/2016"
Austrian Law Journal
Band 1/2016
- Titel
- Austrian Law Journal
- Band
- 1/2016
- Autor
- Karl-Franzens-Universität Graz
- Herausgeber
- Brigitta Lurger
- Elisabeth Staudegger
- Stefan Storr
- Ort
- Graz
- Datum
- 2016
- Sprache
- deutsch
- Lizenz
- CC BY 4.0
- Abmessungen
- 19.1 x 27.5 cm
- Seiten
- 110
- Schlagwörter
- Recht, Gesetz, Rechtswissenschaft, Jurisprudenz
- Kategorien
- Zeitschriften Austrian Law Journal