Seite - 69 - in Austrian Law Journal, Band 1/2016

Bild der Seite - 69 -

Text der Seite - 69 -

ALJ 1/2016 Jörg Fuchslueger 69 zu können. Die zunehmenden Datenmengen erfordern zusätzlich einen Umdenkprozess – klas- sisch lesen, selbst nach aufwendigen Verfahren der Datenreduktion, funktioniert nicht mehr. II. Grundlagen Ehe die semantische Analyse unstrukturierter Daten am konkreten Beispiel dargestellt wird, sollen die einschlägigen Grundbegriffe geklärt werden, um so das Verständnis sowohl der Herausfor- derung als auch der Lösung durch BIConcepts zu ermöglichen. A. Strukturierte versus unstrukturierte Daten Strukturierte Daten sind zumeist in Datenbanken gespeichert und werden mit genormten Abfra- gesprachen recherchiert und analysiert. Um auch Nicht-Datenbank-Spezialisten und -Anwendern einen benutzerfreundlichen Zugriff zu ermöglichen, wird mit semantischen Modellen gearbeitet. Semantische Modelle ermöglichen – ohne Detailkenntnis der Datenstruktur – auch Datenbank- Laien, selbstständig Abfragen durchzuführen und Berichte und Auswertungen zu erstellen. Data- mining-Modelle berechnen bei Bedarf Muster und daraus wiederum Abhängigkeiten oder Auffäl- ligkeiten. In der strukturierten Datenwelt haben wir gelernt, mit entsprechenden Abfragen und Auswertungen Antworten auf unsere Fragen zu bekommen. Selbst bei umfangreichen Daten- banken oder sehr komplexen Verknüpfungen zwischen Tabellen ist bei vielen Unternehmen Technologie und Know-how vorhanden, um selbstständig Recherchen durchzuführen. Ad-hoc- Abfragen und Analysen in strukturierten Daten sind etablierte Methoden der Informationsgewin- nung. Neue Erkenntnisse entstehen nicht durch das Lesen einzelner Datensätze, sondern durch Interpretation von Berichten, Auswertungen, Statistiken, Diagrammen und Visualisierungen. Kann dieser Ansatz auch bei unstrukturierten Daten funktionieren? Können Dokumenttypen aller Art, wie Millionen von E-Mails samt deren Anhängen, zumeist PDF, Office-Dokumente oder, fach- lich und inhaltlich gesprochen, Verträge, Rechnungen, Angebote, Präsentationen oder Berichte, ähnlich einer Datenbank inhaltlich ausgewertet werden? Wir sind davon überzeugt und unsere Antwort lautet: Ja. Über semantische Analysemodelle können unstrukturierte Daten entspre- chend strukturiert werden. Damit lässt sich auch diese Art von unstrukturierter Datenvielfalt selbst bei enormen Datenmengen in angemessener Zeit abfragen und inhaltlich auswerten. Ohne jedes einzelne Dokument lesen zu müssen, werden Auffälligkeiten automatisiert erkannt, Zusam- menhänge visualisiert und umgehend verwertbare Ergebnisse gewonnen. Mit diesem praktikablen Ansatz kann der Datenexplosion bei internen Untersuchungen begegnet werden. Die technische Grundlage natürlich-sprachlicher Informationsverarbeitung liefert dabei die IBM Watson Explorer Analytical Components. B. IBM Watson Explorer Analytical Components BIConcepts ist ein Software Entwicklungs- und IT-Dienstleistungsunternehmen in Wien. BI steht für Business Intelligence, das Unternehmen beschäftigt sich mit der Informationsaufbereitung aus großen Datenmengen. In diesem Technologieumfeld ist BIConcepts langjähriger IBM Premium Business Partner. IBM investiert laufend in den Bereich Analytik und seit einigen Jahren auch massiv in den Bereich Cognitive Computing. Basierend auf spezieller Software, die ua auch „Sprachverständnis“ (Natural Language Processing, NLP) einsetzt, werden diverse innovative

zurück zum Buch Austrian Law Journal, Band 1/2016"

Austrian Law Journal Band 1/2016

Titel: Austrian Law Journal
Band: 1/2016
Autor: Karl-Franzens-Universität Graz
Herausgeber: Brigitta Lurger; Elisabeth Staudegger; Stefan Storr
Ort: Graz
Datum: 2016
Sprache: deutsch
Lizenz: CC BY 4.0
Abmessungen: 19.1 x 27.5 cm
Seiten: 110
Schlagwörter: Recht, Gesetz, Rechtswissenschaft, Jurisprudenz
Kategorien: Zeitschriften Austrian Law Journal