Seite - 68 - in Austrian Law Journal, Band 1/2016
Bild der Seite - 68 -
Text der Seite - 68 -
ISSN: 2409-6911
(CC-BY) 3.0 license
www.austrian-law-journal.at
Fundstelle: Fuchslueger, Semantische Analyse unstrukturierter Daten, ALJ 1/2016, 68–77 (http://alj.uni-
graz.at/index.php/alj/article/view/61).
Semantische Analyse unstrukturierter Daten
Review und Analyse: Big-Data Ansatz bei internen Untersuchungen
anhand eines Beispiels
Jörg Fuchslueger*, Wien
Kurztext: In der juristischen Fallbearbeitung steht man immer häufiger vor der Herausforderung,
unüberschaubare Massen an Unterlagen berücksichtigen zu müssen. Relevante Information ist ver-
borgen in hunderttausenden E-Mails, Office-Dokumenten und PDF-Dateien. All diese Unterlagen zu
lesen, zu verstehen und zu beurteilen, ist in der Praxis nicht mehr möglich. Der vorliegende Artikel
zeigt ein Vorgehensmodell, wie mit semantischer Inhaltsanalyse die notwendige Informationsge-
winnung in umfangreichen, elektronisch gespeicherten Textbeständen durchgeführt werden kann.
Schlagworte: E-Discovery; interne Untersuchungen (Internal Investigations); Big Data; Com-
pliance; semantische Analyse; juristische Fallbearbeitung.
I. Einleitung
Im Zuge unternehmensinterner Sachverhaltsaufklärungen (Internal Investigations) sind immer
häufiger unüberschaubare, große Datenbestände zu überprüfen. Damit verbunden sind nicht
nur kritische Zeit- und Kostenentwicklungen. Untersuchungsteams stoßen an die Grenze des
Machbaren.
Selbst bei Einsatz elektronischer Review-Plattformen1 und computerunterstützten Methoden wie
Predictive Coding2 sind bisherige Vorgehensmodelle bei den heutigen Datenmengen nicht mehr
zielführend. Der Trend zeigt auf immer schneller und noch weiter wachsende Datenvolumen.
Wissensbasierte Ansätze, Cognitive Computing3 und heute verwertbare Teilbereiche in der Ent-
wicklung natürlich-sprachlicher Informationssysteme4 gewinnen an Bedeutung, um sichergestellte,
elektronisch vorhandene Informationsquellen für die Aufklärungsarbeit weiterhin sinnvoll nutzen
* Jörg Fuchslueger ist Head of Content Analytics der BIConcepts IT Consulting GmbH. Der Beitrag gibt den Inhalt des
Vortrags vom 11. 12. 2015 am 7. Thementag „Recht und IT“ zum Thema „Compliance-Management. Standards –
Tools – Haftung“ am ReSoWi-Zentrum der Universität Graz wieder.
1 Durch Scan und Schrifterkennung (OCR) werden auch „Papierdokumente“ zu ESI (Electronically Stored Information)
und können damit computerunterstützt durchsucht und abgearbeitet werden.
2 Maschinelle Klassifikation von Dokumenten auf Basis manuell erstellter Lernmengen.
3 Ein von IBM geprägter Begriff; dahinter steht ein Konzept, das eine wachsende Anzahl konkreter Services im
Umfeld „künstlicher Intelligenz“, wie zB die Umwandlung von Sprachinformation in Text (Voice to Text), Erkennung
von Objekten in Bildmaterial uvam, als Webservices oder bereits integriert in einer fertigen Entwicklungsumgebung
zur Verfügung stellt. http://www.ibm.com/cloud-computing/bluemix/watson/ (abgefragt am 31. 3 2016).
4 Natural Language Processing (NLP) gilt als Teilbereich der künstlichen Intelligenzforschung, um den Dialog Mensch–
Maschine auf Sprachebene zu ermöglichen.
zurück zum
Buch Austrian Law Journal, Band 1/2016"
Austrian Law Journal
Band 1/2016
- Titel
- Austrian Law Journal
- Band
- 1/2016
- Autor
- Karl-Franzens-Universität Graz
- Herausgeber
- Brigitta Lurger
- Elisabeth Staudegger
- Stefan Storr
- Ort
- Graz
- Datum
- 2016
- Sprache
- deutsch
- Lizenz
- CC BY 4.0
- Abmessungen
- 19.1 x 27.5 cm
- Seiten
- 110
- Schlagwörter
- Recht, Gesetz, Rechtswissenschaft, Jurisprudenz
- Kategorien
- Zeitschriften Austrian Law Journal