Page - 76 - in Austrian Law Journal, Volume 1/2016
Image of the Page - 76 -
Text of the Page - 76 -
ALJ 1/2016 Semantische Analyse unstrukturierter Daten 76
Das fallbezogene Analysemodell erlaubt es, mit wenigen Schritten bestimmte Projekte und Techno-
logiekomponenten zu filtern. Diese Ergebnismengen können in jedem Strukturpunkt analytisch
ausgewertet und durch zusätzliche Abfragen oder Filter weiter eingeschränkt werden. Zum
Beispiel führt bei unserem angenommenen Fall, eine tiefergehende Betrachtung auf Beträge
im Text zwischen 6,500.000,00 und 8,000.000,00 Euro, zu einer weiteren brauchbaren Reduktion
der Dokumentenmenge. Auch ein Dokument mit dem Textinhalt „… gut wäre unter 7 Mio zu
bleiben …“ wird berücksichtigt, da der Text „7 Mio“ im Facettenindex durch die semantische Ana-
lyse auch mit dem Betrag 7,000.000,00 annotiert ist.
Angenommen, es verbleiben von der Ursprungsmenge nun rund 2.500 Dokumente, die unseren
bisherigen Abfragekriterien entsprechen. Wir wissen aufgrund der bisherigen Analyse, dass diese
Dokumente mit bestimmten Projekten und Technologien zu tun haben und in irgendeiner Form
Betragsangaben zwischen 6,5 und 8 Millionen beinhalten. Wir gehen jetzt der Frage nach, ob zu
den bereits als kritisch definierten Kommunikationspfaden E-Mails vorliegen bzw ganz allgemein,
ob es dazu auffälligen weiteren E-Mail-Verkehr gegeben hat. Das Analysemodell liefert auf beide
Fragen die sofortige Antwort.
Zum Verständnis: Die jetzt gefilterte Datenmenge wird statistisch in Echtzeit mit der gesamten
restlichen Datenmenge (Big Data-Analytik) verglichen. Daraus ergeben sich „auffällige“ weitere
Kommunikationspfade, Personen, Firmen, Kontonummern, was auch immer das Analysemodell
ermöglicht.
Abb 3 zeigt eine von vielen möglichen Auswertungen in einer durch eine semantische Suche gefilterten
Dokumentenmenge. Die Grafik zeigt „auffällige“ (rot) Absender von E-Mails auf der Zeitachse und ermög-
licht unmittelbar eine weitere Selektion (Klick auf einzelne Balken), um bei Bedarf einen Review oder eine
tiefergehende Analyse der „dahinterliegenden“ Dokumente durchzuführen. Weitere Darstellungen erlau-
ben Trend- und Netzwerkanalysen bzw eine Verwendung der Daten in frei wählbaren Visualisierungs-
oder speziellen Analysetools.
Der zuvor erstellte Strukturpunkt in den Kommunikationspfaden „Person A mit B“ zeigt in den
jetzt gefilterten 2.500 Dokumenten rund 300 relevante Dokumente an. Diese können quergelesen,
relevante Inhalte exportiert oder fĂĽr die weitere Bearbeitung geflaggt werden.
Unser Beispielsfall sei nach rund 10 Stunden Recherchearbeit abgeschossen. Dabei wurde die
Bearbeitung aller Fragestellungen (Such-, Auswertungs- und Ergebnisprotokolle) nachvollziehbar
back to the
book Austrian Law Journal, Volume 1/2016"
Austrian Law Journal
Volume 1/2016
- Title
- Austrian Law Journal
- Volume
- 1/2016
- Author
- Karl-Franzens-Universität Graz
- Editor
- Brigitta Lurger
- Elisabeth Staudegger
- Stefan Storr
- Location
- Graz
- Date
- 2016
- Language
- German
- License
- CC BY 4.0
- Size
- 19.1 x 27.5 cm
- Pages
- 110
- Keywords
- Recht, Gesetz, Rechtswissenschaft, Jurisprudenz
- Categories
- Zeitschriften Austrian Law Journal