Seite - 75 - in Austrian Law Journal, Band 1/2016
Bild der Seite - 75 -
Text der Seite - 75 -
ALJ 1/2016 Jörg Fuchslueger 75
Mehrdeutige Wörter, sog „Homonyme“, werden oft als Herausforderung semantischer Analyse-
modelle diskutiert. Häufiges Beispiel ist „Golf“ mit den Bedeutungen „Auto“, „Sport“ oder „Meer-
busen“. Unsere Projekterfahrungen zeigen, dass es in einem fallspezifischen Analysemodell aus-
reichend ist, nur jene Homonyme abzubilden, die für den konkreten Untersuchungsfall auch eine
entsprechende Relevanz haben. Wenn zB eine Person mit dem Namen „Golf“ eine Rolle spielt,
dann wird die Regel zur Annotation dieser Person die Problematik der Mehrdeutigkeiten ent-
sprechend berücksichtigen. Falls es zusätzlich auch relevant wäre, zwischen „Golf: Auto“ und
„Golf: Sport“ zu unterscheiden, werden auch dazu geeignete Parsing Rules eingestellt. Die Anzahl
relevanter Homonyme bei internen Untersuchungen und die Erstellung von Mehrdeutigkeitsre-
geln bleiben aber meist in einem sehr überschaubaren Rahmen.
4. Benutzerdefinierte Kategorien
Zusätzliche fallbezogene Strukturpunkte, mit ICI als „Benutzerdefinierte Kategorien“ bezeichnet,
werden durch das Wissen über die Relevanz von bestimmtem Personen, Produkten, Projekten,
Themengebieten oder Konversationspfaden (wie bestimmte Sender-Empfänger-Gruppen) definiert.
Auch spezifische Zeiträume, wie zB der Zeitraum, in der Person A Geschäftsführer der Firma B
war, oder Zeiträume für spezielle Projekte oder Angebotsfristen werden als benutzerdefinierte
Kategorien hinterlegt. Diese Art von Strukturpunkten kann vom Untersuchungsteam beliebig
definiert und eigenständig hierarchisch in der Facettennavigation einfach abgebildet werden. Die
Zuordnung von Dokumenten zu solchen Strukturpunkten erfolgt vom Anwender über passende
Abfragen, wobei neben freier Sucheingabe die gesamte vorhandene Facettenstruktur dafür ge-
nutzt werden kann. Auch für diese Strukturpunkte werden sämtliche verfügbaren Analysen, wie
zB Häufigkeiten, Auffälligkeiten, Zeitreihen, Abweichungen, Korrelationen oder Zusammenhänge
in Echtzeit berechnet und dargestellt. In der Literatur finden wir diese Funktionalität oft unter
„virtuelle Verzeichnisse“. Das heißt, das System erlaubt eine Art Folder-Struktur anzulegen, in der
Dokumente nicht dadurch vorkommen, indem sie dort physisch gespeichert oder verknüpft sind.
Dokumente scheinen in diesen „Ordnern“ auf, sobald sie einer Abfrage bzw Regeln des semanti-
schen Analysemodells entsprechen. ICI kann dabei zB einen Strukturpunkt (Folder) definieren, in
dem alle Rechnungen für ein bestimmtes Projekt aufgelistet werden, sofern sich diese über deren
Inhalte semantisch klassifizieren lassen. Die Möglichkeiten mit dieser Methode Ordnung in die zu
untersuchende Datenmenge zu bringen, sind dabei umfangreich und beeindruckend.
5. Auswertung der Ergebnisse
Zurück zum Beispielsfall: Es gilt immer noch herauszufinden, ob zu bestimmten Angeboten oder
Projekten im Kontext zu bestimmten Technologiekomponenten spezielle Informationen zwischen
zwei bestimmten Personen ausgetauscht wurden. Dabei spielt es keine Rolle, in welche Richtung
die Informationen geflossen sind, ob die Personen direkt adressiert oder auf Kopie gesetzt wurden
oder ob sich die Informationen im E-Mail selbst oder in einem Anhang befinden. Für diese Fälle
wird bspw in ICI mit dem verfügbaren Abfrage-Wizard eine dafür passende Abfrage erstellt und
diese einem neuen Strukturpunkt im Facettenbaum, zB unter Kommunikationspfade – „Person A
mit B“, zugeordnet.
zurück zum
Buch Austrian Law Journal, Band 1/2016"
Austrian Law Journal
Band 1/2016
- Titel
- Austrian Law Journal
- Band
- 1/2016
- Autor
- Karl-Franzens-Universität Graz
- Herausgeber
- Brigitta Lurger
- Elisabeth Staudegger
- Stefan Storr
- Ort
- Graz
- Datum
- 2016
- Sprache
- deutsch
- Lizenz
- CC BY 4.0
- Abmessungen
- 19.1 x 27.5 cm
- Seiten
- 110
- Schlagwörter
- Recht, Gesetz, Rechtswissenschaft, Jurisprudenz
- Kategorien
- Zeitschriften Austrian Law Journal