Page - 75 - in Austrian Law Journal, Volume 1/2016
Image of the Page - 75 -
Text of the Page - 75 -
ALJ 1/2016 Jörg Fuchslueger 75
Mehrdeutige Wörter, sog „Homonyme“, werden oft als Herausforderung semantischer Analyse-
modelle diskutiert. Häufiges Beispiel ist „Golf“ mit den Bedeutungen „Auto“, „Sport“ oder „Meer-
busen“. Unsere Projekterfahrungen zeigen, dass es in einem fallspezifischen Analysemodell aus-
reichend ist, nur jene Homonyme abzubilden, die fĂĽr den konkreten Untersuchungsfall auch eine
entsprechende Relevanz haben. Wenn zB eine Person mit dem Namen „Golf“ eine Rolle spielt,
dann wird die Regel zur Annotation dieser Person die Problematik der Mehrdeutigkeiten ent-
sprechend berücksichtigen. Falls es zusätzlich auch relevant wäre, zwischen „Golf: Auto“ und
„Golf: Sport“ zu unterscheiden, werden auch dazu geeignete Parsing Rules eingestellt. Die Anzahl
relevanter Homonyme bei internen Untersuchungen und die Erstellung von Mehrdeutigkeitsre-
geln bleiben aber meist in einem sehr ĂĽberschaubaren Rahmen.
4. Benutzerdefinierte Kategorien
Zusätzliche fallbezogene Strukturpunkte, mit ICI als „Benutzerdefinierte Kategorien“ bezeichnet,
werden durch das Wissen ĂĽber die Relevanz von bestimmtem Personen, Produkten, Projekten,
Themengebieten oder Konversationspfaden (wie bestimmte Sender-Empfänger-Gruppen) definiert.
Auch spezifische Zeiträume, wie zB der Zeitraum, in der Person A Geschäftsführer der Firma B
war, oder Zeiträume für spezielle Projekte oder Angebotsfristen werden als benutzerdefinierte
Kategorien hinterlegt. Diese Art von Strukturpunkten kann vom Untersuchungsteam beliebig
definiert und eigenständig hierarchisch in der Facettennavigation einfach abgebildet werden. Die
Zuordnung von Dokumenten zu solchen Strukturpunkten erfolgt vom Anwender ĂĽber passende
Abfragen, wobei neben freier Sucheingabe die gesamte vorhandene Facettenstruktur dafĂĽr ge-
nutzt werden kann. Auch für diese Strukturpunkte werden sämtliche verfügbaren Analysen, wie
zB Häufigkeiten, Auffälligkeiten, Zeitreihen, Abweichungen, Korrelationen oder Zusammenhänge
in Echtzeit berechnet und dargestellt. In der Literatur finden wir diese Funktionalität oft unter
„virtuelle Verzeichnisse“. Das heißt, das System erlaubt eine Art Folder-Struktur anzulegen, in der
Dokumente nicht dadurch vorkommen, indem sie dort physisch gespeichert oder verknĂĽpft sind.
Dokumente scheinen in diesen „Ordnern“ auf, sobald sie einer Abfrage bzw Regeln des semanti-
schen Analysemodells entsprechen. ICI kann dabei zB einen Strukturpunkt (Folder) definieren, in
dem alle Rechnungen fĂĽr ein bestimmtes Projekt aufgelistet werden, sofern sich diese ĂĽber deren
Inhalte semantisch klassifizieren lassen. Die Möglichkeiten mit dieser Methode Ordnung in die zu
untersuchende Datenmenge zu bringen, sind dabei umfangreich und beeindruckend.
5. Auswertung der Ergebnisse
ZurĂĽck zum Beispielsfall: Es gilt immer noch herauszufinden, ob zu bestimmten Angeboten oder
Projekten im Kontext zu bestimmten Technologiekomponenten spezielle Informationen zwischen
zwei bestimmten Personen ausgetauscht wurden. Dabei spielt es keine Rolle, in welche Richtung
die Informationen geflossen sind, ob die Personen direkt adressiert oder auf Kopie gesetzt wurden
oder ob sich die Informationen im E-Mail selbst oder in einem Anhang befinden. Für diese Fälle
wird bspw in ICI mit dem verfĂĽgbaren Abfrage-Wizard eine dafĂĽr passende Abfrage erstellt und
diese einem neuen Strukturpunkt im Facettenbaum, zB unter Kommunikationspfade – „Person A
mit B“, zugeordnet.
back to the
book Austrian Law Journal, Volume 1/2016"
Austrian Law Journal
Volume 1/2016
- Title
- Austrian Law Journal
- Volume
- 1/2016
- Author
- Karl-Franzens-Universität Graz
- Editor
- Brigitta Lurger
- Elisabeth Staudegger
- Stefan Storr
- Location
- Graz
- Date
- 2016
- Language
- German
- License
- CC BY 4.0
- Size
- 19.1 x 27.5 cm
- Pages
- 110
- Keywords
- Recht, Gesetz, Rechtswissenschaft, Jurisprudenz
- Categories
- Zeitschriften Austrian Law Journal