Page - 74 - in Austrian Law Journal, Volume 1/2016
Image of the Page - 74 -
Text of the Page - 74 -
ALJ 1/2016 Semantische Analyse unstrukturierter Daten 74
der Daten!) oft zweckmäßig und bildet eine gute Basis für die Arbeitsaufteilung innerhalb eines
größeren Untersuchungsteams.
Auf Basis des Fragenkatalogs wird überprüft, ob die im Standardmodell vorhandene Facetten-
struktur ausreicht oder ob es weitere fallspezifische Anforderungen für semantische Analysen
gibt. Falls erforderlich werden diese als Teil des Servicepaketes von ICI zusätzlich fallbezogen
implementiert. Ein praktisches Beispiel war die zusätzliche Annotation aller ISIN (Identifikation für
ein Wertpapier) im Fall eines Kapitalanlagebetruges.
Bei der Erstellung eines fallbezogenen Analysemodells können, wie auch oft bei manuellen Reviews,
Stichwortsuchen Verwendung finden. Die semantische Umsetzung mit ICI liefert dabei im Ver-
gleich zu Volltextsuchen messbar6 höherwertige Ergebnisse. Ein weiterer wesentlicher Vorteil bei
der Umsetzung von Stichwortsuchen mit ICI gegenüber Systemen mit Volltextsuche ist die Mög-
lichkeit der zusätzlichen Differenzierung der Stichwortbegriffe. Bei der Modellierung von Stich-
wortlisten mit einem semantischen Analysemodell können Begriffe speziell annotiert werden,
wenn diese in einem relevanten Zusammenhang zu einer bestimmten Sache, einer bestimmen
Person oder einer definierten Handlung stehen.
In unserem Beispiel mit den vermuteten Unregelmäßigkeiten bei der Auftragserteilung nehmen
wir, frei erfunden, die Firma bzw den Begriff „HAL“ in die Stichwortliste auf. HAL ist eine inter-
nationale Firma mit Niederlassungen in fast allen Ländern der Welt. Es besteht die Anforderung,
zu differenzieren und dabei Dokumente und Konversationen möglichst mit Bezug auf Niederlas-
sungen von HAL in Österreich speziell zu betrachten. Diese Inhalte sollen über einen im Analy-
semodell hinterlegten Strukturpunkt unter „HAL Österreich“ gefiltert und analytisch ausgewertet
werden können.
„HAL“ in den Textdokumenten automatisch zu finden und in einem Strukturpunkt des Facetten-
baumes unter „HAL“ abzubilden, ist ein einfacher Schritt. Selbst wenn die Firma mit Leerzeichen
(H A L) oder mit Trennzeichen (H-A-L), aber auch wenn der ausgeschriebene Firmenwortlaut im
Text steht, wird dieser Textteil als „HAL“ erkannt und annotiert. Nach der Umsetzung der neuen
Anforderung und erweiterten Parsing Rule findet der Anwender im Facettenbaum unter Firmen
nach wie vor den Eintrag HAL, aber darunter einen weiteren fallbezogenen Strukturpunkt „HAL
Österreich“. Bei jeder beliebigen weiteren Recherche über den Strukturpunkt „HAL Österreich“
werden alle Ergebnisse gezeigt und alle Begriffe markiert und ausgewertet, die „HAL Österreich“
betreffen. Beispielsweise auch „Wienerstraße 12“ wenn diese als Adresse einer österreichischen
HAL-Niederlassung mit der Parsing Rule verknüpft ist. Wir sprechen hier auch von einem Wissens-
modell, da die Parsing Rule „HAL Österreich“ über sinnvolle Informationsverknüpfungen (Excel-
sheets, Datenbanken, Wikis, Ontologien etc) um die „Intelligenz“ angereichert wird, welche Textin-
halte auf einen praktikablen Bezug zu dieser Firma hinweisen.
Synonyme (zB für „Diskont“, wie Preisminderung, Preisnachlass, Prozente, Verbilligung, Vergüns-
tigung uam) werden über Standardwörterbücher zur Verfügung gestellt oder, bei ganz speziellem
Wortgebrauch, durch zusätzliche Synonymlisten ergänzt.
6 Mit Stichproben manuell überprüfte Trefferquoten (engl „recall“), Genauigkeit (engl „precision“) und Ausfallquote
(engl „fallout“).
back to the
book Austrian Law Journal, Volume 1/2016"
Austrian Law Journal
Volume 1/2016
- Title
- Austrian Law Journal
- Volume
- 1/2016
- Author
- Karl-Franzens-Universität Graz
- Editor
- Brigitta Lurger
- Elisabeth Staudegger
- Stefan Storr
- Location
- Graz
- Date
- 2016
- Language
- German
- License
- CC BY 4.0
- Size
- 19.1 x 27.5 cm
- Pages
- 110
- Keywords
- Recht, Gesetz, Rechtswissenschaft, Jurisprudenz
- Categories
- Zeitschriften Austrian Law Journal