Volltextsuche in grossen Hypermediasystemen

Verfasser: Faschingbauer, Hansjoerg / Hansjoerg Faschingbauer
Sachtitel: Volltextsuche in grossen Hypermediasystemen
Impressum: 83 Bl. : graph. Darst. 4^ ; Graz, Techn. Univ., Inst. f. Informationsverarbeitung und Computergestuetzte Neue Medien, Diplomarbeit,1993
Standort: Hauptbibliothek - Magazin
Signatur: II 123.706

Abstract
Die Volltextsuche ist eine Form der indizierten Suche, bei der alle Worte eines Dokuments als Indexbegriffe dienen. Worten werden bei der Indizierung eines Dokuments Gewichte vergeben, die ihrer Bedeutung im Dokument entsprechen. Ein Modell der gewichteten booleschen Suche wird vorgestellt, bei der eine Reihung der gefundenen Dokumente aufgrund der Wortgewichte errechnet wird. Das Vektormodell wird vorgestellt, die Sichtweise einer Sammlung von Dokumenten als Vektorraum, der von den verschiedenen Worten der Sammlung aufgespannt wird und dessen Elemente die Dokumente sind. Ein Aehnlichkeitsmass zweier Dokumente im Vektorraum wird definiert; aufbauend auf diesem wird die (bereits vorhandene) Theorie zur Zusammenfassung von aehnlichen Dokumenten zu sogenannten Clustern erklaert. Verschiedene Aspekte einer "Indexsprache" zur Filterung von ueberfluessigen Worten, zur Zusammenfassung von aehnlichen Worten zu Thesaurusklassen u.dgl. werden behandelt. Eine Indexstruktur, die beide Modelle abdeckt, wird beschrieben. Zuletzt wird die Implementation der booleschen Suche und der Suche im Dokumentraum in Verbindung mit Hyper-G, dem Hypermediasystem, das gegenwaertig am IICM entwickelt, dokumentiert.

Betreuer
Maurer H./Kappe F.

Institut für Informationsverarbeitung und Computergestützte neue Medien