Diplomarbeit:
Weiterentwicklung von Werkzeugen zur Wissensauffindung im World- Wide-Web
Verfasser: Neussl, Dietmar
Textsprache: Deutsch
Schlagwörter:
Informatik: Sonstiges; Suchdienste, verteilte, Suchindex, auf Basis relationaler Datenbanken, HTML-Parser,
Suche, im Internet
Kurzfassung:
Das Internet stellt heute, die weltweit größte Wissens- und Informationsdatenbank dar. Das Auffinden von relevanter, seriöser und qualitativ adäquater Information wird aufgrund seiner Unstrukturiertheit, seiner Dynamik und nicht zuletzt seiner Anonymität erheblich erschwert. Aufgabe
der Suchdienste ist es, die derzeit schätzungsweise 300 Millionen Web-Seiten zu durchkämmen und dem Suchenden Verweise zu den gewünschten Themen bereitzustellen. In der vorliegenden Arbeit wird, nach einer einführenden Begriffsbestimmung und Einteilung gebräuchlicher Suchdienste, das Harvest-System als ein Vertreter des Konzepts der verteilten Suche beschrieben. Untersucht werden die HTML-Konvertierung und der Schuchindex. Dabei liegt das Hauptaugenmerk auf den Bereichen der automatischen Generierung von Schlüsselwörtern, der Keyword-Relevanz-Filterung sowie der Gewichtung von Sucheresultaten. Die Ergebnisse dieser Untersuchung führen in weiterer Folge zu Modifikationen der entsprechenden Module des Harvest- Systems. Diese Änderungen werden, ebenso wie die dadurch erzielten Verbesserungen und neu entstandenen Möglichkeiten, detailliert dokumentiert. Im Ausblick werden schließlich weiterführende Ergänzungen und Einsatzmöglichkeiten des neuen Systems erörtert. Die Verwendung als Hintergrundbibliothek und als Basis eines Information Reuse Systems wird ebenso angesprochen, wie eine mögliche Agent-Anbindung.
Betreuer: Maurer Hermann; Gütl Christian
TECHNISCHE UNIVERSITÄT GRAZ, Institut für Informationsverarbeitung und Computergestützte Neue Medien
Studienrichtung: 874 / TELEMATIK