@kw

Die Dynamik des World Wide Web und Konsequenzen für die Informationssuche

. Universita ̈t zu Lu ̈beck, Habilitationsschrift, (2008)

Abstract

Das World Wide Web ist eine hochdynamische Informationsquelle, bei der fortlaufend neue Datenobjekte erscheinen, gelo ̈scht oder modifiziert werden. In dieser Arbeit werden grundlegende Probleme behandelt, die sich aus der Dynamik des Web fu ̈r die Erfassung der Informationen und die Suche nach Informationen im Web ergeben. Im ersten Teil der Arbeit wird die Frage behandelt, wie die Informatio- nen im Web u ̈ber den Verlauf der Zeit erfasst werden ko ̈nnen. Insbesondere Datenobjekte mit einer geringen Verweilzeit stellen besondere Herausfor- derungen an Erfassungs-Algorithmen. Der Schwerpunkt im ersten Teil der Arbeit ist die Entwicklung von Verfahren, die das A ̈nderungsverhalten von Datenquellen lernen und daraus optimierte Strategien fu ̈r die Erfassung der Informationen ableiten. Der zweite Teil befasst sich mit der Suche nach relevanter Information im Web im Verlauf der Zeit, genauer gesagt nach der Suche in der Menge an Informationen, die ein Erfassungs-System kontinuierlich erfasst. Bei solchen kontinuierlichen Anfragen ist es die Aufgabe, neben einer Relevanzscha ̈tzung die Objekte mit einer hohen Relevanz mo ̈glichst fru ̈h zu liefern. Durch die Anforderung einer fru ̈hen Lieferung entsteht das Problem, dass die Relevanz von Daten nicht objektiv verglichen werden kann, dadurch dass zuku ̈nftige Relevanzwerte zu einem bestimmten Zeitpunkt noch nicht zur Verfu ̈gung stehen. Fu ̈r dieses Problem werden Algorithmen vorgestellt, die auf der Ba- sis statistischer Scha ̈tzverfahren die Relevanz von Objekten scha ̈tzen und dadurch fru ̈hzeitig hochwertige Objekte liefern ko ̈nnen. Der letzte Teil der Arbeit befasst sich mit der Archivierung von Infor- mation aus dem Web. Durch die geringen Verweilzeiten vieler Datenobjekte muss ein Nutzer Objekte, die fu ̈r ihn eine hohe Relevanz haben, persistent speichern, um langfristig darauf zugreifen zu ko ̈nnen. Es werden unterschied- liche Techniken beschrieben, solche Informationsra ̈ume zu organisieren. Die Zielsetzung dieser Arbeit ist es, eine Einfu ̈hrung in die betreffenden Aufgabenfelder zu geben, den aktuellen Stand der Forschung zu skizzieren und auf dieser Basis beispielhaft Forschungsprojekte vorzustellen.

Links and resources

Tags