Volltext-Downloads (blau) und Frontdoor-Views (grau)

Die automatische Bewertung der Qualität von Internet-Seiten im Information Retrieval

Automatic Evaluation of the Quality of Infernet-Pages in Information Retrieval

  • Die stark anwachsende Menge von Wissen, welche weltweit zur Verfügung steht, erfordert eine teilweise Übertragung der Qualitätsbewertung auf Maschinen. Zugleich erlaubt die weltweite Vernetzung die Analyse, den Vergleich und die Verknüpfung sehr vieler Wissensangebote. Die Automatisierung von Qualitätsbewertung ist teilweise bereits Realität und erfordert eine stärkere wissenschaftliche Fundierung. Derzeit eingesetzte Systeme basieren auf der Linkanalyse und nutzen somit nur eine sehr eingeschränkte Wissensquelle. Aktuelle Forschungstendenzen aus unterschiedlichen Fachrichtungen verweisen auf komplexere Systeme zur automatischen Qualitätsbewertung. Im Rahmen des Projekts AQUAINT (Automatische Qualitätsabschätzung für Internet Ressourcen) wurde ein innovatives System zur Qualitätsbewertung entwickelt. Das Projekt behandelt die Grundlagen, die Entwicklung des Systems und dessen Evaluierung. Aus den Ergebnissen werden Konsequenzen für die Methodik der Evaluierung im Information Retrieval abgeleitet. Eine wichtige Anwendung liegt in Suchmaschinen der nächsten Generation.
  • An approach for the implementation of a quality-based Web search engine is proposed. Quality retrieval is introduced and an overview on previous efforts to implement such a service is given. Machine learning approaches are identified as the most promising methods to determine the quality of Web pages. Features for the most appropriate characterization of Web pages are determined. A quality model is developed based on human judgments. This model is integrated into a meta search engine which assesses the quality of all results at run time. The evaluation results show that quality based ranking does lead to better results concerning the perceived quality of Web pages presented in the result set. The quality models are exploited to identify potentially important features and characteristics for the quality of Web pages.

Download full text files

Export metadata

Additional Services

Share in Twitter    Search Google Scholar    frontdoor_oas
Metadaten
Author:Thomas Mandl
URN:https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-1869
Advisor:Christa Womser-Hacker
Document Type:Habilitation
Language:German
Date of Publication (online):2013/06/21
Publishing Institution:Stiftung Universität Hildesheim
Granting Institution:Universität Hildesheim, Fachbereich III
Date of final exam:2006/04/19
Release Date:2013/06/21
Tag:PageRank; Qualität; Suche
PageRank; Quality; Search
GND Keyword:Information Extraction; Information Retrieval; Maschinelles Lernen
PPN:Link zum Katalog
Institutes:Fachbereich III / Informationswissenschaft und Sprachtechnologie
DDC classes:000 Allgemeines, Informatik, Informationswissenschaft / 020 Bibliotheks- und Informationswissenschaft
Licence (German):License LogoCreative Commons - Namensnennung - Weitergabe unter gleichen Bedingungen 3.0