Die automatische Bewertung der Qualität von Internet-Seiten im Information Retrieval
Automatic Evaluation of the Quality of Infernet-Pages in Information Retrieval
- Die stark anwachsende Menge von Wissen, welche weltweit zur Verfügung steht, erfordert eine teilweise Übertragung der Qualitätsbewertung auf Maschinen. Zugleich erlaubt die weltweite Vernetzung die Analyse, den Vergleich und die Verknüpfung sehr vieler Wissensangebote. Die Automatisierung von Qualitätsbewertung ist teilweise bereits Realität und erfordert eine stärkere wissenschaftliche Fundierung. Derzeit eingesetzte Systeme basieren auf der Linkanalyse und nutzen somit nur eine sehr eingeschränkte Wissensquelle. Aktuelle Forschungstendenzen aus unterschiedlichen Fachrichtungen verweisen auf komplexere Systeme zur automatischen Qualitätsbewertung. Im Rahmen des Projekts AQUAINT (Automatische Qualitätsabschätzung für Internet Ressourcen) wurde ein innovatives System zur Qualitätsbewertung entwickelt. Das Projekt behandelt die Grundlagen, die Entwicklung des Systems und dessen Evaluierung. Aus den Ergebnissen werden Konsequenzen für die Methodik der Evaluierung im Information Retrieval abgeleitet. Eine wichtige Anwendung liegt in Suchmaschinen der nächsten Generation.
- An approach for the implementation of a quality-based Web search engine is proposed. Quality retrieval is introduced and an overview on previous efforts to implement such a service is given. Machine learning approaches are identified as the most promising methods to determine the quality of Web pages. Features for the most appropriate characterization of Web pages are determined. A quality model is developed based on human judgments. This model is integrated into a meta search engine which assesses the quality of all results at run time. The evaluation results show that quality based ranking does lead to better results concerning the perceived quality of Web pages presented in the result set. The quality models are exploited to identify potentially important features and characteristics for the quality of Web pages.
Author: | Thomas Mandl |
---|---|
URN: | https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-1869 |
Advisor: | Christa Womser-Hacker |
Document Type: | Habilitation |
Language: | German |
Date of Publication (online): | 2013/06/21 |
Year of first Publication: | 2006 |
Publishing Institution: | Stiftung Universität Hildesheim |
Granting Institution: | Universität Hildesheim, Fachbereich III |
Date of final exam: | 2006/04/19 |
Release Date: | 2013/06/21 |
Tag: | PageRank; Qualität; Suche PageRank; Quality; Search |
GND Keyword: | Information Extraction; Information Retrieval; Maschinelles Lernen |
Page Number: | 357 |
PPN: | Link zum Katalog |
Institutes: | Fachbereich III / Informationswissenschaft und Sprachtechnologie |
DDC classes: | 000 Allgemeines, Informatik, Informationswissenschaft / 020 Bibliotheks- und Informationswissenschaft |
Licence (German): | ![]() |