Volltext-Downloads (blau) und Frontdoor-Views (grau)

Hashing-basierte Indizierung: Anwendungsszenarien, Theorie und Methoden

  • Hashing-basierte Indizierung ist eine mächtige Technologie für die Ähnlichkeitssuche in großen Dokumentkollektionen [Stein 2005]. Sie basiert auf der Idee, Hashkollisionen als Ähnlichkeitsindikator aufzufassen – vorausgesetzt, dass eine entsprechend konstruierte Hashfunktion vorliegt. In diesem Papier wird erörtert, unter welchen Voraussetzungen grundlegende Retrieval- Aufgaben von dieser neuen Technologie profitieren können. Weiterhin werden zwei aktuelle, hashing-basierte Indizierungsansätze präsentiert und die mit ihnen erzielbaren Verbesserungen bei der Lösung realer Retrieval-Aufgaben verglichen. Eine Analyse dieser Art ist neu; sie zeigt das enorme Potenzial maßgeschneiderter hashing-basierter Indizierungsmethoden wie zum Beispiel dem Fuzzy- Fingerprinting.

Download full text files

Export metadata

Additional Services

Share in Twitter    Search Google Scholar    frontdoor_oas
Metadaten
Author:Benno Stein, Martin Potthast
URN:https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-672
Document Type:Conference Proceeding
Language:German
Date of Publication (online):2011/05/06
Contributing Corporation:Fakultät Medien, Mediensysteme Bauhaus-Universität Weimar
Release Date:2011/05/06
Source:Workshop Information Retrieval 2006 of the Special Interest Group Information Retrieval
PPN:Link zum Katalog
Contributor:Althoff, Klaus-Dieter
Institutes:Fachbereich IV / Informatik
DDC classes:000 Allgemeines, Informatik, Informationswissenschaft / 000 Allgemeines, Wissenschaft / 004 Informatik
Access Rights:Frei zugänglich