- search hit 1 of 1
Hashing-basierte Indizierung: Anwendungsszenarien, Theorie und Methoden
- Hashing-basierte Indizierung ist eine mächtige Technologie für die Ähnlichkeitssuche in großen Dokumentkollektionen [Stein 2005]. Sie basiert auf der Idee, Hashkollisionen als Ähnlichkeitsindikator aufzufassen – vorausgesetzt, dass eine entsprechend konstruierte Hashfunktion vorliegt. In diesem Papier wird erörtert, unter welchen Voraussetzungen grundlegende Retrieval- Aufgaben von dieser neuen Technologie profitieren können. Weiterhin werden zwei aktuelle, hashing-basierte Indizierungsansätze präsentiert und die mit ihnen erzielbaren Verbesserungen bei der Lösung realer Retrieval-Aufgaben verglichen. Eine Analyse dieser Art ist neu; sie zeigt das enorme Potenzial maßgeschneiderter hashing-basierter Indizierungsmethoden wie zum Beispiel dem Fuzzy- Fingerprinting.
Author: | Benno Stein, Martin Potthast |
---|---|
URN: | https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-672 |
Parent Title (German): | LWA 2006 : Lernen – Wissensentdeckung – Adaptivität (9.–11.10.2006 in Hildesheim) |
Document Type: | Conference Proceeding |
Language: | German |
Date of Publication (online): | 2011/05/06 |
Year of first Publication: | 2006 |
Contributing Corporation: | Fakultät Medien, Mediensysteme Bauhaus-Universität Weimar |
Release Date: | 2011/05/06 |
First Page: | 159 |
Last Page: | 166 |
PPN: | Link zum Katalog |
Institutes: | Fachbereich IV / Informatik |
DDC classes: | 000 Allgemeines, Informatik, Informationswissenschaft / 000 Allgemeines, Wissenschaft / 004 Informatik |
Licence (German): | ![]() |