TY - CHAP U1 - Konferenzveröffentlichung A1 - Stein, Benno A1 - Potthast, Martin T1 - Hashing-basierte Indizierung: Anwendungsszenarien, Theorie und Methoden T2 - LWA 2006 : Lernen – Wissensentdeckung – Adaptivität (9.–11.10.2006 in Hildesheim) N2 - Hashing-basierte Indizierung ist eine mächtige Technologie für die Ähnlichkeitssuche in großen Dokumentkollektionen [Stein 2005]. Sie basiert auf der Idee, Hashkollisionen als Ähnlichkeitsindikator aufzufassen – vorausgesetzt, dass eine entsprechend konstruierte Hashfunktion vorliegt. In diesem Papier wird erörtert, unter welchen Voraussetzungen grundlegende Retrieval- Aufgaben von dieser neuen Technologie profitieren können. Weiterhin werden zwei aktuelle, hashing-basierte Indizierungsansätze präsentiert und die mit ihnen erzielbaren Verbesserungen bei der Lösung realer Retrieval-Aufgaben verglichen. Eine Analyse dieser Art ist neu; sie zeigt das enorme Potenzial maßgeschneiderter hashing-basierter Indizierungsmethoden wie zum Beispiel dem Fuzzy- Fingerprinting. Y1 - 2006 U6 - https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-672 UN - https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-672 SP - 159 EP - 166 ER -