@inproceedings{SteinPotthast2011, author = {Benno Stein and Martin Potthast}, title = {Hashing-basierte Indizierung: Anwendungsszenarien, Theorie und Methoden}, series = {LWA 2006 : Lernen – Wissensentdeckung – Adaptivit{\"a}t (9.–11.10.2006 in Hildesheim)}, url = {https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-672}, pages = {159 -- 166}, year = {2011}, abstract = {Hashing-basierte Indizierung ist eine m{\"a}chtige Technologie f{\"u}r die {\"A}hnlichkeitssuche in gro{\"s}en Dokumentkollektionen [Stein 2005]. Sie basiert auf der Idee, Hashkollisionen als {\"A}hnlichkeitsindikator aufzufassen – vorausgesetzt, dass eine entsprechend konstruierte Hashfunktion vorliegt. In diesem Papier wird er{\"o}rtert, unter welchen Voraussetzungen grundlegende Retrieval- Aufgaben von dieser neuen Technologie profitieren k{\"o}nnen. Weiterhin werden zwei aktuelle, hashing-basierte Indizierungsans{\"a}tze pr{\"a}sentiert und die mit ihnen erzielbaren Verbesserungen bei der L{\"o}sung realer Retrieval-Aufgaben verglichen. Eine Analyse dieser Art ist neu; sie zeigt das enorme Potenzial ma{\"s}geschneiderter hashing-basierter Indizierungsmethoden wie zum Beispiel dem Fuzzy- Fingerprinting.}, language = {de} }