Volltext-Downloads (blau) und Frontdoor-Views (grau)

Bilinguale Suche mit der SENTRAX-Technologie

  • Bei der krosslingualen Suche vermindert eine ungenügende Übereinstimmung mit den Formulierungen im gesuchten Dokument oft die Leistungsfähigkeit der Suche. Hinter der SENTRAX (Essence Extractor Engine) liegen zwei Container (indexierte Dokumente), die für die bilinguale Suche zusammenwirken. Sie entstehen aus der Verarbeitung von nahe zusammenstehenden, bedeutungstragenden Begriffen (Kookkurrenzen) in den zu durchsuchenden Dokumenten und erlauben eine Definition sowie Übertragung von "Konzepten", die zwar durch Worte ausgedrückt oder beschrieben werden, aber eine gewisse Unabhängigkeit von der spezifischen Wortwahl haben. Hierbei kann die Übertragung eines Konzeptes ? statt der wortweisen Übersetzung der Anfrage ? die Mehrdeutigkeiten entscheidend vermindern, da das Konzept den assoziierten Zusammenhang mit den übersetzten Begriffe bewahrt und die Verbindung zu den Umgebungen in den Texten herstellt. Somit kann sichergestellt werden, dass die dahinter liegenden Dokumente von den gleichen bzw. ähnlichen Themen handeln. Durch grafische Darstellung sind die mit den Suchwörtern assoziierten Begriffe in Ausgangs- und Zielsprache vergleichbar.
  • A insufficient match of keywords on crosslingual search mostly reduces the capability of information retrieval. For a bilingual search with SENTRAX (Essence Extractor Engine) two containers (“indexes”) are being used, which accrue of word cooccurrences and allow a definition as well as the transmission of concepts. Hereby, the transfer of a concept can minimize the ambiguity of terms because the associated correlation of terms is preserved. Thus, it is ensured that the documents are dealing of similar topics. Due to the graphic display the associated keywords are comparable to source and target language.

Download full text files

Export metadata

Additional Services

Share in Twitter    Search Google Scholar    frontdoor_oas
Metadaten
Author:Myrja Marx, Suriya Na nhongkai
URN:https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-944
Document Type:Conference Proceeding
Language:German
Date of Publication (online):2011/05/19
Release Date:2011/05/19
GND Keyword:Informationssysteme
Source:Proceedings des Fünften Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2006)
PPN:Link zum Katalog
Contributor:Womser-Hacker, Christa
Institutes:Fachbereich III / Informationswissenschaft und Sprachtechnologie
DDC classes:000 Allgemeines, Informatik, Informationswissenschaft / 000 Allgemeines, Wissenschaft / 004 Informatik
Licence (German):License LogoDeutsches Urheberrecht