Volltext-Downloads (blau) und Frontdoor-Views (grau)

Entwicklung eines Werkzeugs zur Sprachidentifikation in mono- und multilingualen Texten

  • Identifikation der Sprache bzw. Sprachen elektronischer Textdokumente ist einer der wichtigsten Schritte in vielen Prozessen maschineller Textverarbeitung. Die vorliegende Arbeit stellt LangIdent, ein System zur Sprachidentifikation von mono- und multilingualen elektronischen Textdokumenten vor. Das System bietet sowohl eine Auswahl von gängigen Algorithmen für die Sprachidentifikation monolingualer Textdokumente als auch einen neuen Algorithmus für die Sprachidentifikation multilingualer Textdokumente.
  • Identification of the language or languages of a document is one of the most important steps in the automatic text processing. This work presents a novel system, called LangIdent, which provides the language identification for monoand multilingual documents. The system includes both well known algorithms for the language identification for monolingual documents and a new developed algorithm identifying the languages of multilingual documents.

Download full text files

Export metadata

Additional Services

Share in Twitter    Search Google Scholar    frontdoor_oas
Metadaten
Author:Olga Artemenko, Margaryta Shramko
URN:https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-1084
Document Type:Master's Thesis
Language:German
Date of Publication (online):2011/05/20
Publishing Institution:Stiftung Universität Hildesheim
Release Date:2011/05/20
GND Keyword:Informationssysteme
PPN:Link zum Katalog
Institutes:Fachbereich III / Informationswissenschaft und Sprachtechnologie
DDC classes:000 Allgemeines, Informatik, Informationswissenschaft / 000 Allgemeines, Wissenschaft / 004 Informatik
Licence (German):License LogoDeutsches Urheberrecht