Refine
Year of publication
Document Type
- Conference Proceeding (73)
- Master's Thesis (33)
- Doctoral Thesis (9)
- Article (1)
- Book (1)
- Habilitation (1)
Has Fulltext
- yes (118)
Is part of the Bibliography
- no (118)
Keywords
- Computerlinguistik (29)
- Informationssysteme (29)
- Korpus <Linguistik> (14)
- NER (13)
- Named entity recognition (13)
- corpus linguistics (13)
- Computerunterstützte Kommunikation (9)
- Information Retrieval (8)
- Opinion Mining (7)
- Sentiment Analyse (7)
Institute
- Informationswissenschaft und Sprachtechnologie (118) (remove)
We report on the two systems we built for Task 1 of the German Sentiment Analysis Shared Task, the task on Source, Subjective Expression and Target Extraction from Political Speeches (STEPS). The first system is a rule-based system relying on a predicate lexicon specifying extraction rules for verbs, nouns and adjectives, while the second is a translation-based system that has been obtained with the help of the (English) MPQA corpus.
Opinion holder extraction is one of the most important tasks in sentiment analysis. We will briefly outline the importance of predicates for this task and categorize them according to part of speech and according to which semantic role they select for the opinion holder. For many languages there do not exist semantic resources from which such predicates can be easily extracted. Therefore, we present alternative corpus-based methods to gain such predicates automatically, including the usage of prototypical opinion holders, i.e. common nouns, denoting for example experts or analysts, which describe particular groups of people whose profession or occupation is to form and express opinions towards specific items.
Der Vortrag „Erfolgsfaktoren mobiler Anwendungen für klein- und mittelständische Unternehmen“ befasst sich mit der quantitativen Untersuchung von Erfolgsfaktoren für die Entwicklung von Apps oder mobiler Websites. In zuvor durchgeführten Experteninterviews wurden 45 Erfolgsfaktoren analysiert. Diese wurden unter Zuhilfenahme einer Online-Umfrage von Experten bewertet. Mit den Ergebnissen konnten nach Relevanz sortierte Rangfolgen der Erfolgsfaktoren erstellt werden.
Wie nutzen Vereine der 1. Fußball-Bundesliga das Potential von Twitter für die Marken- und Fan-Kommunikation? Während der Fußballsaison 2011/12 wurden für die Untersuchung einerseits Follower-Zahlen erhoben und andererseits Tweets von Bundesligaclubs gesammelt. Das so entstandene Tweet-Korpus ermöglicht bereits mit der Hilfe von Standard-Metriken einen Überblick über die Nutzungsstrategien. Einzelne Vereine werden als Fallstudien detaillierter betrachtet.
Im Rahmen der vorliegenden Magisterarbeit wird ein Bewertungsbogen zur Ermittlung der Handlungskompetenz von Piloten in Zusammenarbeit mit Flugtrainingsexperten der Deutschen Lufthansa AG entwickelt. Die Bewertungen erfolgen in Simulatortests, die vom Luftfahrtbundesamt vorgeschrieben sind und dem Erhalt der Flugzeugmusterberechtigung der Piloten dienen. Zunächst erfolgt die Analyse von Konstrukten und Methoden, die als Kriterien einer Messung zugänglich gemacht werden sollen. Das Ziel der Studie ist es, anhand dieser Konstrukte und Methoden in einer statistischen Analyse der erhobenen Daten Aussagen über das Ausmaß Konstruktvalidität des entwickelten Bewertungsbogens zu formulieren. In diesem Zusammenhang ist zu prüfen, ob die Bewertungen der Fähigkeiten in den klassifizierten Situationen im Flugsimulator generalisierbar sind, oder, ob diese von der spezifischen Situation abhängen.
Im Rahmen des vorligenden Artikels wird ein Bewertungsbogen zur Ermittlung der Handlungskompetenz von Piloten in Zusammenarbeit mit Flugtrainingsexperten der Deutschen Lufthansa AG entwickelt. Die Bewertungen erfolgen in Simulatortests, die vom Luftfahrtbundesamt vorgeschrieben sind und dem Erhalt der Flugzeugmusterberechtigung der Piloten dienen. Zunächst erfolgt die Analyse von Konstrukten und Methoden, die als Kriterien einer Messung zugänglich gemacht werden sollen. Das Ziel der Studie ist es, anhand dieser Konstrukte und Methoden in einer statistischen Analyse der erhobenen Daten Aussagen über das Ausmaß Konstruktvalidität des entwickelten Bewertungsbogens zu formulieren. In diesem Zusammenhang ist zu prüfen, ob die Bewertungen der Fähigkeiten in den klassifizierten Situationen im Flugsimulator generalisierbar sind, oder, ob diese von der spezifischen Situation abhängen.
Gegenstand der vorliegenden Magisterarbeit ist der Knowledge Engineering Prozess bei der Entwicklung eines Wissensbasierten Systems. Es werden dazu zunächst grundlegende Begriffe definiert und Ablaufmodelle vorgestellt. Einen Schwerpunkt der Arbeit bildet die Wissensakquisition als Hauptteil des Knowledge Engineering. Der konkrete Ablauf des Prozesses wird am Beispiel der Entwicklung eines Konfigurationssystems für die Blaupunkt GmbH dargestellt. Eingesetzte Methoden zur Wissenserhebung, Wissensanalyse-Ergebnisse sowie Formalismen zur Wissensrepräsentation im Konfigurationssystem werden detailliert am Projekt aufgezeigt. Besonders wird dabei auf Schwierigkeiten im Umgang mit Wissensquellen, den hohen Stellenwert der Wissensanalyse sowie Einsatzmöglichkeiten von deklarativen und prozeduralen Repräsentationsmethoden eingegangen.
In this paper, we present our Named Entity Recognition (NER) system for German – NERU (Named Entity Rules), which heavily relies on handcrafted rules as well as information gained from a cascade of existing external NER tools. The system combines large gazetteer lists, information obtained by comparison of different automatic translations and POS taggers. With NERU, we were able to achieve a score of 73.26% on the development set provided by the GermEval 2014 Named Entity Recognition Shared Task for German.
This paper presents a Named Entity Recognition system for German based on Conditional Random Fields. The model also includes language-independant features and features computed form large coverage lexical resources. Along side the results themselves, we show that by adding linguistic resources to a probabilistic model, the results improve significantly.
The dependency of word similarity in vector space models on the frequency of words has been noted in a few studies, but has received very little attention. We study the influence of word frequency in a set of 10 000 randomly selected word pairs for a number of different combinations of feature weighting schemes and similarity measures. We find that the similarity of word pairs for all methods, except for the one using singular value decomposition to reduce the dimensionality of the feature space, is determined to a large extent by the frequency of the words. In a binary classification task of pairs of synonyms and unrelated words we find that for all similarity measures the results can be improved when we correct for the frequency bias.