Refine
Year of publication
Document Type
- Conference Proceeding (73)
- Master's Thesis (33)
- Doctoral Thesis (9)
- Article (1)
- Book (1)
- Habilitation (1)
Has Fulltext
- yes (118)
Is part of the Bibliography
- no (118)
Keywords
- Computerlinguistik (29)
- Informationssysteme (29)
- Korpus <Linguistik> (14)
- NER (13)
- Named entity recognition (13)
- corpus linguistics (13)
- Computerunterstützte Kommunikation (9)
- Information Retrieval (8)
- Opinion Mining (7)
- Sentiment Analyse (7)
Institute
- Informationswissenschaft und Sprachtechnologie (118) (remove)
We report on the two systems we built for Task 1 of the German Sentiment Analysis Shared Task, the task on Source, Subjective Expression and Target Extraction from Political Speeches (STEPS). The first system is a rule-based system relying on a predicate lexicon specifying extraction rules for verbs, nouns and adjectives, while the second is a translation-based system that has been obtained with the help of the (English) MPQA corpus.
Opinion holder extraction is one of the most important tasks in sentiment analysis. We will briefly outline the importance of predicates for this task and categorize them according to part of speech and according to which semantic role they select for the opinion holder. For many languages there do not exist semantic resources from which such predicates can be easily extracted. Therefore, we present alternative corpus-based methods to gain such predicates automatically, including the usage of prototypical opinion holders, i.e. common nouns, denoting for example experts or analysts, which describe particular groups of people whose profession or occupation is to form and express opinions towards specific items.
Der Vortrag „Erfolgsfaktoren mobiler Anwendungen für klein- und mittelständische Unternehmen“ befasst sich mit der quantitativen Untersuchung von Erfolgsfaktoren für die Entwicklung von Apps oder mobiler Websites. In zuvor durchgeführten Experteninterviews wurden 45 Erfolgsfaktoren analysiert. Diese wurden unter Zuhilfenahme einer Online-Umfrage von Experten bewertet. Mit den Ergebnissen konnten nach Relevanz sortierte Rangfolgen der Erfolgsfaktoren erstellt werden.
Wie nutzen Vereine der 1. Fußball-Bundesliga das Potential von Twitter für die Marken- und Fan-Kommunikation? Während der Fußballsaison 2011/12 wurden für die Untersuchung einerseits Follower-Zahlen erhoben und andererseits Tweets von Bundesligaclubs gesammelt. Das so entstandene Tweet-Korpus ermöglicht bereits mit der Hilfe von Standard-Metriken einen Überblick über die Nutzungsstrategien. Einzelne Vereine werden als Fallstudien detaillierter betrachtet.
Im Rahmen der vorliegenden Magisterarbeit wird ein Bewertungsbogen zur Ermittlung der Handlungskompetenz von Piloten in Zusammenarbeit mit Flugtrainingsexperten der Deutschen Lufthansa AG entwickelt. Die Bewertungen erfolgen in Simulatortests, die vom Luftfahrtbundesamt vorgeschrieben sind und dem Erhalt der Flugzeugmusterberechtigung der Piloten dienen. Zunächst erfolgt die Analyse von Konstrukten und Methoden, die als Kriterien einer Messung zugänglich gemacht werden sollen. Das Ziel der Studie ist es, anhand dieser Konstrukte und Methoden in einer statistischen Analyse der erhobenen Daten Aussagen über das Ausmaß Konstruktvalidität des entwickelten Bewertungsbogens zu formulieren. In diesem Zusammenhang ist zu prüfen, ob die Bewertungen der Fähigkeiten in den klassifizierten Situationen im Flugsimulator generalisierbar sind, oder, ob diese von der spezifischen Situation abhängen.
Im Rahmen des vorligenden Artikels wird ein Bewertungsbogen zur Ermittlung der Handlungskompetenz von Piloten in Zusammenarbeit mit Flugtrainingsexperten der Deutschen Lufthansa AG entwickelt. Die Bewertungen erfolgen in Simulatortests, die vom Luftfahrtbundesamt vorgeschrieben sind und dem Erhalt der Flugzeugmusterberechtigung der Piloten dienen. Zunächst erfolgt die Analyse von Konstrukten und Methoden, die als Kriterien einer Messung zugänglich gemacht werden sollen. Das Ziel der Studie ist es, anhand dieser Konstrukte und Methoden in einer statistischen Analyse der erhobenen Daten Aussagen über das Ausmaß Konstruktvalidität des entwickelten Bewertungsbogens zu formulieren. In diesem Zusammenhang ist zu prüfen, ob die Bewertungen der Fähigkeiten in den klassifizierten Situationen im Flugsimulator generalisierbar sind, oder, ob diese von der spezifischen Situation abhängen.
Gegenstand der vorliegenden Magisterarbeit ist der Knowledge Engineering Prozess bei der Entwicklung eines Wissensbasierten Systems. Es werden dazu zunächst grundlegende Begriffe definiert und Ablaufmodelle vorgestellt. Einen Schwerpunkt der Arbeit bildet die Wissensakquisition als Hauptteil des Knowledge Engineering. Der konkrete Ablauf des Prozesses wird am Beispiel der Entwicklung eines Konfigurationssystems für die Blaupunkt GmbH dargestellt. Eingesetzte Methoden zur Wissenserhebung, Wissensanalyse-Ergebnisse sowie Formalismen zur Wissensrepräsentation im Konfigurationssystem werden detailliert am Projekt aufgezeigt. Besonders wird dabei auf Schwierigkeiten im Umgang mit Wissensquellen, den hohen Stellenwert der Wissensanalyse sowie Einsatzmöglichkeiten von deklarativen und prozeduralen Repräsentationsmethoden eingegangen.
In this paper, we present our Named Entity Recognition (NER) system for German – NERU (Named Entity Rules), which heavily relies on handcrafted rules as well as information gained from a cascade of existing external NER tools. The system combines large gazetteer lists, information obtained by comparison of different automatic translations and POS taggers. With NERU, we were able to achieve a score of 73.26% on the development set provided by the GermEval 2014 Named Entity Recognition Shared Task for German.
This paper presents a Named Entity Recognition system for German based on Conditional Random Fields. The model also includes language-independant features and features computed form large coverage lexical resources. Along side the results themselves, we show that by adding linguistic resources to a probabilistic model, the results improve significantly.
The dependency of word similarity in vector space models on the frequency of words has been noted in a few studies, but has received very little attention. We study the influence of word frequency in a set of 10 000 randomly selected word pairs for a number of different combinations of feature weighting schemes and similarity measures. We find that the similarity of word pairs for all methods, except for the one using singular value decomposition to reduce the dimensionality of the feature space, is determined to a large extent by the frequency of the words. In a binary classification task of pairs of synonyms and unrelated words we find that for all similarity measures the results can be improved when we correct for the frequency bias.
Die Arbeit stellt eine Studie mit ägyptischen und deutschen Interviewpartnern vor, deren Durchführung auf der Annahme basiert, dass Klischees und Vorurteile zwischen den beiden Kulturen den interkulturellen Dialog gefährden. Die Darstellung der klischeebehafteten kulturellen Aspekte soll das Verständnis für den jeweils anderen Kulturkreis erleichtern.
Die vorliegende Magisterarbeit befasst sich mit der Evaluation des multimedialen Lernsystems SELiM, das am Institut für Angewandte Sprachwissenschaft der Universität Hildesheim entwickelt wurde und einen Bestandteil seiner informationswissenschaftlichen Lehre darstellt. Der Schwerpunkt der Evaluation liegt auf der Benutzbarkeit des Systems. Diese kann nur bestimmt werden, wenn sie auf die Zielgruppe, deren Arbeit mit SELiM und die Nutzungsumstände bezogen wird. Deshalb erfolgt vor der Evaluation eine umfassende Analyse dieser Aspekte. Anhand der gewonnenen Erkenntnisse wird die Evaluation geplant und durchgeführt. Aus ihren Ergebnissen werden Maßnahmen für eine umfassende Optimierung SELiMs hergeleitet. Schließlich werden erste von ihnen umgesetzt. Zur Bildung der theoretischen Grundlagen werden im Vorfeld die Arbeitsfelder E-Learning, Softwareergonomie und Usability-Testing untersucht und es wird ein Qualitätsbegriff definiert. Bei der Entwicklung SELiMs wird iterativ nach dem Prinzip des Rapid Prototypings vorgegangen. Diese Arbeit gliedert sich in diesen Prozess ein.
This paper presents a hybrid pronoun resolution system for German. It uses a simple rule-driven entity-mention formalism to incrementally process discourse entities. Antecedent selection is performed based on Markov Logic Networks (MLNs). The hybrid architecture yields a cheap problem formulation in the MLNs w.r.t. inference complexity but pertains their expressiveness. We compare the system to a rule-driven baseline and an extension which uses a memory-based learner. We find that the MLN hybrid outperforms its competitors by large margins.
Ironic speech act detection is indispensable for automatic opinion mining. This paper presents a pattern-based approach for the detection of ironic speech acts in German Web comments. The approach is based on a multilevel annotation model. Based on a gold standard corpus with labeled ironic sentences, multilevel patterns are deter- mined according to statistical and linguis- tic analysis. The extracted patterns serve to detect ironic speech acts in a Web com- ment test corpus. Automatic detection and inter-annotator results achieved by human annotators show that the detection of ironic sentences is a challenging task. However, we show that it is possible to automatically detect ironic sentences with relatively high precision up to 63%.
Durch das Internet ist es möglich, Daten und Wissen über große Distanzen zu tauschen. Seit mehreren Jahren existieren Datenbanken und Diskussionsforen für den Wissenstausch. Ein neuer Ansatz sind Wissensmarktplätze, auf denen Wissen über das Internet gehandelt wird. In dieser Magisterarbeit werden eine Definition und die Besonderheiten von Wissen als Handelsgut erarbeitet und die wichtigsten Faktoren eines Internetmarktplatzes dargestellt. Anhand dieser theoretischen Vorüberlegungen, werden Erfolgsfaktoren für einen Wissensmarktplatz erstellt. In einem Benchmark werden sieben bestehende Wissensmarktplätze auf die Implementierung dieser Erfolgsfaktoren hin untersucht. Im Rahmen des Benchmark werden die Stärken und Schwächen der Marktplätze aufgezeigt und Rückschlüsse auf die zukünftige Entwicklung von Wissensmarktplätzen gezogen.
Gegenstand der vorliegenden Magisterarbeit ist die Entwicklung eines Lernmoduls zur Vermittlung von Grundlagen multimedialer Systeme, wobei der im Zusammenhang mit multimedialem Lernen wichtige Aspekt der Interaktivität bei der Konzeption besondere Beachtung findet. Dazu werden die grundlegenden Aspekte multimedialen Lernen betrachtet, wobei eine ausführlichere Charakterisierung des Merkmal Interaktivität inklusive verschiedene Abstufungsmodelle erfolgt. Nach einer Analyse des Nutzungskontexts und der inhaltlichen Konzipierung werden zwei prototypische Varianten des Lernmoduls erstellt, die sich im Grad ihrer Interaktivität unterscheiden. Eine vergleichende Evaluation liefert die Entscheidungsgrundlage für eine der beiden Varianten, die durch ein abschließendes Re-Design zum finalen Lernmodul optimiert und somit für den Einsatz in einer Einführungsveranstaltung der Universität Hildesheim vorbereitet wird.
MoSTNER is a German NER system based on machine learning with log-linear models and morphology-aware features. We use morphological analysis with Morphisto for generating features, moreover we use German Wikipedia as a gazetteer and perform punctuation-aware and morphology-aware page title matching. We use four types of factor graphs where NER labels are single variables or split into prefix (BILOU) and type (PER, LOC, etc.) variables. Our system supports nested NER (two levels), for training we use SampleRank, for prediction Iterated Conditional Modes, the implementation is based on Python and Factorie.
Die vorliegende Magisterarbeit behandelt den Einfluss der Kultur der Internetnutzer bei der Benutzung und Bewertung von Websites. Insbesondere werden Unterschiede zwischen deutschen und taiwanesischen Nutzern untersucht. Auf Basis der relevanten Grundlagen zur interkulturellen Wirkung von Informationssystemen wurde ein Benutzertest entwickelt. Die Ergebnisse der Tests in Deutschland und Taiwan werden ausführlich vorgestellt und diskutiert.
The objective of this M.A. thesis is the development and evaluation of a system that enables the effective and efficient access to relevant knowledge objects and provides process transparency. In the beginning, fundamental terms and concepts of knowledge management and usability are introduced briefly. This theoretical foundation serves as the basis for the prototyping-oriented development of the tool. Finally, the tool is evaluated by users. Based on these insights, recommendations are made to further enhance the usability and thus the value of the system. As a result, a hypertext-based knowledge map is developed which takes its users directly to process-specific information and facilitates the understanding of complex processes.