020 Bibliotheks- und Informationswissenschaft
Refine
Year of publication
Document Type
- Master's Thesis (10)
- Doctoral Thesis (9)
- Conference Proceeding (7)
- Book (1)
- Habilitation (1)
- Report (1)
Keywords
- Informationssysteme (8)
- Information Retrieval (5)
- Evaluation (2)
- Gefühl (2)
- Information Seeking (2)
- Internetdienst (2)
- Mobile Informationsnutzung (2)
- Soziale Software (2)
- Wikipedia (2)
- Affekt (1)
Institute
Adapting the Multilingual Information Retrieval System MIMOR to the Characteristics of Japanese
(2005)
This M.A. thesis describes the conception and realization of a cross-lingual information retrieval system for Japanese based on the MIMOR (“Mehrfachindexierung zur dynamischen Methoden-Objekt-Relationierung im Information Retrieval”) framework. After an analysis of the characteristics of Japanese and their implications for IR, an overview of established approaches and the state-of-the art in Japanese IR and crosslingual IR with Japanese is provided. It is followed by a description of the implemented system and its integration into the existing framework. Finally, the evaluation experiments carried out with two different document genres (newspaper articles and scientific abstracts) are reported. The main focus hereby was on the testing and analysis of different indexing strategies, in particular a yomi- or pronunciation-based index in addition to conventional word-based and n-gram-based indices, and the benefits of their fusion.
Ein genaues Verständnis des Suchprozesses und der Frage, wie Benutzer darin unterstützt werden können, bessere Suchergebnisse zu erhalten, stellt eine wichtige Aufgabe der Information-Retrieval-Forschung dar. Jedoch tragen unter anderem die dynamische Natur dieses Prozesses, die aktive Beteiligung des Nutzers am Suchverlauf sowie die Kontextabhängigkeit des Relevanzbegriffs zur Komplexität dieser Fragestellungen bei. Eine besondere Herausforderung besteht daher darin, im Kontext dieses komplexen Prozesses, die genauen Wirkungsmechanismen aller beteiligten Einflussgrößen und ihre Abhängigkeiten zu isolieren. Im Rahmen dieser Arbeit wird daher die Auswirkung zweier wesentlicher Einflussfaktoren, der Systemleistung und der Nutzererwartung, auf Benutzerleistung, Relevanzwahrnehmung und Benutzerzufriedenheit untersucht, während andere Einflussgrößen statistisch kontrolliert werden. Zu diesem Zweck werden drei aufeinander aufbauende interaktive Information-Retrieval-Nutzerstudien geplant und durchgeführt, deren Daten im Anschluss quantitativ ausgewertet werden. Bezüglich der Benutzerzufriedenheit wird dabei insbesondere untersucht, ob sich das aus der Kundenzufriedenheitsforschung bekannte C/D-Paradigma, das die Entstehung von Zufriedenheit als Soll/Ist-Vergleich zwischen wahrgenommener und erwarteter Leistung begreift, auch auf den Kontext der Informationssuche übertragen lässt.
Auf Grundlage der vorliegenden Datenbasis kann zunächst gezeigt werden, dass eine direkte Korrelation zwischen der verwendeten Systemqualität und dem Relevanzempfinden der Testteilnehmer zu bestehen scheint. Dabei ist im direkten Vergleich zweier Suchsysteme mit unterschiedlicher Systemgüte die Anwendung restriktiverer Relevanzkriterien im Kontext des besseren Systems zu beobachten. Dieses Verhalten lässt sich insbesondere anhand der in dieser Arbeit eingeführten Imprecisionmaße nachweisen, die im Wesentlichen die Tendenz der Testpersonen erfassen, mit ihrem Relevanzurteil von den dem Testkorpus zugrundeliegenden Jurorenurteilen abzuweichen. Für recallorientierte Benutzerleistungsmaße lässt sich hingegen kein signifikanter Unterschied in Abhängigkeit der Systemleistung beobachten. In Bezug auf die Benutzerzufriedenheit scheint der beschriebene systembedingte Anpassungseffekt der Relevanzwahrnehmung zu einer Reduzierung des perzipierten Systemleistungsunterschieds zu führen, wodurch auch die Benutzerzufriedenheit nur eine schwache Abhängigkeit von der Systemleistung zeigt. Für die im Rahmen der interaktiven Information-Retrieval-Forschung bislang wenig beachteten Nutzererwartungen lässt sich hingegen ein qualitativ anderes Verhalten feststellen. Hier führt eine positive Grundeinstellung bezüglich des verwendeten Suchsystems zur Anwendung weniger restriktiver Relevanzkriterien, was sich schlussendlich in einer signifikant erhöhten Nutzerzufriedenheit im Vergleich zu Testpersonen mit einer niedrigen Erwartungshaltung widerspiegelt. Darüber hinaus ergeben sich für ausgewählte Leistungsmaße und Zufriedenheitsdimensionen auch Wechselwirkungen zwischen beiden Anpassungseffekten, welche darauf hindeuten, dass der systembedingte Anpassungseffekt der Relevanzwahrnehmung vornehmlich im Kontext einer hohen Erwartungshaltung zum Tragen kommt, weswegen im Umkehrschluss ein Einfluss der Systemgüte auf die Benutzerzufriedenheit hauptsächlich bei Probanden mit niedriger Erwartungshaltung zu beobachten ist. In diesem Sinne können also die Vorhersagen des C/D-Paradigmas, bei denen eine hohe Zufriedenheit mit dem Übertreffen der eigenen Erwartungen assoziiert ist, nicht bestätigt werden. Vielmehr scheint die aktive Beteiligung der Nutzer am Suchprozess zur Ausbildung anderer Wirkungsmechanismen zu führen, bei denen die Entstehung von Nutzerzufriedenheit stärker an eine positive Einstellung zum verwendeten Suchsystem gekoppelt ist.
Diese Arbeit untersucht kollaboratives Informationssuchverhalten (Collaborative Information Seeking, kurz: CIS) im Kontext der verteilten, aufgabenbasierten Zusammenarbeit unter Berücksichtigung von rollenspezifisch relevanten Aspekten der Diversität der Beteiligten. Übergeordnetes Ziel ist dabei die Entwicklung von Gestaltungsrichtlinien zur Systemunterstützung kollaborativer Suche in verteilten Szenarien. Da das Forschungsgebiet CIS noch jung und in wesentlichen Grundlagen wenig erforscht ist, erfordert das Erreichen dieser Zielsetzung zunächst fundamentale wissenschaftliche Auseinandersetzungen.
Anhand von vier aufeinander aufbauenden Fragestellungen wird sich diesem Problemzusammenhang gewidmet. Aufsetzend auf die Erörterung von Organisation und Gestaltung des CISProzesses (RQ1) erfolgt in diesem Zusammenhang die Analyse des Verhaltens der Beteiligten, in Hinblick auf deren Diversität im Kontext eingenommener Rollen (RQ2). In einem nächsten Schritt wird die integrierte Modellierung von CIS-Prozess und Rollenmustern vorgenommen und in Zusammenhang mit kontextspezifischen Beobachtungen gesetzt (RQ3). Die theoretische Modellierung resultiert schließlich in der Ableitung von Gestaltungsrichtlinien zur systembasierten Unterstützung der kollaborativen Suche (RQ4).
Die Beantwortung der Forschungsfragen erfolgt mithilfe von zwei Feldstudien, welche das Informationssuchverhalten von Kleingruppen Studierender adressieren. In einem Bachelor-Kurs des Studiengangs Internationales Informationsmanagement (IIM) wird zunächst eine Vorstudie mit sechs Gruppen (n=19) im Umfang von drei bis vier Mitgliedern durchgeführt. In einem Zeitraum von zwei Wochen bearbeiten die Beteiligten eine geteilte, komplexe Aufgabenstellung und absolvieren in diesem Rahmen gemeinsame Suchen. Zur Erfassung des Suchverhaltens wird die Interaktion der Nutzenden in einem System für CIS-Unterstützung aufgezeichnet. Im Anschluss daran wird unter Verwendung eines Fragebogens u.a. das Rollenmuster der Beteiligten erfasst. Da im Zusammenhang mit CIS bisher keine Entwicklung von Rollen stattfand, welche spezifisch das Verhalten im Kontext der Zusammenarbeit adressieren, wird hierfür ein standardisiertes Instrument zur Erfassung von Teamrollen herangezogen. Das methodische Vorgehen umfasst weiterhin das Durchführen von leitfadengestützten Interviews, welche die absolvierte Suche und Zusammenarbeit der Gruppen fokussieren. Ferner ist eine Tagesbuchstudie, in Hinblick auf das Erheben von individuellen Eindrücken der Zusammenarbeit, eingebunden. Orientiert am Vorgehen in dieser Untersuchung erfolgt darauf aufsetzend die Hauptstudie im Master-Kurs Informationsethik des Studiengangs IIM. In sechs Gruppen mit zwei bis drei Mitgliedern (n=15) bearbeiten die Studierenden komplexe informationsethische Fragestellungen mit dem Ziel, deren Beantwortung im Plenum zu präsentieren.
Die Beobachtung der kollaborativen Suche zeigt in beiden Untersuchungen sowohl gruppenbasierte, als auch individuelle Schritte bei der Durchführung auf. Nach der Grundlagenrecherche erarbeiten die Gruppen einen gemeinsamen Wissensstand, nehmen daraufhin eine Teilung der Aufgabe vor und führen anschließend individuelle Suchen zum jeweiligen Unterthema durch. Im Anschluss wird die aufgefundene Information zusammengeführt, i.d.R. einer gemeinsamen Prüfung unterzogen und schließlich in Hinblick auf die Aufgabenstellung aufbereitet. Darüber hinaus können mögliche Rückschritte im Prozess stattfinden. Eine Gruppe weicht von diesem Verhalten insofern ab, als dass diese keine Aufgabenteilung vornimmt. Aus der Beobachtung der Interaktion der Teilnehmenden mit dem Suchsystem, den erhobenen Teamrollen und ergänzenden Interviewdaten resultiert die Entwicklung von Rollen für die kollaborative Suche. Die Suchrollen Pathnder, Compiler, Implementer, Facilitator und Observer-Editor nehmen unterschiedliche Aufgaben und Funktionen bei der kollaborativen Suche wahr und weisen spezifisch erhöhte oder verminderte Beteiligungen an Schritten oder Phasen des Prozesses auf. Das Modell bezieht neben diesen Befunden zu den Suchrollen auch den erhobenen Suchprozess ein und darüber hinaus Ein üsse ermittelter relevanter Kontext- und Wahrnehmungsfaktoren. Die Untersuchung zeigt, dass je nach durchzuführender Tätigkeit innerhalb der Prozessschritte, unterschiedlicher erhöhter Bedarf für Wahrnehmungsinformation (Increased Awareness Need, kurz: IAN) vorhanden ist. Dieser umfasst die Wahrnehmung der Gruppe (Group-Awareness) oder des geteilten Arbeitsraums (Workspace-Awareness), um die verteilte kollaborative Suche und Zusammenarbeit eektiv und ezient durchführen zu können. Die aus dem Modell abgeleiteten Gestaltungsrichtlinien berücksichtigen u.a. diese IAN für Unterstützungsmaßnahmen, die entwickelten Suchrollen und die Einbindung von Werkzeugen zur Durchführung von Suche und Zusammenarbeit.
Die Ergebnisse dieser Arbeit können somit dazu beitragen, Systeme für aufgabenbasiertes CIS zu gestalten, welche die Effektivität und Effizienz bei der Kollaboration befördern und die Zufriedenheit bei der Nutzung und somit auch die Akzeptanz, zu erhöhen. Darüber hinausgehend zeigen die Befunde Möglichkeiten für anschließende Forschungsarbeiten auf, etwa in Hinblick auf die konkrete Evaluation der Maßnahmen und deren Einbindung in Systeme oder für analoge Untersuchungen im Kontext anderer Domänen, Aufgabenstellungen oder Zielgruppen.
Wie nutzen Vereine der 1. Fußball-Bundesliga das Potential von Twitter für die Marken- und Fan-Kommunikation? Während der Fußballsaison 2011/12 wurden für die Untersuchung einerseits Follower-Zahlen erhoben und andererseits Tweets von Bundesligaclubs gesammelt. Das so entstandene Tweet-Korpus ermöglicht bereits mit der Hilfe von Standard-Metriken einen Überblick über die Nutzungsstrategien. Einzelne Vereine werden als Fallstudien detaillierter betrachtet.
Gegenstand der vorliegenden Magisterarbeit ist der Knowledge Engineering Prozess bei der Entwicklung eines Wissensbasierten Systems. Es werden dazu zunächst grundlegende Begriffe definiert und Ablaufmodelle vorgestellt. Einen Schwerpunkt der Arbeit bildet die Wissensakquisition als Hauptteil des Knowledge Engineering. Der konkrete Ablauf des Prozesses wird am Beispiel der Entwicklung eines Konfigurationssystems für die Blaupunkt GmbH dargestellt. Eingesetzte Methoden zur Wissenserhebung, Wissensanalyse-Ergebnisse sowie Formalismen zur Wissensrepräsentation im Konfigurationssystem werden detailliert am Projekt aufgezeigt. Besonders wird dabei auf Schwierigkeiten im Umgang mit Wissensquellen, den hohen Stellenwert der Wissensanalyse sowie Einsatzmöglichkeiten von deklarativen und prozeduralen Repräsentationsmethoden eingegangen.
Die stark anwachsende Menge von Wissen, welche weltweit zur Verfügung steht, erfordert eine teilweise Übertragung der Qualitätsbewertung auf Maschinen. Zugleich erlaubt die weltweite Vernetzung die Analyse, den Vergleich und die Verknüpfung sehr vieler Wissensangebote. Die Automatisierung von Qualitätsbewertung ist teilweise bereits Realität und erfordert eine stärkere wissenschaftliche Fundierung. Derzeit eingesetzte Systeme basieren auf der Linkanalyse und nutzen somit nur eine sehr eingeschränkte Wissensquelle. Aktuelle Forschungstendenzen aus unterschiedlichen Fachrichtungen verweisen auf komplexere Systeme zur automatischen Qualitätsbewertung. Im Rahmen des Projekts AQUAINT (Automatische Qualitätsabschätzung für Internet Ressourcen) wurde ein innovatives System zur Qualitätsbewertung entwickelt. Das Projekt behandelt die Grundlagen, die Entwicklung des Systems und dessen Evaluierung. Aus den Ergebnissen werden Konsequenzen für die Methodik der Evaluierung im Information Retrieval abgeleitet. Eine wichtige Anwendung liegt in Suchmaschinen der nächsten Generation.
Sammlungen von Textdaten können oft als semi-strukturierte Daten beschrieben werden, die sich in strukturelle Einheiten segmentieren lassen, in denen Elemente eines impliziten Schemas erkannt und in ein strukturiertes Format überführt werden können. Für diese Erschließung wird eine Software vorgestellt, die Funktionen für indikatorbasierte Regeln sowie zur Konsistenzprüfung und Bereinigung (z. B. von Textdubletten) der entstehenden Korpusdaten anbietet. Die Ergebnisse können in acht Formate exportiert werden, womit die Software als Bindeglied zwischen verfügbaren Textdaten und dem Einsatz aktueller Verfahren der Digital Humanities fungiert.
Für die Erschließung schwächer strukturierter Daten, die über keine eindeutigen und einheitlichen Indikatoren für die Felder des impliziten Schemas verfügen, wird eine Methode auf Grundlage von Conditional Random Fields (CRF) in Verbindung mit einem Active Learning-Ansatz vorgeschlagen. Die Elemente der verarbeiteten Daten werden anhand der vom CRF erkannten Wahrscheinlichkeiten für die zugeordneten Bezeichner in acht Cluster eingeteilt, woraus den Anwendern Instanzen für eine iterative Erweiterung der Trainingsdaten dargeboten werden. Gleichzeitig können Elemente, deren Bezeichner mit einer hohen Wahrscheinlichkeit vergeben werden, als "richtig" markiert werden, womit sie in den darauffolgenden Iterationen übersprungen werden. Eine Fallstudie zeigt, dass sich die Ergebnisse mit den ersten Iterationen verbessern, während sich die Werte der als »richtig« markierten Elemente nach einigen Iterationen verschlechtern, woraus sich Empfehlungen für die Anwendung von CRFs mit wenigen Trainingsdaten ergeben.
Der Lemmatizer wmtrans der Canoo Engineering AG (Canoo 2012) und der Porter-Stemmer (Porter 1997) werden hier verglichen. Ziel ist es, jeweils den Einfluss auf die Information Retrieval-Qualität zu analysieren. Basierend auf den Testdaten der CLEF Studie von 2002 wird der Schwerpunkt auf die Analyse einzelner Informationsbedürfnisse gelegt.
Das Internet verändert die Rahmenbedingungen des wissenschaftlichen Publikationswesens einschneidend. Wissenschaftliche Dokumente sind zunehmend elektronisch verfügbar und beginnen, die klassischen Wissenschaftsmedien, wie Fachbücher und Fachzeitschriften zu verdrängen. Die Implementierung eines elektronischen Publikationsprozesses ist Voraussetzung für die erfolgreiche Verbreitung wissenschaftlicher Dokumente per Internet. Die Umsetzung setzt jedoch die Einhaltung bestimmter Vorgaben und Regularien voraus, sonst entstehen Inkompatibilitäten zwischen den Systemen. Im Kontext von Urheberrechtsnovellierung und Open Access-Bewegung erläutert die vorliegende Magisterarbeit technische und rechtliche Rahmenbedingungen von Online-Publikationen und stellt Projekte und Initiativen vor, die sich auf dem Weg des wissenschaftlichen Publikationswesens betätigen. Ausführlich werden Problembereiche des aktuellen Publikationsprozesses von Magisterarbeiten im Studiengang Internationales Informationsmanagement an der Universität Hildesheim mit Hilfe von Interviews untersucht. auf Grundlage der Zustandsanalyse sowie der vorangegangenen Ausführungen wird anschließend der Publikationsprozess modelliert.
Der Vortrag „Erfolgsfaktoren mobiler Anwendungen für klein- und mittelständische Unternehmen“ befasst sich mit der quantitativen Untersuchung von Erfolgsfaktoren für die Entwicklung von Apps oder mobiler Websites. In zuvor durchgeführten Experteninterviews wurden 45 Erfolgsfaktoren analysiert. Diese wurden unter Zuhilfenahme einer Online-Umfrage von Experten bewertet. Mit den Ergebnissen konnten nach Relevanz sortierte Rangfolgen der Erfolgsfaktoren erstellt werden.