- search hit 1 of 1
Analyse und Einsatzpotentiale von Clustering-Verfahren zum Retrieval von Patent-Dokumenten
- Um dem stetigen Zuwachs der elektronisch in Datenbanken abgespeicherten Informationen wirkungsvoll zu begegnen, werden neue Werkzeuge gesucht, die den Nutzer bei Datenbankrecherchen unterstützen. In dieser Arbeit, die im Anwendungsbereich der Patentrecherche und Patentinformation angesiedelt ist, soll das automatische Gruppieren von Patentdokumenten - das so genannte Clustering - als ein Werkzeug zur Aufbereitung der Ergebnismenge einer Datenbankanfrage untersucht werden. Es werden zum einen Grundlagen der Cluster-Analyse, wie z.B. Attributtypen und Ähnlichkeits- bzw. Distanzmaße, zum anderen verschiedene Clustering- Verfahren sowie deren Vor- und Nachteile zum Clustern von Dokumenten beschrieben. Weiterhin werden Besonderheiten des Anwendungsbereichs aufgezeigt und bereits bestehende Einsatzmöglichkeiten von Clustering-Verfahren dargestellt. Im praktischen Teil dieser Arbeit werden im Anwendungsbereich Patentrecherche drei Clustering-Verfahren mittels Nutzerbewertungen miteinander verglichen, um tendenzielle Aussagen über die Eignung eines bestimmten Verfahrens abzuleiten.
- The constantly growing amount of information stored in databases fosters the need for new tools, assisting the user during his or her database search. This Master’s thesis relates to patent search and patent information retrieval where clustering is used as a tool to group the result set of a database query, i.e. automatically form groups of patent documents. The subjects described are principal issues of cluster analysis such as types of attributes, similarity or distance measures, different types of clustering algorithms as well as their advantages and disadvantages for clustering documents. Furthermore, the special requirements of the application area are illustrated and the existing use of clustering techniques is depicted. The thesis’ practical section deals with the evaluation of three different clustering algorithms, used in the context of patent retrieval. Within this evaluation, user judgements are used to compare the three algorithms and to derive a recommendation for a specific algorithm on that basis.
Author: | Joachim Pfister |
---|---|
URN: | https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-1224 |
Document Type: | Master's Thesis |
Language: | German |
Date of Publication (online): | 2011/05/26 |
Year of first Publication: | 2004 |
Publishing Institution: | Stiftung Universität Hildesheim |
Release Date: | 2011/05/26 |
Tag: | Cluster-Analyse; Dokument-Clustering; Nutzerbewertung; Patentdokumente cluster analysis; clustering algorithms; comparison; document clustering; evaluation; patent databa; patent documents; patinformatics; user judgements |
GND Keyword: | Informationssysteme |
Page Number: | 123 |
PPN: | Link zum Katalog |
Institutes: | Fachbereich III / Informationswissenschaft und Sprachtechnologie |
DDC classes: | 000 Allgemeines, Informatik, Informationswissenschaft / 000 Allgemeines, Wissenschaft / 004 Informatik |
Licence (German): | ![]() |