TY - THES U1 - Master Thesis A1 - Pfister, Joachim T1 - Analyse und Einsatzpotentiale von Clustering-Verfahren zum Retrieval von Patent-Dokumenten N2 - Um dem stetigen Zuwachs der elektronisch in Datenbanken abgespeicherten Informationen wirkungsvoll zu begegnen, werden neue Werkzeuge gesucht, die den Nutzer bei Datenbankrecherchen unterstützen. In dieser Arbeit, die im Anwendungsbereich der Patentrecherche und Patentinformation angesiedelt ist, soll das automatische Gruppieren von Patentdokumenten - das so genannte Clustering - als ein Werkzeug zur Aufbereitung der Ergebnismenge einer Datenbankanfrage untersucht werden. Es werden zum einen Grundlagen der Cluster-Analyse, wie z.B. Attributtypen und Ähnlichkeits- bzw. Distanzmaße, zum anderen verschiedene Clustering- Verfahren sowie deren Vor- und Nachteile zum Clustern von Dokumenten beschrieben. Weiterhin werden Besonderheiten des Anwendungsbereichs aufgezeigt und bereits bestehende Einsatzmöglichkeiten von Clustering-Verfahren dargestellt. Im praktischen Teil dieser Arbeit werden im Anwendungsbereich Patentrecherche drei Clustering-Verfahren mittels Nutzerbewertungen miteinander verglichen, um tendenzielle Aussagen über die Eignung eines bestimmten Verfahrens abzuleiten. N2 - The constantly growing amount of information stored in databases fosters the need for new tools, assisting the user during his or her database search. This Master’s thesis relates to patent search and patent information retrieval where clustering is used as a tool to group the result set of a database query, i.e. automatically form groups of patent documents. The subjects described are principal issues of cluster analysis such as types of attributes, similarity or distance measures, different types of clustering algorithms as well as their advantages and disadvantages for clustering documents. Furthermore, the special requirements of the application area are illustrated and the existing use of clustering techniques is depicted. The thesis’ practical section deals with the evaluation of three different clustering algorithms, used in the context of patent retrieval. Within this evaluation, user judgements are used to compare the three algorithms and to derive a recommendation for a specific algorithm on that basis. KW - Informationssysteme KW - Patentdokumente KW - Cluster-Analyse KW - Dokument-Clustering KW - Nutzerbewertung KW - patent documents KW - cluster analysis KW - document clustering KW - clustering algorithms KW - comparison KW - evaluation KW - user judgements KW - patinformatics KW - patent databa Y2 - 2004 U6 - https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-1224 UN - https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-1224 SP - 123 S1 - 123 ER -