Volltext-Downloads (blau) und Frontdoor-Views (grau)

Bildmustererkennung mit Hilfe spärlich codierter Assoziativmatrizen (SpaCAM) am Beispiel von Kfz-Kennzeichen

  • In dieser Arbeit geht es um Mustererkennung für "standardisierte" Schriftbilder. Sie baut auf früheren Untersuchungen der Projektgruppe "Neuronale Netze - SpaCAM" an der Universität Hildesheim auf, wobei es damals um die Wiedererkennung handgeschriebener Unterschriften auf Überweisungsvordrucken ging, also um ein Erkennungsproblem, bei der es in den Daten typischerweise kein Standard- Referenzmuster gibt. Da kein Mensch (physikalisch) identische Unterschriften produzieren kann, muss die Referenz(menge) aus einer Sammlung gegebener Samples "willkürlich" festgesetzt werden. Grundlage für jene Problembehandlung war die Verwendung von "Spärlich Codierten Assoziativmatrizen SpaCAM", die man als eine spezielle Variante der künstlichen neuronalen Netze auffassen kann. Die SpaCAM-Technik hat sich dabei - wie auch schon beim Einsatz in anderen Problembereichen - als besonders vorteilhaft in Bezug auf Fehlertoleranz, Robustheit und Geschwindigkeit erwiesen. Das Ziel der vorliegenden Arbeit ist es zu untersuchen, ob sich diese Technik auch zum Erkennen von Bildmustern eignet, bei denen die Referenzmuster bereits (extern) vorgegeben sind. Als Anwendungsfall wurden "Autokennzeichen" gewählt, auch weil es hierfür eine konkrete Problemstellung aus der Praxis gab, mit Zusatzparametern, die den Komplexitätsgrad des Erkennungsprozesses bereicherten. In Bezug auf die SpaCAM-Technologie soll geprüft werden, welche Merkmale bzw. Merkmalsgruppen für die Codierung von Zeichen besonders gut geeignet sind, insb. beim Lernen aus Schriftarten, um die Erkennung praktikabel zu machen. Für die Analyse und Diskussion der Phänomene wird eine Arbeitsumgebung entwickelt, die auf die sich ergebenden unterschiedlichen Teilaufgaben ausgerichtet ist, also Probleme der Vorverarbeitung (u.a. Grauwerte, Monochrome, Segmentierung), der Speicherprozesse (u.a. Merkmalscodierung, Referenzmengen) aber auch der Nachbestimmung (z.B. durch fehlertoleranten Datenbankabgleich) behandelt und zudem einen Spielraum für weitere Anpassungen bietet. Zur Verifizierung der Tauglichkeit des Ansatzes und zur Überprüfung der Prototyp-Implementation werden alle Teilmodule auf das konkrete Problem der Kfz-Kennzeichen-Erkennung angewandt. Die Software ist in Pascal ("Delphi 5 Professional") geschrieben und enthält neben den eigentlichen Mustererkennungs- auch umfangreiche Analyse- und Visualisierungsfunktionen. Daher eignet sie sich auch für Schulungszwecke und Präsentationen. Im konkret zugrunde liegenden Anwendungsfall entstammt die Menge der relevanten Kennzeichen einer Datenbasis, die neben dem authentischen Kennzeichen auch Sekundärinformationen (Fahrzeugdaten, Halter etc) enthält, welche für nachfolgende Entscheidungsprozesse von Bedeutung sind. Hier wurde im Hinblick auf den Einsatz in der Praxis zusätzlich eine ebenfalls auf der SpaCAMTechnik basierende Schnittstelle zwecks fehlertoleranter Suche nach Sekundärinformationen in der "gewöhnlichen" Datenbank implementiert. Insofern könnten die im Nachgang ermittelten Informationen unter Umständen beim vorherigen Erkennungsprozess mithelfen, Fehler oder Unentscheidbarkeiten zu verringern. Für die Technologie bedeutet das, dass in den separaten Phasen unterschiedliche Merkmalsmengen und Codevektoren gefunden werden müssen, deren Zusammenspiel aber eine Verbesserung der Endergebnisse bewirken kann. Auch diese Komposition soll beispielhaft dargestellt werden. Mit der Fragestellung der vorliegenden Arbeit befindet man sich nicht weit entfernt von aktuell diskutierten Sicherheits- oder Automatisierungsvorhaben. Man denke zum Beispiel an die Verwendung biometrischer Merkmale (Fingerabdrücke, Iris im Auge, Gesichtsform usw.) als Zugangskontrolle an Flughäfen, Schließfächern, Laboratorien usw. oder an die automatische Mauterhebung von Fahrzeugen u.v.m. Insofern besteht nicht nur ein akademisches Interesse an den Einsatzmöglichkeiten neuer Technologien, sondern auch ein organisatorisches bzw. gesellschaftliches, welches als Herausforderung an die Wissenschaftler empfunden werden kann.
  • This thesis deals with the recognition of standardised type faces and is based on the research carried out by the “Neural networks – SpaCAM” group at the University of Hildesheim. Their research was into recognizing signatures on bank transfer forms. In this case, the learned references (that is, signatures) were defined by special sample instead of an external norm - because nobody is able to write identical, standard signatures. The “Sparsely Coded Associated Memory (SpaCAM)”, a special variation of an artificial neural network, was used to solve this problem. In this and other applications the SpaCAM has proved itself to be fault tolerant, robust and fast. The aim of this paper is to determine whether this technique is appropriate to recognise patterns where an externally norm defines the references. The Vehicle registration plate domain was chosen because there was a practical application with additional parameters which increase the complexity of the recognition process. In this domain, the reference object (a font) is predetermined. The investigation into the SpaCAM-Technique shall verify, which characteristics or set of characteristics are particularly appropriate for coding of characters to make recognition practical. A workbench is developed to investigate the various subtasks. These are special pre-processing concepts (such as changing to grey scale, monochrome and segmentation), memory processes (such as coding of characteristics or the set of references) and post processing (e.g. the comparison in a fault tolerant database) which offers a rich set of tuning parameters. The problem chosen is intended to test the efficacy of the theory and the prototype implementation. In addition it requires the use of all workbench modules. The software, written in Pascal (Delphi 5 Professional), includes functions for pattern recognition and a rich set of analysis and visualisation tools. Therefore, it can also be used for training and presentations. In the chosen problem domain the set of relevant vehicle licence plates including secondary information (such as the user or the type of a car) is stored in a local database. This secondary information may be used in support of the recognition process. In addition, for practical applications, an interface, also based on SpaCAM, may be used to find secondary information on a fault-tolerant basis in the (traditional) local database. It may be that this secondary process can help to decrease the main recognition phase error rate. From the technological standpoint, this means that to improve the final result, different sets of characteristics and code vectors must be found for the separate phases. This composition shall also be illustrated by means of example. The subject matter of this paper is not far away from current projects discussing security or task automation. Examples include recognition of biometric characteristics for access control to airports, safe deposit boxes, laboratories or toll collection for vehicles. Biometric characteristics include fingerprints, facial patterns and iris scans. There is not only academic interest in the application of these new technologies, but also an organisational and social interest and this represents a challenge to researchers.

Download full text files

Export metadata

Additional Services

Share in Twitter    Search Google Scholar    frontdoor_oas
Metadaten
Author:Detlef Romberger
URN:https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-995
Advisor:Hans-Joachim Bentz
Document Type:Doctoral Thesis
Language:German
Date of Publication (online):2011/05/19
Publishing Institution:Stiftung Universität Hildesheim
Granting Institution:Universität Hildesheim, Fachbereich III
Date of final exam:2005/12/14
Release Date:2011/05/19
GND Keyword:Maschinelles Sehen
PPN:Link zum Katalog
Institutes:Fachbereich III / Informationswissenschaft und Sprachtechnologie
DDC classes:000 Allgemeines, Informatik, Informationswissenschaft / 000 Allgemeines, Wissenschaft / 004 Informatik
Licence (German):License LogoDeutsches Urheberrecht