Exploratory Road Accident Analysis - Identification of Interesting Relationships over Time to Support Road Safety Planning
- Road accidents are one of the leading causes of death worldwide, particularly among young people. The police and local authorities therefore strive to reduce the risk of accidents through appropriate road safety measures. In order to plan these measures, the relevant types of accidents, i. e., accidents with certain features, must first be recognized. However, the variety of accident features and the amount of resulting feature combinations make it impossible to monitor all accident types manually. In this thesis, methods are proposed to automatically identify interesting accident types. Here, it is investigated whether combinations of features occur together and how the temporal pattern of the combined occurrence behaves. The change mining approach can then be used to determine whether structural changes in frequency occur during the period under consideration. For example, a feature combination that suddenly appears more frequently or exhibits a change in seasonality should be prioritized for further investigation so that appropriate road safety measures may be initiated for that combination. The implemented strategic, multi-stage data mining framework based on frequent itemset mining, time series clustering, forecasting methods, and a scoring process is able to detect interesting feature combinations. These are then processed on a map in a web interface suitable for the respective audience in order to support the strategic planning of road safety measures. The framework is applied to several accident data sets from different countries to determine suitable default parameter values for the respective data analysis methods and to carefully align the methods. It is shown that there exist only minor dependencies of the parameter selection on the database to be analyzed. For operational planning, it is necessary to consider small geographic areas and identify the features that have the greatest impact on accident occurrence there. Therefore, the developed operational framework analyzes and predicts the course of accident time series, taking into account the associated feature-specific time series. On the one hand, this makes it possible to increase the forecast performance, and, on the other hand, to determine which accident features have a significant influence on the course of the accident numbers over time. The insights gained can be used as a basis for short-term measures.
- Verkehrsunfälle gehören weltweit zu den häufigsten Todesursachen, insbesondere bei jungen Menschen. Die Polizei und die lokalen Behörden sind daher bestrebt, das Unfallrisiko durch geeignete Verkehrssicherheitsmaßnahmen zu verringern. Für die Planung dieser Maßnahmen ist es erforderlich, zunächst die relevanten Unfalltypen, d. h. Unfälle mit bestimmen Merkmalen, zu identifizieren. Die Vielfalt der Unfallmerkmale und die Menge der daraus resultierenden Merkmals-kombinationen machen es dabei aber unmöglich, alle Unfalltypen manuell zu überwachen. In dieser Arbeit werden Methoden vorgeschlagen, um interessante Unfalltypen automatisch zu identifizieren. Dabei wird untersucht, ob eine Kombination von Merkmalen häufig gemeinsam auftritt und wie sich das zeitliche Muster des kombinierten Auftretens verhält. Mit Hilfe des Change Mining-Ansatzes kann dann festgestellt werden, ob im Betrachtungszeitraum strukturelle Veränderungen in der Häufigkeit auftreten. So sollte zum Beispiel eine Merkmalskombination, die plötzlich häufiger vorliegt oder eine Veränderung in ihrer Saisonalität aufweist, für die weitere Untersuchung priorisiert werden, damit für diese Kombination geeignete Verkehrssicherheitsmaßnahmen eingeleitet werden können. Das implementierte strategische, mehrstufige Data Mining Framework, basierend auf Frequent Itemset Mining, Zeitreihenclustering, Prognoseverfahren und einem Scoring-Prozess, ist in der Lage, interessante Merkmalskombinationen zu ermitteln. Diese Ergebnisse werden adressantengerecht in einer Web-Oberfläche auf einer Karte aufbereitet, um die strategische Planung von Verkehrssicherheitsmaßnahmen zu unterstützen. Das Framework wird auf mehrere Unfalldatensätze aus verschiedenen Ländern angewandt, um geeignete Default-Parameterwerte für die jeweiligen Datenanalyseverfahren zu ermitteln und die Verfahren sorgfältig aufeinander abzustimmen. Es zeigt sich, dass nur geringe Abhängigkeiten der Parameterwahl von der zu analysierenden Datenbasis existieren. Für die operative Planung ist es erforderlich, kleine geographische Gebiete zu betrachten und dort die Merkmale zu identifizieren, die den größten Einfluss auf das Unfallgeschehen haben. Daher analysiert und prognostiziert das entwickelte operative Framework den Verlauf von Unfallzeitreihen unter Berücksichtigung der zugehörigen merkmalsspezifischen Zeitreihen. Dadurch lässt sich zum einen die Prognosegüte erhöhen, aber insbesondere auch feststellen, welche Unfallmerkmale den Verlauf der Unfallzahlen über die Zeit maßgeblich beeinflussen. Die gewonnenen Erkenntnisse wiederum können als Basis für kurzfristige Maßnahmen genutzt werden.
Author: | Katherina Meißner |
---|---|
URN: | https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus4-14602 |
DOI: | https://doi.org/10.25528/152 |
Referee: | Jan Fabian Ehmke |
Advisor: | Julia Rieck |
Document Type: | Doctoral Thesis |
Language: | English |
Year of Completion: | 2022 |
Publishing Institution: | Stiftung Universität Hildesheim |
Granting Institution: | Universität Hildesheim, Fachbereich IV |
Date of final exam: | 2022/09/30 |
Release Date: | 2023/01/24 |
Tag: | Clustering; Data Mining; Road Accident Analysis |
Page Number: | 274 |
PPN: | Link zum Katalog |
Institutes: | Fachbereich IV |
Fachbereich IV / Betriebswirtschaft und Wirtschaftsinformatik | |
DDC classes: | 300 Sozialwissenschaften / 380 Handel, Kommunikation, Verkehr |
000 Allgemeines, Informatik, Informationswissenschaft / 000 Allgemeines, Wissenschaft / 004 Informatik | |
Licence (German): | ![]() |