Exploring Cause-Effect Relationships in Process Analytics - Design, Development and Evaluation of Comprehensible, Explainable and Context-Aware Techniques

Language
en
Document Type
Doctoral Thesis
Issue Date
2021-07-12
Issue Year
2021
Authors
Stierle, Matthias
Editor
Abstract

The increasing availability of process data retrieved from information systems has changed the nature of business process management in organisations. In particular, process analysis has moved from qualitative to evidence-based approaches. Process analytics has emerged as a paradigm for creating value from process data. It supports the mission of business process management to improve business processes by providing, amongst other things, enhanced decision support. To improve a business process, information about its status quo is required, which is provided by descriptive process analytics technologies, such as process mining. More importantly, knowledge about cause-effect relationships between the process, its context and its performance (i.e. its outcome) is essential.

Two major challenges present themselves for the analysis of cause–effect relationships in business processes with process data. First, techniques need to incorporate contextual data (e.g. the sold product or the ordering customer in a sales process) as well as the immediate process layer (e.g. the process sequence or the duration between process activities). Existing knowledge about the cause–effect relationships between these contextual attributes and the process should be input into such techniques to make them context-aware. Second, the output of the techniques should be comprehensible, so users are more willing to accept and subsequently use them. Techniques --- especially those based on machine learning --- should be explainable to allow users to discover new knowledge from the learnt structures between input and output attributes. The output should guide analysts in their quest to find cause–effect relationships between the executed process steps and the process outcome.

In light of these challenges, this doctoral thesis applies a design science research approach to design artefacts that support the analysis of cause–effect relationships from process data. First, the thesis introduces a holistic conceptualisation of the term process analytics. It stresses the importance of both the process of analysis and human and organisational concerns to create value from process data. Most importantly, various techniques are designed for the analysis of process data with machine learning. All of these techniques are instantiated and evaluated with real-life data sets. For one of the techniques, a case study demonstrates its usefulness to process analysts to discover root causes for performance issues. In addition, the thesis presents design principles for producing comprehensible process models derived from process data. Last, a structured literature review discusses explainability in predictive business process monitoring to identify future research needs.

Part A of this dissertation presents a summary introducing the overarching research objective and research questions. Part B consists of seven research papers, six of which have been published in various renowned academic outlets, such as the Decision Support Systems journal, the Information Systems journal and the European Conference on Information Systems.

Abstract

Durch die zunehmende Verfügbarkeit von Prozessdaten aus Informationssystemen hat sich das Geschäftsprozessmanagement in Organisationen stark gewandelt. Insbesondere bei der Prozessanalyse kommen statt qualitativen Ansätzen immer mehr datengestützte Verfahren zum Einsatz. Process Analytics präsentiert sich dabei als neues Paradigma für die Wertschöpfung aus Prozessdaten. Es unterstützt das Geschäftsprozessmanagement bei seinem Ziel, Prozesse zu optimieren, insbesondere durch eine verbesserte Entscheidungshilfe. Um einen Prozess zu verbessern, benötigt es Informationen über dessen Zustand, die von deskriptiven Techniken für Process Analytics (z.B. Techniken des Process Mining), bereitgestellt werden können. Weiterhin bedarf es aber Wissen über Ursache-Wirkungs-Beziehungen zwischen dem Prozess, dem Prozesskontext und dem Prozessausgang.

Bei der Analyse von Ursache-Wirkungs-Beziehungen in Geschäftsprozessen auf Basis von Prozessdaten ergeben sich zwei maßgebliche Herausforderungen. Zum einen müssen Techniken neben den Daten, die den unmittelbaren Prozess (z.B. den Prozessablauf oder die Dauer zwischen Prozessschritten) beschreiben, auch solche, die den Prozesskontext (z.B. das verkaufte Produkt oder der bestellende Kunde in einem Vertriebsprozess) darstellen, berücksichtigen können. Bestehendes Wissen über Ursache-Wirkungs-Beziehungen zwischen solchen Attributen, die den Kontext beschreiben, und dem Prozess sollte einer Technik ebenfalls übergeben werden können. Zum anderen sollte die Ausgabe der Techniken verständlich sein, um die Akzeptanz durch die Anwender und folglich deren Nutzung einer Technik zu gewährleisten. Techniken - insbesondere falls auf maschinellem Lernen basierend - sollten erklärbar sein und es Anwendern ermöglichen, Erkenntnisse aus den erlernten Strukturen zwischen Eingabe- und Ausgabeattributen zu gewinnen. Die Ausgabe der Techniken sollte Prozessanalysten bei der Suche nach Ursache-Wirkungs-Beziehungen zwischen ausgeführten Prozessschritten und Prozessausgang (d.h. Erfolg oder Misserfolg) leiten.

In Anbetracht dieser Herausforderungen entwickelt diese Doktorarbeit unter Anwendung eines gestaltungsorientierten Forschungsansatzes Artefakte, die die Analyse von Ursache-Wirkungs-Beziehungen anhand von Prozessdaten unterstützen. Die Arbeit beginnt mit einer ganzheitlichen Betrachtung und Konzeptualisierung des Begriffs Process Analytics. Dabei werden sowohl die technologischen Aspekte der Prozessanalyse wie auch die soziotechnische Perspektive der Wertschöpfung aus Prozessdaten diskutiert. Insbesondere entwickelt die Arbeit mehrere Techniken zur Analyse von Prozessdaten basierend auf Ansätzen des maschinellen Lernens. Die Techniken werden instanziiert und mit Echtdaten evaluiert. Eine Fallstudie zeigt zudem die Nützlichkeit einer der Techniken für Prozessanalysten auf, um Ursachen für Prozessprobleme zu entdecken. Weiterhin entwickelt die Doktorarbeit Gestaltungsprinzipien für die Ausgabe von verständlichen Prozessmodellen, die aus Prozessdaten gewonnen werden. Zu guter Letzt werden auf Basis einer strukturierten Literaturrecherche zur Erklärbarkeit von Techniken für die Prozessvorhersage Potenziale und Bedarfe für zukünftige Forschungsarbeiten aufgezeigt.

Im Teil A dieser Dissertation werden das übergreifende Forschungsziel sowie die übergreifenden Forschungsfragen aufgezeigt und die Ergebnisse der Forschungsarbeiten zusammengefasst. Teil B besteht aus sieben Forschungspapieren von denen sechs in verschiedensten akademischen Zeitschriften und Konferenzen (z.B. Decision Support Systems, Information Systems und die Europäische Konferenz für Wirtschaftsinformatik) veröffentlicht wurden.

DOI
Zugehörige ORCIDs