Föderierte medizinische Forschungsdatenbanken: Architekturen, Datenintegration und Abfragelogik

Language
de
Document Type
Doctoral Thesis
Issue Date
2021-10-18
Issue Year
2021
Authors
Mate, Sebastian
Editor
Abstract

Today, electronic medical data are used in many ways beyond the medical care of patients, especially in research. In the context of personalized medicine, however, increasingly large amounts of data are needed to perform meaningful analyses. Yet the obvious solution of combining and analyzing the data from multiple sites poses a number of challenges. Three of these are addressed in this dissertation: architectures, data integration, and query logic.

An important foundation is provided by software architectures in which data can be stored and analyzed in a data protection-compliant manner. In recent years, the importance of collaboration across sites or even consortia has increased. This dissertation provides two contributions with respect to the translation of electronic cohort queries and its integration into federated research architectures. In this way, research networks, even if based on different technologies, become interoperable for distributed cohort queries.

The heterogeneity of medical data generated in different locations is a barrier to networked research. Aiming to overcome this, the dissertation presents a method that enables the semi-automatic mapping and merging of heterogeneous datasets using a lexical approach.

For the analysis of medical data, various user-friendly query tools had been developed in recent years. However, these may have limitations in terms of the query complexity that can be realized. Therefore, a further study of this dissertation investigates to what extent the currently common declarative methods in electronic cohort queries can be supplemented with procedural ones. Finally, the last contribution of this dissertation addresses the modeling of temporal relations in cohort queries and introduces a new graphical approach for this purpose.

In summary, the results of this dissertation show that collaboration within individual or between several research networks can be further improved by the intelligent processing of electronic cohort queries.

Abstract

Elektronische medizinische Daten werden heute neben der medizinischen Versorgung der Patienten auf vielfältige Weise genutzt, insbesondere in der Forschung. Im Rahmen der personalisierten Medizin werden jedoch immer größere Datenmengen benötigt, um aussagekräftige Analysen durchführen zu können. Die offensichtliche Lösung, die Daten von mehreren Standorten zu kombinieren und zu analysieren, bringt jedoch eine Reihe von Herausforderungen mit sich. Drei davon werden in dieser Dissertation behandelt: Architekturen, Datenintegration und Abfragelogik.

Eine wichtige Grundlage bilden Softwarearchitekturen, in denen Daten datenschutzkonform gespeichert und analysiert werden können. In den vergangenen Jahren hat die Bedeutung der Zusammenarbeit über Standorte oder sogar Konsortien hinweg zugenommen. Diese Dissertation liefert zwei Beiträge zur Übersetzung von elektronischen Kohortenabfragen und ihrer Integration in föderierte Forschungsarchitekturen. Auf diese Weise werden Forschungsnetzwerke, selbst wenn diese auf unterschiedlichen Technologien basieren, für verteilte Kohortenabfragen interoperabel.

Die Heterogenität medizinischer Daten, die an verschiedenen Orten generiert wurden, stellt eine Barriere für die vernetzte Forschung dar. Mit dem Ziel, diese zu überwinden, wird in der Dissertation eine Methode vorgestellt, die ein halbautomatisches Mapping und eine Zusammenführung von heterogenen Datensätzen mithilfe eines lexikalischen Ansatzes ermöglicht.

Für die Analyse medizinischer Daten wurden in den letzten Jahren verschiedene benutzerfreundliche Abfragewerkzeuge entwickelt. Diese können jedoch Einschränkungen hinsichtlich der umsetzbaren Abfragekomplexität aufweisen. In einer weiteren Arbeit dieser Dissertation wird daher untersucht, inwieweit die derzeit üblichen deklarativen Methoden bei elektronischen Kohortenabfragen durch prozedurale ergänzt werden können. Abschließend befasst sich der letzte Beitrag dieser Dissertation mit der Modellierung von temporalen Beziehungen in Kohortenabfragen und stellt hierfür einen neuen grafischen Ansatz vor.

Zusammenfassend zeigen die Ergebnisse dieser Dissertation, dass die Zusammenarbeit in einzelnen oder zwischen mehreren Forschungsnetzwerken durch die intelligente Verarbeitung von elektronischen Kohortenabfragen weiter verbessert werden kann.

DOI
Faculties & Collections