gms | German Medical Science

63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

02. - 06.09.2018, Osnabrück

Sensitive Daten für Open Science

Meeting Abstract

Search Medline for

  • Wolfgang Kuchinke - Heinrich-Heine Universität Düsseldorf, Düsseldorf, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Osnabrück, 02.-06.09.2018. Düsseldorf: German Medical Science GMS Publishing House; 2018. DocAbstr. 185

doi: 10.3205/18gmds081, urn:nbn:de:0183-18gmds0817

Published: August 27, 2018

© 2018 Kuchinke.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Die Forschung mit sensitiven Daten, insbesondere mit medizinischen Daten, findet nur mit Einschränkungen statt, da diese Daten aufgrund gesetzlicher Vorschriften einem besonderen Schutz unterliegen. Gefördert durch die EU sind eine Vielzahl von Forschungsinfrastrukturen (e.g. ECRIN, EATRIS, BBMRI, ELIXIR) und e-Infrastrukturen (e.g. EUDAT, GÉANT, EGEE) entstanden, die gemäß dem Open-Science-Paradigma einen offenen Datenraum schaffen, aber die Anforderungen der Forschung mit sensitiven Gesundheitsdaten ignoriert haben [1], [2], [3]. Im Gegensatz zu den e-Infrastrukturen haben einige Projekte rechtskonforme Lösungen für den Umgang mit sensiblen Daten in der Forschung eingesetzt. Es ist deshalb an der Zeit, von diesen Lösungen zu lernen und Strategien und Technologien zu implementieren, die einer grenzüberschreitenden, globalen, interdisziplinären Forschung mit personenbezogenen, sensiblen Daten eine Grundlage bietet. Gerade die Nutzung verschiedensten Datenquellen aus dem Gesundheitswesen, der klinischen Forschung und vom Patienten selbst, stellt eine wichtige Voraussetzung zur Implementation eines „Learning Healthcare System“ [4] dar.

Methode: Im Rahmen von EUDAT wurde 2016 die "EUDAT Group for Sensitive Data" mit dem Ziel gegründet, Lösungen für den Umgang mit sensiblen Daten in der Forschung, die auch für e-Infrastrukturen benutzt werden können, zu evaluieren [5]. In drei Workshops wurden Anforderungen von zwanzig Forschungsgemeinschaften, als auch existierende Lösungen für die Verarbeitung, Analyse und Speicherung sensibler Daten untersucht. Konzepte zur Einbindung von sensitiven Data in die Data Fabric der Research Data Alliance (RDA) basierend auf Datenobjekten (Data Objects, DO), wurden erarbeitet.

Ergebnisse: Die Evaluation der Lösungen für sensitive Daten zeigte, dass es auf der technischen Ebene keine bedeutenden Hindernisse gibt. Es eignen sich Kombinationen von kontrollierten und isolierten Bereichen für die Datenverarbeitung, Datenanalyse-Algorithmen, die zu den Datenbanken transferiert werden, Vault-Systeme, sichere Ordnersysteme, „Virtual Platform Isolation“, Blockchain-Technologien, „Heterogeneous Proxy Re-Encryption“, „Query Isolation“, und sichere Container-Technologien. Die Nutzung von TSD (Tjenester für sensible Daten) der Universität Oslo (Norwegen), ein kontrollierter Analyseraum, wurde mit klinischen Studiendaten evaluiert. TSD und die Nutzung unterschiedlicher, privater Clouds für Krankenhäuser und Forschungseinrichtungen (Computerome in Dänemark) können als Vorbild für Europäische Lösungen dienen. Die Daten werden dabei nicht verschoben, sondern Analysen zu den Daten gebracht.

Um zwischen Forschungsinfrastrukturen und e-Infrastrukturen ein zusätzliches Abstraktionsniveau für das Datenmanagement zu schaffen, wurde das Konzept der Data Fabric, mit Elementen für die Berücksichtigung der Vertraulichkeit von Datenprozessen erweitert. Dazu diente ein Digital Object (DO)-Model, bei dem jedes DO einen eindeutigen Identifier, einen Datentyp, Metadaten und „Data Tags“, Etiketten für das Risiko einer Re-Identifizierung, erhält. DOs werden dadurch selbstbeschreibend; mit jedem DO läßt sich auch ein Satz von erlaubten Operationen verbinden.

Diskussion: Es ist notwendig grundlegender darüber nachzudenken, wie interpretierende Metadaten, insbesondere das Risiko der Re-identifikation von Datensubjekten, schon bei der Datenentstehung berücksichtigt und automatisiert verarbeitet werden können [6]. So sollten Metadaten von DOs mit Gesundheitsdaten regelkonform zum Datenschutz auch Informationen zur Einwilligung und zu Eigentumsrechten der Datensubjekte enthalten. Dadurch lassen sich die FAIR-Prinzipien auch auf das Datenmanagement mit sensiblen Daten ausweiten: der Zugang ist nicht offen, aber unter genau definierten Bedingungen zugänglich [7]. Die Durchsetzung einer solchen Infrastruktur für sensitive Daten wird aber mit einem erheblichen politischen Aufwand für die dazu notwendigen Vereinbarungen und Regeln verbunden sein.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Kuchinke W, Ohmann C, Stenzhorn H, Anguista A, Sfakianakis S, Graf N, Demotes J. Ensuring sustainability of software tools and services by cooperation with a research infrastructure. Personalized Medicine. 2016;13(1):43-55.
2.
Jarnevich CS, Graham JJ, Newman GJ, et al. Balancing data sharing requirements for analyses with data sensitivity. Biol Invasions. 2007;9:597. DOI: 10.1007/s10530-006-9042-4 External link
3.
Krumholz HM. Open Science and Data Sharing in Clinical Research. Basing Informed Decisions on the Totality of the Evidence. Circulation: Cardiovascular Quality and Outcomes. 2012;5:141-142.
4.
Delaney BC, Curcin V, Andreasson A, et al. Translational Medicine and Patient Safety in Europe: TRANSFoRm — Architecture for the Learning Health System in Europe. BioMed Res Int. 2015. DOI: 10.1155/2015/961526 External link
5.
EUDAT to tackle Sensitive Data for Open Science at RDA 11th Plenary. EUDAT; 2018 [cited 2018 Apr 7]. Available from: https://eudat.eu/news/eudat-to-tackle-sensitive-data-for-open-science-at-rda11-plenary External link
6.
Kuchinke W. ECRIN and RDA: clinical trials and personalised medicine - role of RDA [Presentation]. In: 2nd RDA EU Infrastructure Projects Interaction Meeting; May 26-27, 2015; Amsterdam, the Netherlands. DOI: 10.13140/RG.2.2.18573.33763 External link
7.
An EUDAT-based FAIR Data Approach for Data Interoperability. EUDAT; 2018 [cited 2018 Apr]. Available from: https://eudat.eu/communities/an-eudat-based-fair-data-approach-for-data-interoperability External link