gms | German Medical Science

63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

02. - 06.09.2018, Osnabrück

Rahmenbedingungen, Architektur und Implementierungen für das Data Sharing von Bioproben in der NAKO Gesundheitsstudie

Meeting Abstract

  • Lars Erdmann - Universitätsmedizin Greifswald Institut für Community Medicine, Greifswald, Deutschland
  • Jens Piegsa - Universitätsmedizin Greifswald, Greifswald, Deutschland
  • Konrad Biedowicz - Universität Greifswald, Insitut für Community Medicine, Greifswald, Deutschland
  • Wolfgang Hoffmann - Universitätsmedizin Greifswald, Institut für Community Medicine, Greifswald, Deutschland
  • Gunthard Stübs - Institut für Community Medicine, Universitätsmedizin Greifswald, Greifswald, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Osnabrück, 02.-06.09.2018. Düsseldorf: German Medical Science GMS Publishing House; 2018. DocAbstr. 287

doi: 10.3205/18gmds133, urn:nbn:de:0183-18gmds1334

Published: August 27, 2018

© 2018 Erdmann et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Die NAKO hat das Ziel die Entstehung, Vorbeugung, Früherkennung und Behandlung von Volkskrankheiten zu erforschen. Dazu sollen im Zeitraum 2013-2023 insgesamt 200.000 Teilnehmer im Alter von 20-69 Jahren im Abstand von 4-5 Jahren in 18 Studienzentren (SZ) zweimal untersucht werden. Das Studienprogramm umfasst Befragungen, medizinische Untersuchungen und die Sammlung von Bioproben (z.B. Blut/Urin). Dabei werden die Primärproben im SZ verarbeitet und aliquotiert (z.B. Serum/Plasma). Dazu müssen 27,7 Millionen Aliquots langfristig bei -180°C bzw. -80°C in Bioprobenlagern aufbewahrt werden. 2/3 werden im Zentralen Biorepository eingelagert und 1/3 verbleibt in dezentralen Lagern der SZ. Die Lagerinformationen der Bioproben und deren Kontextdaten werden im Laborinformationsmanagementsystem (LIMS, CentraXX der Fa. Kairos) verwaltet (Pseudonym ID-LIMS) [1].

Die Rahmenbedingungen für die Nutzung der Studiendaten und Bioproben definiert die Nutzungsordnung. Die Durchführung des Nutzungsverfahrens obliegt der Transferstelle (TFS). Dieses umfasst u.a. die Antragstellung, Antragsprüfung und Genehmigung, Zusammenstellung und Übergabe von Daten, die Auslagerung von Bioproben und die Reintegration von Analyseergebnissen. Pro Jahr werden bis zu 1000 Nutzungsanträge erwartet, so dass es notwendig ist, den Antragsprozess möglichst zu automatisieren.

Methoden: Damit die Bioproben und deren Kontextdaten durch Wissenschaftler beantragbar sind, müssen die Metadaten für Wissenschaftler dargestellt werden. Diese müssen in regelmäßigen Abständen aus dem LIMS exportiert werden. Neben der Auswahl der Bioprobenart ist eine Teilnehmerselektion notwendig. Die Selektion kann sich alleine auf Studiendaten beziehen (z.B. Diabetesdiagnose), die in der Forschungsdatenbank des Integrationszentrums verwaltet werden (Pseudonym ID-F). Außerdem kann die Teilnehmerselektion Bioprobenkontextdaten beinhalten (z.B. Temperaturen). Nach der Vertragsunterzeichnung muss dem LIMS der Auslagerungsauftrag übermittelt werden. Parallel dazu benötigt der Antragsteller die Bioprobenkontextdaten. Für die Interaktion der Wissenschaftler mit der TFS ist eine Webanwendung unablässig. Diese wurde mit JavaEE entwickelt und das Ticketsystem Jira integriert.

Ergebnisse: Der Metadatenexport aus dem CentraXX konnte mittels eines Mappings so transformiert werden, dass diese Daten im Data-Dictionary-Browser der TFS darstellbar sind. Die Webanwendung stellt darüber hinaus Antragsformulare bereit, mittels denen Wissenschaftler Daten/Bioprobenarten auswählen. Für jede Bioprobenart können das Probenvolumen, der Lagerort und die Erhebungswelle ausgewählt werden. Für die kontextdatenbasierte Teilnehmerselektion wird eine komplexe Suchanfrage generiert und per REST-Schnittstelle beim CentraXX abgefragt. Die ID-LIMS der auszulagernden Bioproben werden mittels einer XML-Nachricht an das CentraXX übermittelt und dort den 2D-Codes auf den Bioprobenröhrchen zugeordnet. Der Download der zweitspseudonymisierten Bioprobenkontextdaten erfolgt für den Wissenschaftler zusammen mit den Studiendaten verschlüsselt über die Webanwendung der TFS. Zur Übersetzung der sonstigen Pseudonyme ist die Treuhandstelle der NAKO angebunden.

Diskussion: Wir konnten mit der Webanwendung ein Portal für die gemeinsame Beantragung von Studiendaten und Bioproben aus der NAKO Gesundheitsstudie bereitstellen. Funktionalitäten wie die Fallzahlbestimmung mit Studiendaten und Bioprobenkontextdaten aus verschiedenen Quellsystemen unter Einbeziehung einer Treuhandstelle sind neu. Die Anbindung der Treuhandstelle ist ein Erfordernis des Datenschutzes, damit zum Schutz der Teilnehmer unterschiedliche Quellensysteme mit separaten Pseudonymiserungsdomänen arbeiten können. Durch die Fallzahlbestimmung bei Bioproben kann zukünftig eine noch bessere Antragsplanung bei kostenintensiven Bioprobenanalysen erfolgen. Noch nicht implementiert sind hingegen unterschiedliche Algorithmen, wie eine Auswahl von Untermengen verfügbarer Bioproben erfolgen kann, z.B. nach Stratifizierung, nach Anzahl verfügbarer Bioproben oder nach Qualitätskriterien.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
German National Cohort (GNC) Consortium. The German National Cohort: aims, study design and organization. Eur J Epidemiol. 2014 May;29(5):371-382.