gms | German Medical Science

62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

17.09. - 21.09.2017, Oldenburg

Was steckt im KIS? Automatische Generierung eines intelligenten klinischen Metadaten Registers zur Identifizierung von Datenelementen und zum Zugriff auf medizinische Informationssysteme

Meeting Abstract

Search Medline for

  • Philipp Bruland - Westfälische Wilhelms-Universität Münster, Münster, Deutschland
  • Michael Storck - Westfälische Wilhelms-Universität Münster, Münster, Deutschland
  • Martin Dugas - Westfälische Wilhelms-Universität Münster, Münster, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Oldenburg, 17.-21.09.2017. Düsseldorf: German Medical Science GMS Publishing House; 2017. DocAbstr. 246

doi: 10.3205/17gmds150, urn:nbn:de:0183-17gmds1503

Published: August 29, 2017

© 2017 Bruland et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Metadaten-Register stellen Informationen über Struktur und Aufbau von IT-System-Inhalten zur Verfügung. Insbesondere pharmazeutische Unternehmen oder klinische Forschungsorganisationen verfügen über unterschiedliche Metadaten-Systeme, um Datenelemente in Case Report Forms (CRFs) zu strukturieren und harmonisieren [1], [2]. Wiederverwendung und Auswertbarkeit solcher CRFs für klinische Studien und andere Forschungsvorhaben werden immer bedeutender. Zudem spielt im Forschungskontext das Auffinden von Datenelementen in diversen medizinischen Informationssystemen eine wichtige Rolle, um diese für Sekundärzwecke wie Qualitätssicherung oder Forschungsfragestellungen wiederzuverwenden [3], [4], [5]. Diesbezüglich spielt die Datenqualität solcher Daten eine bedeutende Rolle.

Allerdings gehen aktuell sowohl Such- und Exportprozesse als auch die Bewertung von Datenqualität medizinischer Daten mit immensen manuellen Aufwänden einher. Daher ist es Ziel dieser Arbeit, ein intelligentes klinisches Metadaten-Register zu entwickeln, welches die automatische Generierung und Synchronisation von Metadaten und Strukturinformationen aus medizinischen Informationssystemen ermöglicht.

Methoden: Zum Aufbau des klinischen Metadaten-Registers wurden unterschiedliche Metadaten-Modelle auf ihre Struktur analysiert, wie z.B. ISO/IEC 11179-3:2013, openEHR, Clinical Element Models und CDISCs Operational Data Model (ODM) [6], [7], [8], [9]. Auf Basis dessen wurde ein generisches Metadaten Modell entwickelt, um systemspezifische Informationen, elektronische Dokumentationsbögen (Formulare), Datenelemente und Wertelisten abzubilden sowie relevante Parameter für die automatische Ermittlung der Datenqualität und den Export von Patientendaten zu hinterlegen. Zusätzlich wurden Möglichkeiten geschaffen, semantische Annotationen für sämtliche Entitäten abzuspeichern. Das Metadaten-Register wurde in Java entwickelt und verwendet eine MySQL-Datenbank.

Datenbankmodelle der meisten Systeme sind heterogen, wodurch ein generischer und universeller Ansatz zur Extraktion von Meta-Informationen notwendig ist. Daher wurden unterschiedliche Schematransformationsansätze in Betracht gezogen [10]. Hierfür wurde das ETL (Extraktion, Transformation, Load) Tool Talend Open Studio verwendet [11], welches unterschiedliche Datenbank-Konnektoren sowie Transformationswerkzeuge beinhaltet.

Die Machbarkeit dieser Anwendung wurde mit Daten von drei Primärsystemen von zwei Standorten getestet. Zum einen wurden sämtliche Formular-Metadaten von zwei Agfa ORBIS-Instanzen und zum anderen von GE Healthcare Centricity Perinatal verwendet.

Ergebnisse: Als zugrundeliegendes Modell wurde der ISO/IEC 11179-3:2013 Standard verwendet. Aus historischen Gründen werden in den meisten Krankenhausinformationssystemen Daten formular-basiert erfasst, weshalb das Modell um Systeme und Formulare erweitert wurde. Semantische Annotationen können für sämtliche Entitäten im Modell gespeichert werden.

Die Pipeline zur Metadatenintegration ist schrittweise aufgebaut und importiert zuerst die System-Spezifikationen, dessen Formulare (falls zutreffend) und dann enthaltende Datenelemente sowie zugehörige Wertelisten. Falls semantische Annotationen vorhanden sind, lassen sich diese ebenfalls übertragen. Substantiell ist, dass alle Entitäten mit Datenbankparametern abgelegt werden, um auf Basis derer und weiterer Strukturinformationen automatische Datenabfragen zu erzeugen.

Die Machbarkeit des Ansatzes wurde erfolgreich an 3 Systemen erprobt die in Summe 16230 Formulare mit insgesamt 310519 Datenelementen beinhalten.

Diskussion: Die automatische Erzeugung und Synchronisation eines standortspezifischen klinischen Metadaten-Registers ist realisierbar und generiert einen gemeinsamen Metadatenpool. Zudem fördert es die Identifizierung und Bewertung einzelner Datenelemente sowie die Wiederverwendung für Sekundärzwecke; vgl. Mate et al. [4]. Durch Schematransformation weniger relevanter Datenbanktabellen sind die Erstellungsauffände des Metadaten-Registers auf ein Minimum reduziert worden, insbesondere bei der Synchronisierung des Metadatenbestandes, welche automatisch geschieht.

Zukünftige Arbeiten betreffen die Schematransformation, für welches Qualitätsrichtlinien erarbeitet werden sollen. Durch die fehlenden semantischen Annotationen in den meisten medizinischen Informationssystemen soll die Annotation durch (semi-)automatische Ansätze unterstützt werden.



Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Dugas M. Design of case report forms based on a public metadata registry: re-use of data elements to improve compatibility of data. Trials. 2016 Nov 29;17(1):566.
2.
Kuchinke W, Aerts J, Semler SC, Ohmann C. CDISC standard-based electronic archiving of clinical trials. Methods Inf Med. 2009;48(5):408-13.
3.
Dziuballe P, Forster C, Breil B, Thiemann V, Fritz F, Lechtenbörger J, Vossen G, Dugas M. The single source architecture x4T to connect medical documentation and clinical research. Stud Health Technol Inform. 2011;169:902-6.
4.
Mate S, Köpcke F, Toddenroth D, Martin M, Prokosch HU, Bürkle T, Ganslandt T. Ontology-based data integration between clinical and research systems. PLoS One. 2015 Jan 14;10(1):e0116656.
5.
De Moor G, Sundgren M, Kalra D, Schmidt A, Dugas M, Claerhout B, Karakoyun T, Ohmann C, Lastic PY, Am-mour N, Kush R, Dupont D, Cuggia M, Daniel C, Thienpont G, Coorevits P. Using electronic health records for clinical research: the case of the EHR4CR project. J Biomed Inform. 2015 Feb;53:162-73.
6.
ISO/IEC 11179-3:2013, Information Technology – Metadata Registries (MDR) - Part 3: Registry metamodel and basic attributes.
7.
Kalra D, Beale T, Heard S. The openEHR Foundation. Stud Health Technol Inform. 2005;115:153-73.
8.
Coyle JF, Mori AR, Huff SM. Standards for detailed clinical models as the basis for medical data exchange and decision support. Int J Med Inform. 2003 Mar;69(2-3):157-74.
9.
Clinical Data Interchange Standards Consortium: Operational Data Model (ODM). http://www.cdisc.org/odm Letzter Zugriff: April 2017 External link
10.
Rahm E, Bernstein PA. A Survey of Approaches to Automatic Schema Matching. The VLDB Journal. 2001 Dec;10(4):334-350.
11.
Talend Open Studio for Data Integration. http://www.talend.com/products/data-integration Letzter Zugriff: April 2017. External link