gms | German Medical Science

62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

17.09. - 21.09.2017, Oldenburg

Batch-Erzeugung von HL7 CDA Testdaten

Meeting Abstract

Search Medline for

  • Volker Thiemann - Carl von Ossietzky Universität, Oldenburg, Deutschland
  • Tingyan Xu - Carl von Ossietzky Universität, Oldenburg, Deutschland
  • Rainer Röhrig - Carl von Ossietzky Universität, Oldenburg, Deutschland
  • Raphael W. Majeed - Carl von Ossietzky Universität, Oldenburg, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Oldenburg, 17.-21.09.2017. Düsseldorf: German Medical Science GMS Publishing House; 2017. DocAbstr. 278

doi: 10.3205/17gmds162, urn:nbn:de:0183-17gmds1628

Published: August 29, 2017

© 2017 Thiemann et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Im Projekt AKTIN [1], [2], [3] werden über eine REST-Schnittstelle CDA-Dokumente (Clinical Document Architecture, Release 2) [4] mit Notaufnahme-Daten in i2b2-Data Warehouses importiert. Für Softwaretests während des Entwicklungsprozesses werden viele, möglichst inhaltlich sinnvolle Beispieldokumente benötigt. Dies gilt insbesondere wenn Berichts-Funktionen getestet werden sollen, die nur mit entsprechend großen Datensätzen sinnvolle Ausgaben liefern.

Die Anforderung an realistische Inhalte ist abhängig vom konkreten Testszenario und kann von reinen Zufallswerten über definierte Verteilungen bis hin zur Kombinationen von Ausprägungen (z. B. kurze Wartezeit und lange Behandlungszeit bei kritischen Behandlungsfällen, wie etwa kardiologischen Notfällen) reichen, falls dahingehende Berechnungen von Kennzahlen o. ä. getestet werden sollen.

Die originalen CDA-Dokumente der teilnehmenden Kliniken enthalten viele identifizierende Daten. Es wäre nur mit aufwendigen Anonymisierungs-Schritten, die innerhalb der behandelnden Einrichtung ausgeführt werden müssten, möglich auf echte Daten zurückzugreifen. Es ist zwar möglich anonymisierte Teildatensätze zu bekommen, aber aus den genannten Gründen ist ein Rückgriff auf die originalen CDA-Dokumente, die aber zum Import benötigt würden, nicht praktikabel. Auch das manuelle oder automatisierte Anpassen von artifiziellen Testdokumenten (z. B. per Suchen & Ersetzen) stößt bei komplexeren Anforderungen an Grenzen.

Methoden: Ausgehend von einem CDA-Template legen wir fest, welche Informationen für den Test benötigt werden. Für jedes dieser Items (z. B. Aufnahmezeitpunkt, Diagnose oder Entlassungsart) wird dann ein Datenauszug mit realistischer Verteilung in einer CSV-Datei hinterlegt. Zusätzlich wird eine Zeitspanne vorgegeben, um die alle Zeitstempel verschoben werden. Aus diesen Vorgaben werden automatisiert beliebig viele CDA Dokumente erzeugt und per REST-Schnittstelle in eine Test-Installation der AKTIN-Software (basierend auf i2b2) importiert.

Das Verfahren basiert auf einem Shell-Script, das für die Ersetzung der zufällig aus der CSV-Datei ausgewählten Werte XSL-Scripte aufruft. Die XSL-Transformationen ersetzen über XPath Ausdrücke die relevanten Informationen, verschieben die Zeitstempel und setzen neue IDs.

Zusätzlich zum Ablegen der CDA-Dokumente als Datei importiert das Script die Dateien auch direkt über eine REST-Schnittstelle in das Notaufnahme Data Warehouse.

Ergebnisse: Der Datengenerator erzeugt innerhalb von wenigen Sekunden das monatliche Datenaufkommen einer grösseren Notaufnahme der AKTIN-Projektkliniken (ca. 7000 CDA Dokumente). Diese werden anschließend über eine REST-Schnittstelle in das Data Warehouse importiert. Durch das gleichverteilte Ziehen der Werte (z. B. Entlassdiagnosen) aus einer vorgegebenen Stichprobe, wird die Verteilung der Vorgabe erhalten. Damit können beim Test von Auswertungs- und Reportingfunktionen neben Belastungstests auch inhaltliche Plausibilitätsprüfungen unabhängig von der Anzahl der generierten Dokumente umgesetzt werden, da die Auswertungen innerhalb statistischer Schwankungen gleiche Ergebnisse liefern.

Diskussion: Aufgrund von umfangreichen Inhaltsprüfungen, Pflichtfeldern, zeitlicher Zusammenhänge etc. ist die Generierung eines einzelnen Datensatzes komplex. Für den AKTIN-Notaufnahmedatensatz gibt es eine Vielzahl von Constraints, die als Schematron-Regeln umgesetzt sind und beim Import in das DWH geprüft werden. Andererseits müssen als Testfall häufig nur wenige, ganz spezifische Daten vorgegeben bzw. variiert werden. Unter diesen Umständen ist der gewählte Ansatz weniger aufwendig in der Programmierung als ein alternativer, konstruktiver Aufbau des CDA-Dokuments aus Textbausteinen.

Die entwickelten XSL-Scripte sind generisch aufgebaut und können einfach auf die benötigten Items zugeschnitten werden. Somit ist der Ansatz erweiterbar und grundsätzlich auch übertragbar auf andere Projekte, die mit ähnlich strukturierten XML-Dokumenten arbeiten.

Das Projekt wird vom BMBF finanziert (Förderkennzeichen 01KX1319B)



Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Ahlbrandt J, Brammen D, Majeed RW, Lefering R, Semler SC, Thun S, Walcher F, Röhrig R. Balancing the need for big data and patient data privacy--an IT infrastructure for a decentralized emergency care research database. Stud Health Technol Inform. 2014;205:750-4.
2.
Kulla M, Röhrig R, Helm M, Bernhard M, Gries A, Lefering R, Walcher F. Nationaler Datensatz "Notaufnahme": Entwicklung, Struktur und Konsentierung durch die Deutsche Interdisziplinäre Vereinigung für Intensivmedizin und Notfallmedizin. Der Anaesthesist. 2014;63(3):243–52.
3.
Brammen D, Dewenter H, Thiemann V, Majeed RW, Xu T, Heitmann KU, Walcher F, Thun S, Röhrig R. Disseminating a Standard for Medical Records in Emergency Departments among Different Software Vendors using HL7 CDA. In: gmds 2017 (accepted)
4.
Dolin RH, Alschuler L, Boyer S, Beebe C, Behlen FM, Biron PV, Shabo Shvo A. HL7 Clinical Document Architecture, Release 2. Journal of the American Medical Informatics Association : JAMIA. 2006;13(1):30–9.