gms | German Medical Science

GMDS 2015: 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

06.09. - 09.09.2015, Krefeld

Interoperabilität in der klinischen Forschung: Transformation zwischen IBM SPSS und CDISC ODM

Meeting Abstract

Search Medline for

  • Philipp Bruland - Universität Münster, Münster, Deutschland
  • Martin Dugas - Universität Münster, Münster, Deutschland

GMDS 2015. 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Krefeld, 06.-09.09.2015. Düsseldorf: German Medical Science GMS Publishing House; 2015. DocAbstr. 237

doi: 10.3205/15gmds099, urn:nbn:de:0183-15gmds0995

Published: August 27, 2015

© 2015 Bruland et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Für die Zulassung von Medikamenten, neuen Therapien oder anderen Forschungsfragestellungen werden meist große klinische Studien mit einem erheblichen Dokumentationsaufwand durchgeführt. In diesem Kontext spielen elektronische Datenerfassungssysteme (EDC = Electronic Data Capture) eine entscheidende Rolle zur zentralen und zeitnahen Datenerfassung. Im akademischen oder anderen Forschungsumfeld wird für eigens initiierte Studien und Fragestellungen oft Tabellenkalkulations-Software für die Dokumentation verwendet. Großer Vorteil dieser Software ist es, dass eine Dokumentationsbasis für überschaubare Datenmengen mit geringem Aufwand erstellt ist. Hinzu kommen ihre weite Verbreitung sowie geringe Anschaffungs- und Schulungskosten. Nichtsdestotrotz bergen Systeme wie Microsoft Excel, LibreOffice oder IBM SPSS einige Nachteile: Diese Dokumente sind oft lokal oder auf Netzlaufwerken abgelegt und erlauben somit keinen gemeinsamen Zugriff sowie paralleles Arbeiten. Dies führt meistens dazu, dass von einer Datei mehrere Versionen existieren, die oft nur mühselig wieder zusammengeführt werden können. Des Weiteren birgt die Nutzung Probleme mit der Datensicherheit in Bezug auf verlorene Daten, Zugriffsberechtigungen und Nachvollziehbarkeit. Dies bedeutet, dass Änderungen an Werten, der Vorherige Wert, der Grund für die Änderung oder der jeweilige Benutzer und ein Zeitstempel in der Regel nicht hinterlegt sind. Zudem sind Backups oft nur durch Sicherungskopien der Datei möglich. Dem hingegen sind EDC-Systeme in der Regel an zentraler Stelle installiert, bieten Backup-Strukturen sowie parametrierbare Rollen- und Rechte-Verwaltung für Nutzer. Im Gegensatz zu Tabellenkalkulationsprogrammen unterstützen EDC-Systeme den logischen Ablauf klinischer Studien wie zeit- oder eventgesteuerte Ereignisse.

Die meisten Pharmafirmen setzen EDC-System zur Datenerfassung in ihren klinischen Studien ein. Die Großzahl der eingesetzten EDC-Systeme ermöglicht die Verarbeitung des ODM (Operational Data Model) [1] Standards der CDISC (Clinical Data Interchange Standards Consortium), welches ein weltweit anerkannter Standard zur Definition, Kommunikation und Archivierung von Metadaten sowie klinischen Daten von Studien ist [2].

Nicht selten kommt es vor, dass Förderungen auslaufen, die Datenerhebung von einer größeren Anzahl von Teilnehmern bzw. multizentrisch geschehen sollen oder die zugrundeliegende Datenbank ersetzt werden soll. Daher ist es Ziel dieser Arbeit, die Konvertierung von tabellenbasierten Formaten hinzu ODM zu realisieren. Hierfür haben wir uns dazu entschlossen das IBM SPSS Format als Quelle zu verwenden, da es neben den klinischen Werten ebenfalls die Ausprägungen der Variablen inklusive Wertelisten enthalten kann. Zusätzlich soll durch eine Evaluation geprüft werden, ob die Konvertierung fehlerfrei arbeitet oder Lücken aufweist.

Material und Methoden: Zur Implementierung des Konvertierungsalgorithmus wurden die Spezifikationen des IBM SPSS-Formats sowie die des CDISC ODM-Standards analysiert und eine Transformations-Matrix erstellt.

Da es ist bei SPSS um ein Binärformat handelt, lässt sich dieses ohne größeren Aufwand nur mittels eines API (Application Programming Interface) verarbeiten. SPSS bietet in diesem Kontext ab Version 21 bereits eine Java-Klasse namens „SpssJavaPlugin“, welche lesenden und schreibenden Zugriff auf SPSS-Dateien ermöglicht. Diese erfordert lediglich eine lizensierte Kopie des Programms auf dem Computer, auf dem die Software mit der Bibliothek ausgeführt werden soll. Dies hat zum Vorteil, dass die Bibliothek direkt von IBM entwickelt und unterstützt wird und aktuellste Änderungen am SPSS-Format direkt umgesetzt werden.

ODM ist ein XML-basiertes Format zur Definition Datenerfassungsbögen klinischer Studien. Darüber hinaus bietet es die Möglichkeit, neben Benutzern und Standorten auch die klinischen Daten zu den Studienpatienten zu speichern. Die typische Metadatenstruktur einer ODM-Datei ist hierarchisch in Protokolle, Studienereignisse, Formulare, Item-Gruppen, Items und Code-Listen aufgebaut.

Für die Entwicklung wurde sich für ein konsolenbasiertes Programm auf Java Basis entschieden.

Zur Evaluation wurden sieben SPSS-Dateien mit unterschiedlichster Komplexität identifiziert, die von 34 – 426 Datenelemente und bis zu 3522 Patienten beinhalteten. Diese wurden konvertiert und zur Validierung sowie Darstellung ins Portal Medizinischer-Datenmodelle [3] geladen. Die konvertierten Dateien mit klinischen Daten wurden zusätzlich in unser in-house entwickeltes x4T-EDC-System [4] eingeladen, wessen Basis das ODM-Format ist, dass zur Erstellung der Dokumentationsgrundlage verwendet wird.

Ergebnisse: Basierend auf der Transformations-Matrix ist ein Konverter auf Kommandozeilen-Basis entwickelt worden. Dieser nimmt als Input IBM SPSS Daten ab der Version 21 entgegen. Werden dem Konverter keine weiteren Parameter übergeben, resultiert automatisch eine XML-ODM-Datei als Output mit allen verfügbaren Meta- und klinischen Daten. Bei SPSS handelt es sich um eine flache Liste und so werden für die Metadaten standardmäßig im ODM-Export die Elemente „Protocol“, „StudyEvent“, „Form“, und „ItemGroup“ automatisch hinzugefügt. Variablen aus SPSS werden als „ItemDef“ abgebildet und Wertelisten als „CodeList“ in die ODM-Struktur hinzugefügt. Datentypen lassen sich problemlos konvertieren, außer beim Datum muss darauf geachtet werden, dass dieses in das XML-Datumsformat umgewandelt wird.

Bei den klinischen Daten wird immer davon ausgegangen, dass es sich in der SPSS-Datei um eine Zeile pro Patient handelt, da es in ODM auch nur ein „SubjectData“-Element für einen eindeutigen Patientenschlüssel geben kann. Als Parameter kann angegeben werden wie die Variable lautet, die den Patienten identifiziert. Diese wird nicht als Element in ODM übernommen sondern als „SubjectKey“ zur Identifizierung des Patienten eingesetzt. Wird dieser Parameter nicht angegeben, zählt der Konverter die Zeilen durch.

Als weitere Parameter können angegeben werden, ob nur die Metadaten oder ebenfalls die klinischen Daten konvertiert werden sollen und, um welche Sprache es sich in der SPSS-Datei handelt, damit diese korrekt in ODM vermerkt werden kann.

Für die Ausrichtung des Textes, das Maß der Variable, fehlende Werte und die Rolle gibt es keine Entsprechungen in ODM und werden somit nicht konvertiert.

Die Evaluation hat ergeben, dass alle Datentypen, Wertelisten und Werte korrekt konvertiert worden sind. Ebenso konnte die erzeugte ODM-Datei problemlos in das x4T-EDC-System eingeladen und auf die gewohnte Struktur zugegriffen werden.

Diskussion: Die Konvertierung zwischen SPSS als tabellen-Format und CDISC ODM ist technisch möglich. Mit der Einschränkung, dass es nur ein Formular pro SPSS-Datei geben kann und bei dieser im Vorfeld sichergestellt sein muss, dass alle Daten eines Patienten in einer Zeile stehen. Um zukünftig mit Verlaufswerten umgehen zu können, soll der Konverter dahingehend weiterentwickelt werden, dass mehrere Zeilen pro Patient möglich sind bzw. Indikatorvariablen angegeben werden können.


Literatur

1.
CDISC ODM. http://www.cdisc.org/odm [Letzter Zugriff: März 2015] External link
2.
Kuchinke W, Aerts J, Semler SC, Ohmann C. CDISC standard-based electronic archiving of clinical trials. Methods Inf Med. 2009;48(5):408-13.
3.
Breil B, Kenneweg J, Fritz F, Bruland P, Doods D, Trinczek B, Dugas M. Multilingual Medical Data Models in ODM Format: A Novel Form-based Approach to Semantic Interoperability between Routine Healthcare and Clinical Research. Appl Clin Inform. 2012 Jul 11;3(3):276-89.
4.
Bruland P, Forster C, Dugas m. x4T-EDC: A Prototype for Study Documentation Based on the Single Source Concept. In: Mantas J, et al, eds. 24th International Conference of the European Federation for Medical Informatics Quality of Life through Quality of Information – MIE2012 / CD / Short Communications (Oral). 2012.