gms | German Medical Science

HEC 2016: Health — Exploring Complexity
2016 Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

28.08. - 02.09.2016, München

Überlebenszeitanalysen in CARESS: Hin zu klinischen Krebsregistern

Meeting Abstract

  • David Korfkamp - OFFIS - Institut für Informatik, Oldenburg, Deutschland
  • Eunice Sirri - Epidemiologisches Krebsregister Niedersachsen (EKN), Oldenburg, Deutschland
  • Joachim Kieschke - Epidemiologisches Krebsregister Niedersachsen (EKN), Oldenburg, Deutschland
  • Stefan Gudenkauf - OFFIS - Institut für Informatik, Oldenburg, Deutschland
  • Kolja Blohm - OFFIS - Institut für Informatik, Oldenburg, Deutschland

HEC 2016: Health – Exploring Complexity. Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI. München, 28.08.-02.09.2016. Düsseldorf: German Medical Science GMS Publishing House; 2016. DocAbstr. 376

doi: 10.3205/16gmds034, urn:nbn:de:0183-16gmds0347

Published: August 8, 2016

© 2016 Korfkamp et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Hintergrund: CARESS ist ein analytisches Informationssystem, das seit 1993 am Informatikinstitut OFFIS in Zusammenarbeit mit dem epidemiologischen Krebsregister Niedersachsen entwickelt wird. Ein Fokus der Entwicklung liegt darauf, Anwender ohne Datenbank- und R-Kenntnisse in die Lage zu versetzen, die in der Krebsepidemiologie benötigten Verfahren effizient anzuwenden. Neben Standardvisualisierungen für Maßzahlen werden Spezialverfahren für die Krebsepidemiologie unterstützt, beispielsweise kleinräumige Clusteranalysen oder Überlebenszeitanalysen auf multidimensionalen Data Warehouses (DWHs). Letztere basieren dabei auf dem verbreiteten R-Paket periodR [1]. Vor dem Hintergrund der klinischen Krebsregister, die derzeit nach und nach in Deutschlands Bundesländern implementiert werden [2], haben wir die Überlebenszeitanalyse in CARESS erweitert, um in Zukunft die Anforderungen der klinischen Krebsregister ebenfalls abzudecken.

Methoden: Hierfür haben wir die bereits vorhandene Integration des Kaplan-Meier-Verfahrens zur Berechnung von Überlebensraten erweitert. CARESS greift hierzu auf Methoden aus dem survival-R-Paket zur Berechnung von Überlebenszeitanalysen [3] zurück. Um diese Funktionen ansteuern zu können, ruft CARESS vorab die notwendigen Daten aus einem multidimensionalen DWH ab, bereitet diese auf, so dass sie von der R-Funktion interpretiert werden können und stellt die Ergebnisse der Berechnung grafisch dar. Hierbei unterstützt CARESS neben der Berechnung einfacher Datensätze auch eine Gruppierungsfunktion, mit der Kaplan-Meier-Kurven für unterschiedliche Gruppen (z.B. Diagnoseklassen, Wohnorte etc.) berechnet und hinterher deren Unterschiedlichkeit mittels eines Log-Rang-Tests [4] untersucht werden kann. Die abzurufenden Daten werden vorab vom Anwender definiert, wobei er von der komfortablen Bedienungsoberfläche unterstützt wird. Anwender können so die zu untersuchenden Datenräume über Datenbank-Dimensionen festlegen, um beispielsweise nur bestimmte Diagnosen einfließen zu lassen, DCO-Fälle auszuschließen, die Analyse nur für Tumoren in einem bestimmten Stadium durchzuführen, und vieles mehr. Für die Definition der Zeiträume existieren spezielle Filter, die den Anwender bei der Einschränkung der Diagnose- und Sterbezeiträume der Patienten unterstützen.

Ergebnisse: Durch die Erweiterung von CARESS haben Anwender ein Werkzeug, mit dessen Hilfe sie einfach Kaplan-Meier-Kurven über multidimensionale Datenbestände berechnen können. Wird die Gruppierungsfunktion verwendet, werden die unterschiedlichen Gruppen abschließend einem Log-Rang-Test unterzogen, dessen Ergebnis die Anwender heranziehen können, um zu entscheiden, ob statistisch signifikante Unterschiede zwischen den Überlebensraten der Gruppen bestehen. Diese Integration bietet unterschiedliche Vorteile für die Anwender. Zum einen setzt CARESS keinerlei technische Kenntnisse voraus –weder in der Abfrage von Daten aus einem DWH, noch in der Handhabung der Statistiksoftware R – da diese Zugriffe von CARESS automatisiert werden. Zum anderen ist durch die Automatisierung dieser Schritte eine geringere Fehleranfälligkeit gegenüber der manuellen Durchführung direkt mit R gewährleistet. Typische Fehler, die beispielsweise bei einer manuellen Zeitraumauswahl auftreten, wie z.B. das Nicht-Einschließen von Patienten mit unbekanntem Sterbedatum (also Patienten, die noch nicht verstorben sind), treten in dieser Lösung nicht auf, da CARESS darauf achtet, diese zu berücksichtigen. Zudem wird durch den hohen Grad an automatisierten Schritten Zeit im Gesamtprozess gespart, von der Datenauswahl bis zur Ergebnisvisualisierung.

Zusammenfassung: In den vorangegangenen Abschnitten haben wir unsere Integration von Überlebenszeitanalysen nach Kaplan-Meier mit optional gruppierten Daten und einem Log-Rang-Test vorgestellt. Dies stellt den ersten Schritt einer Erweiterung von CARESS hin zur Unterstützung von klinischen Krebsregistern dar. Es ist geplant, diesen Ausbau durch die Integration weiterer Verfahren (z.B. Poisson-Regression für Periodenanalysen, Zeitreihenanalysen, Prävalenzberechnung) voranzutreiben.


Literatur

1.
Holleczek B, Gondos A, Brenner H. periodR–an R Package to Calculate Long-term Cancer Survival Estimates Using Period Analysis. Methods Inf Med. 2009; 48: 123-128.
2.
GKV. Klinische Krebsregister. https://www.gkv-spitzenverband.de/krankenversicherung/qualitaetssicherung_2/klinisches_krebsregister.jsp, besucht am 10.03.2016 External link
3.
survival: Survival Analysis. https://cran.r-project.org/web/packages/survival/index.html, besucht am 10.03.2016 External link
4.
Ziegler A, Lange S, Bender R. Überlebenszeitanalyse: Der Log-Rang-Test. Dtsch Med Wochenschr. 2007; 132: e39–41.