gms | German Medical Science

GMS Medizinische Informatik, Biometrie und Epidemiologie

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS)

ISSN 1860-9171

Untersuchung der Datenvollständigkeit im Vorfeld der Sekundärdatenanalyse am Beispiel der wissenschaftlichen Nutzung hausärztlicher Behandlungsdaten

Investigation of data completeness prior to secondary data analysis using the example of scientific use of primary care physician’s treatment data

Originalarbeit

  • corresponding author Falk Schlegelmilch - Universitätsmedizin Göttingen, Institut für Allgemeinmedizin, Göttingen, Deutschland
  • Eva Hummers - Universitätsmedizin Göttingen, Institut für Allgemeinmedizin, Göttingen, Deutschland
  • Iris Demmer - Universitätsmedizin Göttingen, Institut für Allgemeinmedizin, Göttingen, Deutschland

GMS Med Inform Biom Epidemiol 2020;16(1):Doc01

doi: 10.3205/mibe000204, urn:nbn:de:0183-mibe0002049

Published: February 14, 2020

© 2020 Schlegelmilch et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Behandlungsdaten niedergelassener Hausärztinnen tragen ein großes Potenzial für die Erforschung von Diagnostik, Therapie und Versorgungsqualität. Die Qualität dieser Daten beeinflusst nicht nur die primären Forschungsergebnisse, sondern auch Ergebnisse späterer Sekundärdatenanalysen, jedoch dann für andere Forschungsfragen. Vollständigkeit und Verfügbarkeit der Daten zum Zeitpunkt der Datenerhebung sind wichtige Qualitätsmerkmale, die von der ärztlichen Dokumentation und dem technischen Datenexport abhängen. Am Beispiel von hausärztlichen Behandlungsdaten untersuchen wir diese Qualitätsmerkmale und schlagen eine Vorgehensweise für eine kontinuierliche Qualitätssicherung vor.

Methodik: Eine fiktive Patientin wurde mit 22 Merkmalen einer hausärztlichen Behandlung definiert (z.B. Alter, Geschlecht, Medikamente, Diagnosen, Risikofaktoren, Arbeitsunfähigkeit, Therapien, Krankenhauseinweisung). Ohne vorheriges Training wurden die Daten der fiktiven Patientin von Hausärztinnen elektronisch dokumentiert und exportiert. Soll-Ist-Vergleiche zwischen fiktiven Patientendaten, den elektronisch von Ärztinnen dokumentierten Daten sowie den exportierten Daten ermöglichten die Einschätzung der Datenvollständigkeit und -verfügbarkeit.

Ergebnisse: Zirka 80% der gestellten Aufgaben konnte ohne ärztliches Training absolviert werden. Exemplarische Untersuchungen mit sechs Praxissoftwaresystemen zeigen, dass ohne Softwareanpassung und ärztliche Schulung aber nur ca. 37% der eingegebenen Behandlungsdaten im Datenexport für die sekundäre Forschung verfügbar sind. Eine Steigerung auf 83,4% Verfügbarkeit wäre durch Softwareanpassungen möglich. Würden darüber hinaus noch ärztliche Schulungen durchgeführt, könnte eine Datenverfügbarkeit von ca. 95% erreicht werden.

Diskussion: Mit fehlenden oder falsch abgebildeten Daten muss im Datenexport im Vorfeld einer Sekundärforschung gerechnet werden. Die Datenvollständigkeit und -verfügbarkeit muss bereits bei der primären Datenerhebung einzeln für jede Praxissoftware getestet und in den Metadaten der Forschungsdaten dokumentiert werden. Fiktive Patientendaten mit definierten Merkmalen können zur kontinuierlichen Qualitätssicherung auch bei quartalsweisen Softwareupdates eingesetzt werden.

Schlussfolgerungen: Eine unabhängige, kontinuierliche Qualitätssicherung der Datenschnittstellen, ärztliche Schulungen und Untersuchungen zur Datenvollständigkeit von Routine- und Behandlungsdaten können die Qualität der nachfolgenden Sekundärdatenforschung deutlich verbessern.

Schlüsselwörter: Datenqualität, Dokumentation, Praxisverwaltungssystem, Hausärzte, Gesundheitsforschung, Sekundärnutzung

Abstract

Background: Treatment data from general practitioners (GP) in private practice have great potential for research into diagnostics, therapy and quality of care. The quality of these data influences not only the primary research results, but also the results of later secondary data analyses, but then for other research questions. Completeness and availability of data at the time of data collection are important quality characteristics that depend on medical documentation and technical data export. Using GP treatment data as an example, we examine these quality characteristics and propose a procedure for continuous quality assurance.

Methods: A fictitious patient was defined with 22 treatment characteristics of routine general practitioners treatment (e.g. age, gender, medication, diagnoses, risk factors, inability to work, therapies, hospitalization, etc.). Without prior training, the data of the fictitious patient were electronically documented and exported by general practitioners. Comparisons between fictitious patient data, data documented electronically by general practitioners and exported data enabled the assessment of data completeness and availability.

Results: Approximately 80% of the tasks could be completed without medical training. Exemplary studies with six practice software systems show that without software adaptation and medical training, only approx. 37% of the treatment data entered is available for secondary research in data export. An increase to 83.4% availability would be possible through software adaptations. If, in addition, medical training were carried out, a data availability of approx. 95% could be achieved.

Discussion: Missing or incorrectly mapped data must be reckoned with in the data export prior to secondary research. The completeness and availability of the data must be tested individually for each practice software during the primary data collection and documented in the metadata of the research data. Fictitious patient data with defined characteristics can also be used for continuous quality assurance in quarterly software updates.

Conclusions: Independent, continuous quality assurance of the data interfaces, medical training and investigations into the completeness of routine and treatment data can considerably improve the quality of subsequent secondary data research.

Keywords: data quality, documentation, medical information system, general practitioner, health care research, secondary use


Hintergrund

Die Sekundärdatenforschung befasst sich mit der Analyse von Daten, die ursprünglich zu anderen Zwecken erhoben wurden [1] und nicht unbedingt mit der ursprünglichen Datenerhebung in Verbindung stehen müssen [2]. Medizinisch dokumentierte Routinedaten werden seit geraumer Zeit sekundär zu Zwecken der Versorgungsforschung genutzt [3]. Ebenso bietet die wissenschaftliche Nutzung hausärztlicher Behandlungsdaten das Potenzial, Inzidenz, Prävalenz, Diagnostik, Therapie und Verläufe von Erkrankungen zu erfassen [4] sowie die Versorgung quantitativ zu beschreiben, auswertbar und vergleichbar zu machen, z.B. hinsichtlich ihrer Qualität [5], [6].

Ein wesentlicher Aspekt der Sekundärdatennutzung ist, dass wissenschaftliche Forschungsfragen zum Teil erst nach der Datenerhebung formuliert werden, um diese Fragen anschließend mit Hilfe der zu einem anderen Zweck gesammelten Daten zu beantworten. Zuverlässige Aussagen aus der Erforschung der Sekundärdaten können nur bei einer hohen Datenqualität abgeleitet werden, weshalb die Datenqualität der ursprünglichen Datenerhebung die nachfolgende Sekundärdatenanalyse beeinflusst. Die Datenqualität von Behandlungs- und Routinedaten zur Nutzung in der medizinischen Forschung kann mit Hilfe von Informationsqualitätskriterien eingeschätzt werden [7]. Das Qualitätsmerkmal „Vollständigkeit“ der Daten ist dabei von grundlegender Bedeutung für die nachfolgenden Analysen [7]. Unvollständig erhobene Daten führen in sekundären Analysen zu Fehlinterpretationen oder erfordern einen zusätzlichen Aufwand, um die Daten nachträglich zu vervollständigen. Im Einklang mit Smeets et al. [8] können anonymisierte Forschungsdaten mit Hilfe der originären Datenquelle nicht mehr korrigiert oder ergänzt werden, weil die Rückführbarkeit auf die Patientin überhaupt nicht mehr möglich ist (vgl. dazu auch Erwägungsgrund 26 der EU-Datenschutzgrundverordnung [9]). Die Notwendigkeit einer Validierung von Sekundärdaten [10] sowie die begleitende Qualitätssicherung werden deshalb in Leitlinien für gute epidemiologische Praxis und Sekundärdatenanalyse gefordert [11], [12].

Die Datenqualität hausärztlicher Behandlungsdaten für die Nutzung in der Forschung ist wenig erforscht. Mit definierten MeSH-Terms (Medical Subject Heading Terms, MT, siehe Anhang 1 [Anh. 1]) findet man in PubMed ca. 4.179 Publikationen bei der Abfrage mit den MeSH-Terms „Hausarzt“ und „Forschung“ (MT4 [AND] MT5). Es finden sich keine Publikationen, wenn nach „Datenqualität“, „Dokumentation“ und „Hausarzt“ gesucht wird (MT1 [AND] MT2 [AND] MT4). Bei der Analyse von 47 Abstracts (11x MT1 [AND] MT4, 35x MT1 [AND] MT2 [AND] MT3, 1x MT1 [AND] MT2 [AND] MT5) konnten nur fünf Publikationen identifiziert werden, die sich mit Datenqualität bei der Dokumentation im hausärztlichen Kontext beschäftigen und in Verbindung mit der sekundären Beforschung dieser Daten stehen [8], [13], [14], [15], [16].

Mit der Datenerfassung von über 11,3 Millionen Patientinnen aus 674 Praxen in Großbritannien ist die Clinical Practice Research Datalink (CPRD) eine der größten Datenbanken mit anonymisierten medizinischen Aufzeichnungen weltweit [17]. Obwohl aus dieser Datenbank über 1.000 Forschungsstudien erstellt wurden, zeigten Sammon et al. beispielhaft die Unvollständigkeit in der CPRD-Forschungsdatenbank anhand des Rheumafaktors [13]. In 127.969 Testdatensätzen hatten 30,4% kein zugeordnetes Testergebnis, wobei ein Großteil dieser Daten als „missing not at random“ eingestuft wurde [13]. Im Primary Care Data Quality Programme aus Großbritannien wird einheitlich eine Software MIQUEST (Morbidity Information Query and Export Syntax) zur Datenextraktion aus den PVS genutzt [14]. Die Standardisierung der Abfragen im PVS sagt jedoch nichts über die Verfügbarkeit und Vollständigkeit der extrahierten Daten aus. In den Arbeiten von Smeets et al. [8] mit dem Julius General Practitioner’s Network (JGPN) wird die Korrektheit und Vollständigkeit der Daten nur abhängig gemacht von der systematischen Erfassung, dem Training der Ärztinnen und der einheitlichen Kodierung während der Arztkonsultation [8]. Technische Abbildungsprobleme wurden nicht als Ursache für unvollständige Daten in Betracht gezogen. Die Qualität routinemäßig erhobener Daten in elektronischen Patientenakten australischer Hausärzte ließ sich durch strukturierte Datenqualitätsberichte und Feedbacksitzungen mit den Praxisleiterinnen verbessern [15]. Die Genauigkeit und Vollständigkeit der Medikamentendokumentation in elektronischen Patientenakten kann verbessert werden, wenn die Benutzerfreundlichkeit der Praxissoftware verbessert wird und eine Schulung für Hausärztinnen stattfindet [16]. Dies konnten Hidema-van de Wal et al. am Beispiel des Registrierungsnetzwerkes Groningen mit den Medikamentengruppen Insulin, Trimethoprim, Kontrazeptiva und Betablockern zeigen. Nur mit gut strukturierten und genau kodierten Daten kann das Potenzial für die Forschung ausgeschöpft werden [16]. Ebenso in Australien untersuchten Ooi et al., wie sich eine ergänzende Dokumentation der Stationsapotheker hinsichtlich Medikamentenänderungen bei Krankenhausentlassung auswirkt [18]. Die Datengenauigkeit der Medikamenteninformationen wurde auch hier für Hausärztinnen verbessert.

Gesamt gesehen findet man im genannten Kontext kaum Untersuchungen zur Datenvollständigkeit. Unsere primäre Fragestellung befasst sich deshalb mit der Datenvollständigkeit zum Zeitpunkt der Datenerhebung, die später Einfluss auf die Forschungsergebnisse der Sekundärdatennutzung hat. Es soll untersucht werden, inwieweit die Datenvollständigkeit von der ärztlichen Dokumentation und der (software-)technischen Abbildung der Praxissoftware abhängig ist, wie man die Datenvollständigkeit testen und den Anteil effektiv nutzbarer Daten für die Sekundärdatenforschung abschätzen kann. Schließlich sollen die methodischen Untersuchungen aufzeigen, ob und wie man bei der Validierung dieser Daten vorgehen könnte und wie sich damit eine kontinuierliche Qualitätssicherung gestalten lässt.

Zur Beantwortung unserer Fragestellungen haben wir Hausärztinnen die nicht für die Forschung geschult wurden, gebeten, fiktive Patientendaten mit typischen hausärztlichen Behandlungsanlässen in ihrer jeweiligen Praxissoftware elektronisch zu dokumentieren. Mit dem Datenexport dieser fiktiven Patientendaten wurde der Beginn einer nachfolgenden Sekundärdatennutzung simuliert. Die Befragung der teilnehmenden Hausärztinnen bzgl. der elektronischen Dokumentation sowie die Auswertung der exportierten Daten ermöglichte uns die Einschätzung der Datenvollständigkeit für die Sekundärdatenanalyse.


Methodik

Design

Zur Beantwortung der primären Fragestellung wurde ein Testablauf entwickelt (Abbildung 1 [Abb. 1]). Eine fiktive Patientin mit definierten Patienten- und Behandlungsdaten bildet den Ausgangspunkt für die nachfolgende ärztliche und technische Abbildung im PVS. Diese enthält definierte Anforderungen an die Dokumentation, die später in wissenschaftlichen Untersuchungen genutzt werden sollen (z.B. Alter, Geschlecht, Dauerdiagnosen, Medikation, Therapien). Die Auswahl der Daten der fiktiven Patientin orientiert sich dabei an der routinemäßigen Dokumentation der Ärztinnen, die während der allgemeinärztlichen Behandlung auftreten. Die Behandlungsdaten dieser fiktiven Patientin werden den Ärztinnen nicht personell, sondern als Papierausdruck in verbaler Form vorgestellt und von den Ärztinnen in ihr jeweiliges PVS eingegeben. In dieser ärztlichen Abbildung der Behandlungsdaten kann untersucht werden, ob und wie Ärztinnen dokumentieren und wie häufig die gestellten Aufgaben im Routinebetrieb genutzt werden. Es kann abgeschätzt werden, ob Schulungsmaßnahmen für die Dokumentation erforderlich sind.

Im anschließenden (Einzel-)Datenexport wurden BDT-Dateien erzeugt (Behandlungsdatentransfer, BDT). Der BDT beschreibt in einer textbasierten Datei das gesamte in einer Arztpraxis gesammelte Datenmaterial der Behandlung für eine oder mehrere Patientinnen, gekennzeichnet durch Feldkennungen und -beschreibungen [19]. Das BDT-Format trägt das Potenzial, sich in einer neueren Version als interoperabler Standard für den medizinischen Datenaustausch im ambulanten Bereich zu etablieren [20]. In dieser technischen Abbildung wird untersucht, ob die eingegebenen Behandlungsmerkmale der fiktiven Patientin vollständig und richtig in der BDT-Datei abgebildet werden. Diese BDT-Datei ist Ausgangspunkt für die sekundäre Forschung.

Fiktive Patientin

Die fiktive Patientin enthält in unserem Untersuchungen 22 Merkmale/Feldkennungen (FK, Tabelle 1 [Tab. 1]). Beispielhaft wurden diese FKen mit inhaltlich zusammenhängenden medizinischen Werten belegt. Die Merkmale sind frei erfundene Behandlungsdaten aus der hausärztlichen Routine. Mit den FKen wird eine strukturierte Dokumentation angestrebt.

Datenerhebung für die ärztliche Abbildung

Im Qualitätszirkel „Hausärztliche Pharmakotherapie Göttingen“ wurde das Forschungsvorhaben zwölf Ärztinnen vorgestellt. Hier konnten ärztliche Teilnehmerinnen für die exemplarischen Untersuchungen gewonnen werden. Die Auswahl der untersuchten PVS richtete sich somit einerseits nach der Bereitschaft zur Teilnahme und Nutzung in den jeweiligen Praxen, andererseits nach den technischen Möglichkeiten des PVS, Behandlungsdaten im BDT-Format exportieren zu können. Die Ärztinnen wurden über das Forschungsvorhaben in einem Qualitätszirkel oder direkt in der Praxis umfassend informiert, erklärten sich schriftlich einverstanden, an der Untersuchung teilzunehmen, und stimmten der Nutzung der Ergebnisse durch die Autoren für wissenschaftliche Zwecke und Publikationen zu. Es wurde darüber aufgeklärt, dass es sich nicht um reelle Patientendaten handelt, diese Daten nicht in die Abrechnung eingehen dürfen und die Auswertung anonym erfolgt (kein Rückschluss auf die Ärztinnen). Eine explizite Einwilligung im Sinne des Datenschutzes war nicht nötig, da die Daten der fiktiven Patientin keiner real existierenden Person zugeordnet werden können. Auch eine „Patienteneinwilligung“ war daher nicht nötig.

In einzelnen Aufgaben wurden die Ärztinnen gebeten, Diagnosen, Therapien, Rezepte, Über- und Einweisungen, Befunde und weitere Behandlungen für die fiktive Patientin im PVS einzugeben (vgl. dazu Fragebogen im Anhang 2 [Anh. 2]). Beispielhaft zeigt Abbildung 2 [Abb. 2] die Aufgabe 17 der Datenerhebung. Hier soll eine Heilmittelverordnung im PVS dokumentiert werden. Nach jeder Aufgabe sollten die Ärztinnen in einem Fragebogen ankreuzen, ob sie die Aufgabe ohne vorheriges Training als erfüllbar ansehen (ja/teilweise/nein), ob diese Aufgaben häufig in der Routine genutzt werden (nie/gelegentlich/regelmäßig) und ob ein Training zur Bewältigung der Aufgabe nötig ist (ja/nein). Die Behandlungsdokumentation der Ärztinnen wurde nicht verändert und es war keine Doppeldokumentationen für die Forschung nötig.

Schnittstelle für den Datenexport (technische Abbildung)

Für den Datenexport kamen PVS zum Einsatz, bei denen der Einzeldatenexport im BDT-Format möglich war. Durch den Einzeldatenexport ist es möglich, nur die Daten eines einzelnen Patienten zu exportieren, ohne dabei Einsicht in andere Patientendaten zu bekommen. Die Schnittstelle BDT wurde ausgewählt, weil diese unabhängig vom Softwarehersteller die Behandlungsdaten aus Arztpraxen abbilden sollte [21] und bisher keine andere Schnittstelle für wissenschaftliche Forschung hausärztlicher Behandlungsdaten zur Verfügung steht [21]. Es wurden sechs PVS von vier verschiedenen Softwareherstellern genutzt (PVS1, 2 und 3: Turbomed von CompuGroup Medical Deutschland AG; PVS 4: David von Data Vital Med. Software GmbH; PVS 5: Medical Office von INDAMED EDV-Entwicklung und -Vertrieb GmbH; PVS 6: M1 Pro von CompuGroup Medical Deutschland AG). Vier PVS gehörten zur „Liste der BDT-geprüften Systeme“ [22]. Nach Abschluss der ärztlichen Dateneingabe in das PVS wurden ausschließlich die Daten der fiktiven Patientin im BDT-Format auf einem USB-Stick gespeichert.

Datenanalyse

Die erzeugten BDT-Dateien wurde dahingehend untersucht, ob die in Tabelle 1 [Tab. 1] aufgeführten Sollwerte in den Feldkennungen wiedergefunden wurden (vgl. dazu Auswertebogen und Suchmaske in Anhang 2 [Anh. 2], beispielhaft in Abbildung 3 [Abb. 3]). Die als Text vorliegende BDT-Datei (exemplarische BDT-Datei in Anhang 3 [Anh. 3]) wurde mit dem Texteditor Notepad++ (https://notepad-plus-plus.org/) analysiert. Jede Zeile einer BDT-Datei beginnt mit Zeilenlänge und Feldkennung, so dass nach allen Feldkennungen aus Tabelle 1 [Tab. 1] leicht gesucht werden konnte. Darauf folgen die Inhalte der Feldkennungen, die mit den Sollwerten aus Tabelle 1 [Tab. 1] verglichen wurden.

Mit Hilfe eines eigenen Zonenmodells lassen sich die Fragen nach der Notwendigkeit einer ärztlichen Schulung und technischen Anpassung sowie die Erkennung effektiv nutzbarer Daten analysieren und beantworten. Jedes Ergebnis der ärztlichen und technischen Abbildung von untersuchten Merkmalen der fiktiven Patientin wurde zweidimensional in dieses Zonenmodell eingeordnet und gezählt (Abbildung 4 [Abb. 4]). In der Zone der richtigen ärztlichen und technischen Abbildung sind effektiv nutzbare Daten zu erwarten (grüne Zone). Eine Softwareanpassung erscheint notwendig, wenn die gezählten Ergebnisse in der ärztlichen Abbildung erfüllt, jedoch falsch oder nicht in der BDT-Datei abgebildet wurden (blaue Zonen). Schulungsbedarf besteht, wenn Merkmale ärztlich nicht oder nur teilweise und zufällig richtig in der BDT-Datei abgebildet wurden (gelbe Zonen). Schließlich zeigen die orangefarbenen Zonen die Notwendigkeit einer gemischt ärztlich-technischen Qualifizierung. Die Schulungen und Softwareanpassungen sind immer dann notwendig, wenn in der gelben, blauen oder orangefarbenen Zone Zählwerte größer als Null erscheinen. Im Idealfall hat die grüne Zone den Zählwert 23 (22 FKen aus Tabelle 1 [Tab. 1] und eine FK wurde doppelt abgefragt) und alle anderen Zonen den Zählwert 0.

Neben den technischen und ärztlichen Abbildungsfragen wurde die Häufigkeit der Nutzung der eingegebenen Daten in der ärztlichen Routine untersucht (nie/gelegentlich/regelmäßig). Ebenso wurde analysiert, wie oft und bei welchen Aufgaben die Ärztinnen eine Schulungsmaßnahme für erforderlich hielten.


Ergebnisse

Zählwerte im Zonenmodell

Die Ergebnisse der Zählungen von sechs PVS zeigt Tabelle 2 [Tab. 2]. Im Mittel sind nur 8,5 Feldkennungen (37,0%) effektiv nutzbar (grüne Zone). Der überwiegende Teil (10,7 FKen bzw. 46,4%) der untersuchten Feldkennungen wird falsch oder nicht in der BDT-Datei abgebildet (blaue Zonen) und ist somit für die sekundäre Forschung nicht nutzbar. Der ärztliche Schulungsbedarf liegt im Mittel bei 2,7 FKen bzw. 11,6% (gelbe Zonen). Mit der Durchführung von Qualifizierungsmaßnahmen könnte die effektiv nutzbare Datenmenge von 37,0% erhöht werden auf:

  • 83,4% – wenn Softwareanpassungen durchgeführt werden (Summe aus grünen und blauen Zonen)
  • 48,6 % – wenn Schulungen durchgeführt werden (Summe aus grünen und gelben Zonen)
  • 95,0% – wenn Softwareanpassungen und Schulungen durchgeführt werden (Summe aus grünen, blauen und gelben Zonen).

Softwareanpassung bedeutet hier, Softwareänderungen am PVS so vorzunehmen, dass die geforderten FKen vollständig und richtig im Datenexport der BDT-Datei erscheinen. Bei der ärztlichen Schulung geht es darum, den Anteil von nicht oder nur teilweise dokumentierten Daten bei der ärztlichen Dokumentation zu verringern oder im Idealfall auszuschließen.

Wirklich nutzbare Daten

Die in Tabelle 2 [Tab. 2] angegebenen Mittelwerte sind statistische Werte. Wirklich nutzbar für die sekundäre Forschung sind nur die FKen aus der grünen Zone, die in allen PVS richtig abgebildet wurden. Dazu zählt nur die FK 3103 (Geburtsdatum), welche in allen sechs PVS in der grünen Zone erschien. Fünf Zählpunkte in der grünen Zone erhalten die FKen 3649 bzw. 3650 (Dauerdiagnose), 6210 (Medikament verordnet auf Rezept), 6280 (Überweisung Inhalt), 6285 (Dauer einer Arbeitsunfähigkeit). Somit reduziert sich die Menge der wirklich nutzbaren Daten nochmals gegenüber den statistischen Werten aus Tabelle 2 [Tab. 2].

Technischer Anpassungsbedarf (blaue Zonen)

Zu den Feldkennungen, die häufig falsch oder nicht technisch abgebildet wurden, zählen: FK 3656 (Allergien), 6215 (Ärztemuster), 6265 (physikalische Therapie), 3110 (Geschlecht), 3651 bzw. 3652 (Dauermedikamente), 6205 (aktuelle Diagnose), 6290 bzw. 6291 (Krankenhauseinweisung), 6260 (Therapie), 6211 (außerhalb der Praxis verordnetes Medikament), 6220 (Befund), 6225 (Röntgenbefund) und 6286 (Grund der Arbeitsunfähigkeit). In Tabelle 3 [Tab. 3] werden beispielhaft Daten gezeigt, die an unerwarteter Stelle in der BDT-Datei gefunden wurden. Diese wurden als falsche technische Abbildung klassifiziert. Es kann vorkommen, das Textstellen in frei definierbaren Feldern, in nicht definierten Feldern oder in definierten, aber unerwarteten Feldern des BDT-Standards erscheinen können. Insgesamt liegt der technische Anpassungsbedarf hier bei 46,4%.

Ärztlicher Schulungsbedarf (gelbe Zonen)

Als nicht erfüllbar in der ärztlichen Abbildung wurden angegeben: 4x FK 8401 (Befundart Teilbefund), je 3x FK 6221 (Fremdbefund) und 6211 (außerhalb der Praxis verordnetes Medikament), je 2x FK 3651/3652 (Dauermedikamente) und je 1x FK 6265 (physikalische Therapie) und 6225 (Röntgenbefund). Im Mittel ergibt sich hier ein ärztlicher Schulungsbedarf von 11,6%.

Gemischter Qualifizierungsbedarf (orangefarbene Zone)

Nur eine von sechs Ärztinnen hat angegeben, bestimmte Aufgaben nur teilweise erfüllen zu können. Daher fällt der gemischt technisch-ärztliche Qualifizierungsbedarf gering aus (4,3%).

Nutzungshäufigkeit in der ärztlichen Routine

Im Mittel gaben die Ärztinnen an, dass sie 66,7% der gestellten Aufgaben aus Tabelle 1 [Tab. 1] regelmäßig in der Routine nutzen. Dazu zählen insbesondere Dauerdiagnosen (FK 3649 und FK 3650), verordnete Medikamente (FK 6210), Befunde (FK 6220), aktuelle Diagnosen (FK 6205) und Angaben zur Arbeitsunfähigkeit (FK 6285 und FK 6286). Nur gelegentlich (13%) werden dokumentiert: FK 6211 (außerhalb Rezept verordnetes Medikament), FK 6215 (Ärztemuster) und FK 6290/6291 (Krankenhauseinweisung). Bei zirka 20,3% der gestellten Aufgaben gaben die Ärztinnen an, diese nie in der täglichen Routine zu verwenden. Dies betrifft vor allem die FK 6221 (Fremdbefund), FK 8401 (Befundart) und FK 6225 (Röntgenbefund).

Einschätzung des Schulungsbedarfs

In der Analyse über die Angaben aller Ärztinnen zeigte sich, dass bei 80,6% aller Aufgaben keine Schulung notwendig erscheint. Dies gilt insbesondere für die regelmäßig genutzten FKen (siehe oben). Der Schulungsbedarf (19,4%) wird vor allem gesehen bei FKen, die nie in der Routine genutzt werden: FK 8401 (Befundart) und FK 6211 (außerhalb Rezept verordnetes Medikament). Aber auch FK 6221 (Fremdbefund), FK 3651/3652 (Dauermedikamente), FK 6260 (Therapie), FK 6225 (Röntgenbefund) sind Aufgaben, bei denen mindestens 33% der Ärztinnen Schulungsbedarf angegeben haben. Basierend auf den Zählwerten benötigt aber nur jeweils eine Ärztin Schulung bei FK 3103/3110 (Geburtsdatum/Geschlecht), FK 6215 (Ärztemuster), FK 6290/6291 (Krankenhauseinweisung) oder FK 6265 (physikalische Therapie).


Diskussion

Ziel unserer Untersuchungen war es, die Abhängigkeiten der Datenvollständigkeit zum Zeitpunkt der Datenerhebung darzustellen, die erst später Einfluss auf die Analyseergebnisse in der Sekundärdatenforschung haben könnten. Exemplarisch wurde am Beispiel hausärztlicher Behandlungsdaten gezeigt, dass es nur einen geringen Trainingsbedarf bei der ärztlichen Abbildung gibt (ca. 20% aus Sicht der Teilnehmenden) und somit 80% der gestellten Aufgaben für die Beforschung genutzt werden könnten. Jedoch ist die schlechte Datenverfügbarkeit beim Datenexport im BDT-Format ausschlaggebend dafür, dass die Menge der effektiv nutzbaren Daten nur bei 37% liegt (ggf. noch weniger im Einzelfall).

Die Ergebnisse waren gleichermaßen erwartet und unerwartet. Einerseits hatten drei von sechs PVS ein BDT-Prüfzertifikat [22] und der genutzte BDT-Standard stammt aus dem Jahr 1994. Von daher hätte man erwarten können, dass Daten nicht in undefinierten oder in falschen FKen auftauchen. Andererseits war von vielen Softwareherstellern bekannt, dass diese die BDT-Schnittstelle nicht mehr pflegen und für BDT-Datenexport auf spezialisierte Firmen mit kostenpflichtigen Lösungen zurückgreifen. Schließlich konnte auch nicht erwartet werden, dass sich ein PVS, deren originäre Zweckbestimmung nicht die wissenschaftliche Dokumentation ist, als Softwareinstrument für die Wissenschaft eignet. Im Endeffekt ist die Datenqualität stark von der Pflege der BDT-Datenschnittstelle und damit von vielen verschiedenen Softwareherstellern abhängig, solange hier keine Verpflichtungen der Hersteller bestehen.

In den Ergebnissen wurde exemplarisch an sechs PVS gezeigt, dass ca. 19,6% der von den Ärztinnen eingegebenen Daten nicht im Datenexport erscheinen. Dieses Ergebnis unterstützt die Untersuchungen von Sammon et al., bei denen in Forschungsdatenbanken mit nicht zufällig fehlenden Daten (missing not at random) gerechnet werden sollte [13]. Forschende müssen sich bewusst sein, dass ‚fehlende Daten‘ im Datenexport nicht gleichzusetzen ist mit ‚nicht dokumentierten Daten‘. Fehlende Daten können aber auch darauf zurückgeführt werden, dass Ärztinnen die Daten nicht dokumentiert haben oder nicht bekannt war, wie dokumentiert werden soll. In unseren Ergebnissen fehlten ca. 11,6% aufgrund nicht vorhandener ärztlicher Abbildung. Taggert et al. schlagen hier strukturierte Datenqualitätsberichte und Feedbacksitzungen vor und konnten zeigen, dass sich dadurch ebenso die Datenverfügbarkeit verbessert [15]. Sowohl aus unseren Untersuchungen als auch den Untersuchungen von van de Wal et al. wird ersichtlich, dass die Kombination aus Softwareanpassung, Softwaretest und Schulung der Ärztinnen die Qualität der erfassten Daten verbessern kann [16].

Technische Abbildungsprobleme im Datenexport könnten deutlich reduziert werden, wenn nur eine einzige Software, deren Exportschnittstelle unabhängig kontinuierlich getestet würde, bei allen Ärztinnen zum Einsatz käme. Dann würde die Datenvollständigkeit nur von der Dateneingabe durch Ärztinnen abhängig sein, so wie in den Arbeiten des Julius General Practitioner's Network beschrieben [8]. Bei mehr als 50 verschiedenen PVS, die in Deutschland von der Kassenärztlichen Bundesvereinigung (KBV) zugelassen sind [23], ist jedoch die Einhaltung des BDT-Standards zeit- und kostenintensiv, zumal alle PVS quartalsweise ein Softwareupdate erhalten. Die Verwendung einer einheitlichen Abfragesoftware für PVS, wie sie im Primary Care Data Quality Programme aus Großbritannien zum Einsatz kommt [14], kann die Datenvollständigkeit nicht verbessern. Findet jedoch ein regelmäßiger Test des Datenexportes – so wie im Abschnitt ‚Methodik‘ beschrieben – mit fiktiven Patientendaten statt, können technische Abbildungsprobleme frühzeitig erkannt werden.

Die in unseren Untersuchungen gezeigten Falschabbildungen in den exportierten Daten können nur theoretisch als ‚verfügbar‘ eingestuft werden. Einerseits sind diese Daten verfügbar, weil sie an einer falschen Position im Datenexport erscheinen, andererseits sind sie in der Sekundärdatenforschung nur dann als verfügbar anzusehen, wenn:

1.
den Forschenden die Falschabbildung im Datenexport erkennbar/bekannt ist und
2.
statt der erwarteten Position (Feldkennung im BDT-Standard) die tatsächlich verwendete Position (Feldkennung) genutzt werden kann und
3.
bei quartalsweisen Softwareupdates im PVS die Falschabbildung über die Zeit konstant bleibt.

Werden nur die Daten exportiert, die für die Sekundärdatenanalyse benötigt werden (also ausgewählte Feldkennungen), so können bei Falschabbildungen die gewünschten Daten nicht genutzt werden, obwohl diese im Datenexport vielleicht vorhanden sind.

Unsere Untersuchungen besitzen einige Limitationen. Zunächst sind die Ergebnisse von nur vier PVS und sechs Ärztinnen nicht repräsentativ für alle PVS und alle Ärztinnen, weil die Stichprobe der PVS zu gering war. Eine weitere Limitation unserer Arbeit besteht darin, dass wir eine willkürliche Anzahl von Patientenmerkmalen (Feldkennungen) untersucht haben. Generalisierte Schlussfolgerungen für andere PVS oder andere Datenbanken können deshalb nicht gezogen werden. Es war aber das Ziel, exemplarisch die Schulungs- und Softwareproblematik darzustellen, um auch detaillierte Ergebnisse zeigen zu können. Nachteilig ist ebenfalls, dass die Datenqualität hier nur anhand der Qualitätsmerkmale „Verfügbarkeit“ und „Vollständigkeit“ untersucht wurde. Die Ergebnisse geben noch keine Informationen zur Korrektheit und Plausibilität der Daten.

Die Stärken unserer dargestellten Methodik liegen in der Erkennung und Bemessung des Qualifizierungsbedarfs anhand von einfachen Testszenarien, Zählungen und Prozentrechnungen. Ein weiterer Vorteil unserer Methodik liegt in der Wiederverwendbarkeit. Generell könnten die fiktiven Patientendaten auch im PVS verbleiben, in regelmäßigen Abständen exportiert und anschließend in die Forschungseinrichtung übertragen werden. Somit wäre eine kontinuierliche Qualitätssicherung der technischen Abbildung innerhalb einer längeren Studie mit hausärztlichen Behandlungsdaten möglich. Es wäre jederzeit anhand der fiktiven Patientendaten in der Praxissoftware ersichtlich, wo welche Daten dokumentiert werden sollten. Damit trägt unser Vorschlag auch zur Qualitätssicherung der ärztlichen Dokumentation bei.

Die vorgestellte Methodik sollte auch bei zukünftigen technischen Schnittstellen genutzt werden. Dazu zählt z.B. die aufstrebende FHIR-Schnittstelle (Fast Healthcare Interoperabilty Resources), die bereits von der Kassenärztlichen Bundesvereinigung als PVS-Wechselschnittstelle [24] und für den Datenaustausch zwischen PVS und Verordnungssoftware verbindlich festgelegt wurde und derzeit von den Softwareherstellern implementiert wird [25]. Auch hier ist darauf hinzuweisen, dass ein Umstieg auf eine technologisch moderne Datenschnittstelle noch nichts über die Datenverfügbarkeit aussagt.


Schlussfolgerungen

Eine unabhängige, kontinuierliche Qualitätssicherung der Datenschnittstellen, ärztliche Schulungen und Untersuchungen zur Datenvollständigkeit von Routine- und Behandlungsdaten können die Qualität der nachfolgenden Sekundärdatenforschung deutlich verbessern.


Anmerkung

Geschlechtergerechte Sprache

Wir verwenden vorwiegend die weibliche Form für Personen, jedoch sind immer alle Geschlechter gleichberechtigt gemeint.

Danksagung

Die Autoren bedanken sich bei den teilnehmenden Haus-ärztinnen des Qualitätszirkels „Hausärztliche Pharmakotherapie“ Göttingen sowie Herrn Dr. Johannes Hauswaldt für die Unterstützung dieser Arbeit. Ohne ihre Hilfe wäre diese Arbeit nicht zustande gekommen.

Interessenkonflikte

Die Autoren erklären, dass sie keine Interessenkonflikte in Zusammenhang mit diesem Artikel haben.


Literatur

1.
Gothe H. Der Stellenwert der Routinedaten im Gesundheitswesen. Forum der Medizin_Dokumentation und Medizin_Informatik. 2018;1:6-10.
2.
Swart E, Ihle P, Gothe H, Matusiewicz D, Hrsg. Routinedaten im Gesundheitswesen. Handbuch Sekundärdatenanalyse: Grundlagen, Methoden und Perspektiven. 2., vollständig überarbeitete und erweiterte Aufl. Bern: Verlag Hans Huber; 2014.
3.
Tenckhoff B. Sekundärdatennutzung medizinischer Dokumentation: Chancen und Risiken ambulanter Routinedaten im KV-System. Forum der Medizin_Dokumentation und Medizin_Informatik. 2017;1:11-4.
4.
Lingner H, Aumann I, Wacker M, Kreuter M, Leidl R, Graf von der Schulenburg JM, Welte T. Gesundheitswissenschaftliche Forschung mit primärärztlichen Routinedaten der elektronischen Patientenakte: das BeoNet-Register. Gesundheitswesen. 2018;80(11):1026-34.
5.
Hummers E. Schweden gegen Deutschland 1:0 – Kommentar zu den Artikeln von Thomas Kühlein et al. und Andy Maun. Z Allg Med. 2017;93(10):407-9.
6.
Leiner F, Gaus W, Haux R, Knaup-Gregori P, Pfeiffer KP, Wagner J. Medizinische Dokumentation. Grundlagen einer qualitätsgesicherten integrierten Krankenversorgung: Lehrbuch und Leitfaden. 6., überarb. Aufl. Stuttgart: Schattauer; 2012.
7.
Guenther A, Nowak I, Pertz J, Sirman G. Qualitätsbewertung von Routinedaten zur Sekundärdatenanalyse in der medizinischen Forschung. Forum der Medizin_Dokumentation und Medizin_Informatik. 2016;2:32-5.
8.
Smeets HM, Kortekaas MF, Rutten FH, Bots ML, van der Kraan W, Daggelders G, Smits-Pelser H, Helsper CW, Hoes AW, de Wit NJ. Routine primary care data for scientific research, quality of care programs and educational purposes: the Julius General Practitioners’ Network (JGPN). BMC Health Serv Res. 2018 Sep;18(1):735. DOI: 10.1186/s12913-018-3528-5  External link
9.
Europäische Union. Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates vom 27. April 2016 zum Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten, zum freien Datenverkehr und zur Aufhebung der Richtlinie 95/46/EG (Datenschutz-Grundverordnung). [letzter Zugriff am 09.09.2019]. Verfügbar unter: http://eur-lex.europa.eu/legal-content/DE/TXT/HTML/?uri=CELEX:32016R0679&from=EN External link
10.
Garbe E. Nutzung von Sekundärdaten für ein Versorgungsmonitoring: zur Notwendigkeit einer Validierung. In: Kurth BM, Hrsg. Monitoring der gesundheitlichen Versorgung in Deutschland. Konzepte, Anforderungen, Datenquellen. Deutscher Ärzteverlag; 2008. (Report Versorgungsforschung; 1). S. 49-56.
11.
Arbeitsgruppe Epidemiologische Methoden der Deutschen Arbeitsgemeinschaft für Epidemiologie (DAE); Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS); Deutsche Gesellschaft für Sozialmedizin und Prävention (DGSMP); Deutsche Region der Internationalen Biometrischen Gesellschaft (DR-IBS), Hrsg. Leitlinien und Empfehlungen zur Sicherung von Guter Epidemiologischer Praxis (GEP). 2004 [letzter Zugriff am 09.09.2019]. Verfügbar unter: https://dgepi.de/assets/Leitlinien-und-Empfehlungen/6074a4e7b8/Leitlinien-fuer-Gute-Empidemiologische-Praxis.pdf External link
12.
Swart E, Gothe H, Geyer S, Jaunzeme J, Maier B, Grobe TG, Ihle P. Gute Praxis Sekundärdatenanalyse (GPS). Leitlinien und Empfehlungen. Gesundheitswesen. 2015;77(02):120-6.
13.
Sammon CJ, Miller A, Mahtani KR, Holt TA, McHugh NJ, Luqmani RA, Nightingale AL. Missing laboratory test data in electronic general practice records: analysis of rheumatoid factor recording in the clinical practice research datalink. Pharmacoepidemiol Drug Saf. 2015 May;24(5):504-9. DOI: 10.1002/pds.3750  External link
14.
van Vlymen J, de Lusignan S, Hague N, Chan T, Dzregah B. Ensuring the Quality of Aggregated General Practice Data: Lessons from the Primary Care Data Quality Programme (PCDQ). Stud Health Technol Inform. 2005;116:1010-5.
15.
Taggart J, Liaw ST, Yu H. Structured data quality reports to improve EHR data quality. Int J Med Inform. 2015 Dec;84(12):1094-8. DOI: 10.1016/j.ijmedinf.2015.09.008  External link
16.
Hiddema-van de Wal A, Smith RJ, van der Werf GT, Meyboom-de Jong B. Towards improvement of the accuracy and completeness of medication registration with the use of an electronic medical record (EMR). Fam Pract. 2001 Jun;18(3):288-91. DOI: 10.1093/fampra/18.3.288  External link
17.
Herrett E, Gallagher AM, Bhaskaran K, Forbes H, Mathur R, van Staa T, Smeeth L. Data Resource Profile: Clinical Practice Research Datalink (CPRD). Int J Epidemiol. 2015 Jun;44(3):827-36. DOI: 10.1093/ije/dyv098  External link
18.
Ooi CE, Rofe O, Vienet M, Elliott RA. Improving communication of medication changes using a pharmacist-prepared discharge medication management summary. Int J Clin Pharm. 2017 Apr;39(2):394-402. DOI: 10.1007/s11096-017-0435-5 External link
19.
Qualitätsring Medizinische Software e.V. QMS-Standards. Die Standards für einen sicheren Datenaustausch in der Arztpraxis. [aktualisiert 2019, letzter Zugriff am 09.09.2019]. Verfügbar unter: http://www.qms-standards.de/ External link
20.
Gesellschaft für Telematikanwendungen der Gesundheitskarte (Gematik). Vesta Standards. [letzter Zugriff am 09.09.2019]. Verfügbar unter: https://www.vesta-gematik.de/ External link
21.
Hauswaldt J, Kemper V, Himmel W, Hummers E. Hindernisse bei der sekundären Nutzung hausärztlicher Routinedaten. Gesundheitswesen. 2018;80:987-93.
22.
Zentralinstitut Köln. Liste der BDT-geprüften Systeme. [letzter Zugriff am 09.09.2019]. Verfügbar unter: https://www.aerzteblatt.de/dae-plus/pc/bdt-systeme External link
23.
Kassenärztliche Bundesvereinigung. IT in der Arztpraxis. Verzeichnis zertifizierter Software für Dokumentationen. [letzter Zugriff am 09.09.2019]. Verfügbar unter: ftp://ftp.kbv.de/ita-update/Service-Informationen/Zulassungsverzeichnisse/ KBV_ITA_SIEX_Verzeichnis_Dokumentationen.pdf External link
24.
Kassenärztliche Bundesvereinigung. Festlegung der Archiv- und Wechselschnittstelle nach § 291d Abs. 1 SGB V. [letzter Zugriff am 09.09.2019]. Verfügbar unter: https://www.kbv.de/media/sp/KBV_ITA_VGEX_SST_Festlegung_AWS.pdf External link
25.
Kassenärztliche Bundesvereinigung. Festlegung der Schnittstellen nach § 291d Absatz 1a Satz 1 Nr. 1 SGB V: KBV_ITA_VGEX_Verordnungssoftware_Schnittstellenfestlegung. [letzter Zugriff am 09.09.2019]. Verfügbar unter: https://www.kbv.de/media/sp/KBV_ITA_VGEX_Verordnungssoftware_Schnittstellenfestlegung.pdf External link