gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Schemafreiheit und Semantische Interoperabilität: Wege zu einer Metadatenarchitektur für die Biomedizinische Forschung

Meeting Abstract

  • Sebastian Bartholomäus - Westfälische Wilhelms-Universität, Münster
  • Martin Lablans - Westfälische Wilhelms-Universität, Münster
  • Ingo Roderfeld - Westfälische Wilhelms-Universität, Münster
  • Frank Ückert - Westfälische Wilhelms-Universität, Münster

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds436

doi: 10.3205/11gmds436, urn:nbn:de:0183-11gmds4366

Published: September 20, 2011

© 2011 Bartholomäus et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Hintergrund: Die Herstellung semantischer Interoperabilität beim Vernetzen heterogener, dezentraler Organisationseinheiten ist insbesondere im Bereich der biomedizinischen Forschung eine große Herausforderung: Mit nur wenigen Abfragen müssen die Bestände einer Vielzahl von Biomaterialbanken mit inhomogenen Datenbeständen nach passendem Material durchsucht und im Falle einer Kollaboration die Daten strukturiert und verständlich ausgetauscht werden können. Überträgt man die Erfahrungen anderer großer Vernetzungsversuche [1], [2] auf das Biobanking, wird die große Heterogenität und Fortentwicklung der zahlreichen Fachgebiete die Entwicklung eines einzigen domänenübergreifenden Datenschemas schwierig machen. Selbst die kooperative Erarbeitung unter Verwendung eines Metadatenregisters kann nur begrenzt Abhilfeschaffen, da ein großes Maß an Abstimmung zwischen sämtlichen Partnern erforderlich ist, was bei steigender Anzahl der Partner zunehmend impraktikabel wird. In derzeitigen Vernetzungsansätzen werden daher häufig Minimaldatensätze (stark reduzierte Datenschemata) verwendet, die allerdings zur detaillierten Recherche nach Daten und Proben naturgemäß unzureichend sind. Dies begünstigt die Entstehung einer Vielzahl fachspezifischer und weder semantisch noch technisch interoperabler Minimaldatensätze und Lösungen. Im Rahmen eines Projekts zur föderierten Vernetzung von Biomaterialbanken [3] entwickeln wir daher eine technisch homogene Metadatenarchitektur, die es jedem Partner erlaubt sein Fachgebiet abzubilden, während trotzdem organisations- und domänenübergreifende Suchen und Kooperationen ermöglicht werden.

Material und Methoden: Durch Anlehnung an den ISO/IEC 11179-Standard für Metadatenregister [4] erreichen wir eine möglichst präzise Definition der Metadaten. Wir kombinieren diese mit Standards aus dem Umfeld des Semantic Web wie dem Resource Description Framework (RDF) [5] und der OWL2 Web Ontology Language [6], um Erweiterbarkeit und eine größtmögliche Unabhängigkeit von einem bestimmten Datenschema zu gewährleisten. Zur modularen Ontologieentwicklung [7] setzen wir das Werkzeug Protégé [8] ein, während zur Implementierung das Jena-Framework [9] verwendet wird.

Ergebnisse: Für unsere Biobanking-Plattform wurde eine erste Basic Biobanking Ontology (BBO) entwickelt und in eine Java-Anwendung eingebunden. Die BBO deckt in sieben Modulen fachunabhängige Themenbereiche des Biobanking ab, etwa Aufbewahrung, Organisationseinheiten oder Aktionen und Akteure. Sämtliche OWL2-Klassen und -Properties sind dabei durch stark strukturierte Metadatenitems aus einer unterliegenden ISO-11179-Ontologie annotiert. Aufbauend auf der BBO können Partner eigene Ontologien mit Erweiterungen für ihre fachspezifischen Bedürfnisse erstellen. Unser Konzept zur Redundanzvermeidung sieht vor mithilfe der präzisen Definition der Metadatenitems schon bei der Erstellung mit existierenden Items abzugleichen und automatisch auf Überschneidungen hinzuweisen.

Schlussfolgerung: Die derzeitige Form der BBO dient als Grundlage für die virtuelle Biomaterialbank des TranSaRNet [10]. In einem nächsten Schritt werden die Datensätze mit weiteren Partnern erarbeitet und durch Ähnlichkeitsrelationen zwischen Items und Mapping Technologien [11] verknüpft. Dies soll den Partner ermöglichen trotz inhaltlich teilweise heterogener Schemata domänenübergreifend zu recherchieren.


Literatur

1.
Rosenthal A, Seligman L, Renner S. From Semantic Integration to Semantics Management: Case Studies and A Way Forward. Special Issue on Semantic Integration. SIGMOD Record. 2004;33(3).
2.
Rector AL. Clinical terminology: Why is it so hard? Methods of Information in Medicine. 1999;38(4).
3.
Lablans M, Bartholomäus S, Ückert F. Providing trust and interoperability to federate distributed biobanks. In: Proceedings of MIE, 2011, Oslo [im Druck].
4.
Information technology -- Metadata Registries (MDR) – Part 3: Registry Metamodel and basic attributes. 3rd ed. Final Committee Draft ISO/IEC FCD 11179-3. Date: 2010-03-30. Available from: http://www.metadata-standards.org/ [letzter Zugriff 11.04.2011] External link
5.
Lassila O, Swick R. Resource Description Framework (RDF) Model and Syntax Specification. W3C Recommendation, 22 February, 1999. Available from: http://www.w3.org/TR/REC-rdf-syntax [letzter Zugriff 08.04.2011] External link
6.
W3C OWL Working Group. Owl 2 web ontology language document overview. W3C Recommendation, 27th October 2009. http://www.w3.org/TR/2009/REC-owl2-overview-20091027/ [letzter Zugriff 12.04.2011] External link
7.
Gangemi A, Presutti V. Ontology design patterns. In: Handbook on Ontologies. 2nd ed. International Handbooks on Information Systems. Springer; 2009.
8.
The Protégé platform. http://protege.stanford.edu [letzter Zugriff 12.04.2011] External link
9.
Jena – Semantic Web Framework for Java. http://jena.sourceforge.net/ [letzter Zugriff 04.04.2011] External link
10.
Dirksen U, Nathrath M, Agelopoulos K, Fulda S, Richer G, Dilloo D, Kontny U, Lang P, Bader P, Hartmann JT, and others. 2. O. 05 Translational Sarcoma Research Network (TranSaRNet). Journal of Bone and Joint Surgery – British Volume. 92-B(SUPP_III):437.
11.
Kalfoglou Y, Schorlemmer M. Ontology mapping: the state of the art. The Knowledge Engineering Review Journal (KER). 2003;18(1):1–31.