gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Vergleich der modellbasierten Verteilungsdichtefunktion von Genexpressionsdaten auf der Basis eines Fließgleichgewichtes mit experimentellen Daten über Synthese- und Abbauraten

Meeting Abstract

Search Medline for

  • Norman Bitterlich - Medizin & Service GmbH, Chemnitz
  • Georg Hoffmann - Institut für Molekulare Onkologie, Trillium GmbH, Grafrath bei München

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds058

doi: 10.3205/11gmds058, urn:nbn:de:0183-11gmds0588

Published: September 20, 2011

© 2011 Bitterlich et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung: Die empirischen Verteilungsfunktionen von zahlreichen Beispieldatensätzen aus Microarray-Experimenten zeigen in der grafischen Darstellung ein qualitativ vergleichbares Verhalten. Zu deren mathematischer Modellierung wird im Allgemeinen die Lognormalverteilung gewählt [1]. Mit diesem Ansatz gelingt eine Anpassungsgüte der hypothetischen Verteilungsfunktion an die empirischen Daten, die durch alternative Modelle (Weibull-, Pareto-Verteilung) nicht erreicht wird. Auch Verteilungsmodelle auf der Basis eines Quotienten von Synthese- (S) und Abbauraten (D) werden dafür diskutiert. Die Annahme, diese Teilprozesse lassen sich durch Produkte unabhängiger gleichverteilter Zufallsgrößen S1xS2x…xSm bzw. D1xD2x…xDn modellieren, führt zu Verteilungen mit vergleichbaren Eigenschaften [2]. Die einfache analytische Beschreibbarkeit der Verteilungsdichtefunktionen der Quotienten S(m)/D(n) erweist sich zudem als Vorteil für simulative Untersuchungen zur Erklärung von Beobachtungen.

Material und Methoden: Die Modellfindung für Verteilungen der mRNA-Konzentrationen erfolgt bislang datenbasiert. Die Modellgüte kann mittels einer Prüfgröße nach dem Kolmogorov-Smirnov-Test bewertet werden. Allerdings ist bekannt, dass Störgrößen in diesem Modellansatz die Verteilungsfunktionen derart beeinflussen können, dass die Modelldetektion erschwert wird und die Modellierung mittels Lognormalverteilung adäquat erscheint. Weiterführende Verfahren [3], [4] ermöglichen jedoch die Reduktion der Auswirkung zufälliger Störgrößen und damit den detaillierten Vergleich von empirischen Verteilungsfunktionen mit modellbasierten Ansätzen. Die Quotienten der Form S(m)/D(n) erweisen sich unter dieser Betrachtungsweise als anpassungsfähige Modelle [5], ohne aber den Modellvorteil gegenüber der Lognormalverteilung zweifelsfrei nachweisen zu können.

Ergebnisse: Nun konnten erstmalig außer den mRNA-Konzentrationen auch Synthese- und Abbauraten experimentell gemessen werden [6]. Für den modellbasierten Ansatz auf der Basis des Quotienten S(m)/D(n) können damit dessen Zähler gesondert analysiert und somit die Modellanpassung präzisiert werden. Der Verteilungstyp begründet sich auf einem Fließgleichgewicht zwischen Synthese und Abbau. Da die Experimente unter einer zeitlichen Zellbeeinflussung erfolgten und damit das postulierte Fließgleichgewicht gestört war, kann dieser Effekt im Verteilungsmodell nachgewiesen werden.

Schlussfolgerung: Die experimentellen Messergebnisse stützen die These, Verteilungsdichtefunktionen von Genexpressionsdaten modellbasiert auf der Grundlage von Synthese- und Abbauraten anzupassen. Die damit verbundenen Möglichkeiten der Simulation von Zellveränderungen lassen neue Einblicke in die Zellregulation zu.


Literatur

1.
Konishi T. A thermodynamic model of transcriptome formation. Nucleic Acid Res. 2005;33:6587-92.
2.
Hoffmann G. Ein mathematisches Modell des Transkriptoms. Klin Chem Mitteilungen. 2006;37(3):64-72. Available from: http://www.simchip.de External link
3.
Karthe S. Anpassung von modellbasierten Verteilungsdichten an Genexpressionsdaten [Diplomarbeit]. Hochschule Mittweida; 2009.
4.
Bitterlich N, Karthe S, Hoffmann G. Anpassung von modellbasierten Verteilungsdichten an Genexpressionsdaten. In: 55. Jahrestagung der GMDS, Mannheim 2010.
5.
Bitterlich N, Hoffmann G. Die Familie der Verteilungen vom Typ S(m)/D(n) versus Lognormalverteilung zur Modellierung der Verteilungen von Genexpressionsdaten [in Vorbereitung].
6.
Miller C, et al. Dynamic transcriptome analysis measure rates of mRNA synthesis and decay in yeast. Molecular Systems Biology. 2011;7:458.