h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Global gene expression profile mining in stem cells and their progeny = Globale Genexpressionsprofil-Auswertung von Stammzellen und ihren Nachkommen



Verantwortlichkeitsangabevorgelegt von David Ruau

ImpressumAachen : Publikationsserver der RWTH Aachen University 2009

Umfang125 S. : Ill., graph. Darst.


Aachen, Techn. Hochsch., Diss., 2009


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter


Tag der mündlichen Prüfung/Habilitation
2009-05-25

Online
URN: urn:nbn:de:hbz:82-opus-28118
URL: https://publications.rwth-aachen.de/record/50815/files/Ruau_David.pdf

Einrichtungen

  1. Fachgruppe Informatik (120000)
  2. Lehrstuhl für Informatik 9 (Datenmanagement und -exploration) (122510)

Inhaltliche Beschreibung (Schlagwörter)
Bioinformatik (Genormte SW) ; Microarray (Genormte SW) ; Naturwissenschaften (frei) ; stem cells (frei) ; reprogramming (frei)

Thematische Einordnung (Klassifikation)
DDC: 500

Kurzfassung
Die heutigen biologischen Erkenntnisse stützen sich vor allem auf die technologischen Fortschritte der lezten 30 Jahre. Zur selben Zeit hat sich die Art und Weise, ein biologisches Problem anzugehen, verändert, in dem man auf ein globales Verständnis der zu untersuchenden Systeme hinarbeitet. Die Technik der DNA microarrays erlaubt es, Fragestellungen auf Genomebene zu beantworten. Die Erstellung eines globalen Genexpressionsprofils ist die häufigste Anwendung von DNA microarrays. In dieser Arbeit wurde diese Methode angewandt, um ein besseres, globales Verständnis für die Differenzierung verschiedener Zelltypen unter unterschiedlichsten experimentellen Bedingungen zu erforschen. In dieser Arbeit habe ich (1) DNA microarray Daten mit Hilfe unterschiedlicher Methoden bearbeitet, um neue Gensignaturen in Stammzelldifferenzierung und „Reprogramming“ zu identifizieren und (2) einen Arbeitsablauf für semantische Annotation von DNA microarrays aus öffentlich zugänglichen Datenbanken entwickelt. Dendritische Zellen (DC) wurden mit TGF-beta behandelt und einer globalen Genexpressionsanalys zugeführt. DC stammen von hämatopietischen Stammzellen. Sie initiieren Immunität und induzieren antigen-spezifische Toleranz in der Körperabwehr, daher sind diese Zellen besonders für zellbasierende Therapieansätze von Interesse. In dieser Studie wurden Schlüsselgene aufgedeckt, die bei der Reaktion der dendritischen Zelle auf TGF-beta eine Rolle spielen. Die Chromatinstruktur kann die Genexpression bestimmen und somit auch die Zellidentität und das Zellschicksal. Daher können Substanzen, die die DNA- Methylierung und die Histonacetylierung beeinflussen, die Chromatinstruktur modifizieren, so dass ein erweitertes Entwicklungspotential von zum Beispiel neuralen Stammzellen möglich ist. Microarray Analysen offenbarten die Induktion von Pluripotenz und pluripotenz-assoziierten Genen durch solche Substanzen, und somit eine mögliche Erklärung des veränderten Potentials dieser Zellen. Pluripotente Stammzellen, einschließlich embryonale Stammzellen (ESC), sind in der Lage alle Zelltypen des Körpers zu generieren. Auch wenn die Eigenschaften pluripotenter Stammzellen besonders attraktiv für medizinische Zwecke sind, haben die Isolation und Kultivierung solcher Zellen ethische und technische Bedenken hervorgerufen. Daher haben sich alternative Methoden für die Generierung ES-ähnlicher Zellen von somatischen Zellen oder adulten Stammzellen entwickelt. Die medizinische und wissenschaftliche Anwendung solcher Zellen ist sehr vielversprechend. Genexpressionsprofile von induzierten pluripotenten Stammzellen (iPS Zellen), generiert entweder durch zwei oder vier „reprogramming“ Transkriptionsfaktoren (Oct4 und Klf4 oder Oct4, Klf4, Sox2 und c-Myc), zeigen eine genomische Signatur, die den ESC ähnlich ist. Die Anwendung von DNA microarrays für genomweite Studien bringt eine enorme Menge an Daten mit sich, die in öffentlichen Datenbanken gespeichert sind. Die Beschreibung der Daten erfolgt jedoch in freiem Text. Es ist Aufgabe der Forscher diese Daten mit verständlichen Labeln zu beschreiben, um eine Zuordnung von Experimenten und Anfragen darauf zu ermöglichen. Das Verknüpfen von verschiedenen Informationsquellen benötigt ein einheitliches Vokabular, wie z.B. biomedizinische Ontologien, auf das sich alle Beteiligten geeinigt haben. Ontologien organisieren Informationen in einem definierten Netzwerk von Relationen. In dieser Arbeit wurde ein Arbeitsablauf erstellt, um öffentlich zugängliche microarray Datensätze semantische zu annotieren. Dazu wurden Daten aus Gene Expression Omnibus (GEO), der größten öffentlichen Datenbank für DNA microarrays, extrahiert und mit Hilfe unterschiedlicher Ontologien annotiert. Zur Anwendung kamen dabei „Textmining“, „Outlier Detection“ und „Label Propagation“ Techniken. Label Propagation überträgt dabei Label von bereits annotierten auf noch nicht beschriebene Datensätze, anhand der Ausprägung von Expressionsprofilen, um die Menge an korrekt annotierten Datensätzen zu erhöhen. Integrative Bioinformatik, beschäftigt sich mit einem solchen Zusammenbringen von unterschiedlichen Datentypen, um neue Zusammenhänge unter anderem zwischen Krankheiten, deren Ausprägungen und Genexpressionsprofilen aufzudecken, und wird von dieser Art der standardisierten Annotierung profitieren.

Today’s biology relies heavily on technological advances made during the last 30 years. At the same time, the way of analyzing a biological question changed and nowadays we aim at understanding globally the system under study. DNA microarray technology allows events to be measured at a genome wide scale leveraging the need for an educated guess approach. Global gene expression profiling is the most frequent application of DNA microarrays and is used to study different cell types in diverse experimental setup. In this work, I have (1) subjected DNA microarray data to different mining approaches for the identification of gene signatures in stem cell differentiation and reprogramming, and (2) developed a workflow for semantic annotation of microarray data from public repositories. Dendritic cells (DC) were treated with TGF-beta and subjected to global gene expression profiling. DC are derived from hematopoietic stem cells. They initiate immunity and induce antigen-specific tolerance making these cells major candidates for cell-based therapies. Our study revealed key regulatory factors in the answer of DC to TGF-beta. Chromatin structure determines gene expression and thereby cell identity and cell fates. Thus, specific drugs that alter DNA methylation and histone acetylation modify the chromatin structure and were found to broaden the developmental potential of neural stem cells. Microarray analysis revealed the induction of pluripotency and pluripotency associated genes by drug treatment and this is suggested to account for the altered potential of these cells. Pluripotent stem cells, including embryonic stem cells (ESC), are able to generate all cell types present in the adult body, however the isolation and cultivation of such cells raised some ethical and technical concern. For this reason alternative methods have been developed to generate ES-like cells from somatic cells or adult stem cells. The medical and research applications of such cells are extremely promising. Gene expression profiling of induced pluripotent stem (iPS) cells, either generated using two or four reprogramming transcription factors (Oct4 and Klf4 or Oct4, Klf4, Sox2 and c-Myc), revealed a genomic signature similar to ESC. The gene array technology underlying such studies generates an enormous amount of data that is usually stored in database made available to the community. However the descriptions available for the experiments are made in free text. Thus, retrieving and associating microarray experiments is subjected to a comprehensible labeling from the submitter. Linking different sources of data requires description made in a vocabulary on which everybody agrees such as biomedical ontologies. Ontology organizes knowledge of a particular domain in a define network of relationships. In this work I developed a workflow for semantic annotation of microarray public repositories. Gene Expression Omnibus (GEO), the biggest public repository of microarray data, was subjected to the workflow and annotated using different ontologies. The method relies on text mining, outlier detection and an algorithm for label propagation of labeled objects to unlabeled objects, in order to increase the labeling coverage. The algorithm adapts the label propagation to the specificity of the biological sample type measured. Integrative bioinformatics studies that merge different data types to discover new relationships between diseases, phenotypes and gene expression profiles will benefit from standardized annotation of the experiments.

Fulltext:
Download fulltext PDF

Dokumenttyp
Dissertation / PhD Thesis

Format
online, print

Sprache
English

Externe Identnummern
HBZ: HT015974832

Interne Identnummern
RWTH-CONV-113341
Datensatz-ID: 50815

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Faculty of Mathematics, Computer Science and Natural Sciences (Fac.1) > Department of Computer Science
Publication server / Open Access
Public records
Publications database
122510
120000

 Record created 2013-01-25, last modified 2022-04-22


Fulltext:
Download fulltext PDF
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)