Dissertation CC BY 4.0
Veröffentlicht

Differential RNA-Seq and transcription start site annotation in Chlamydia

Chlamydiae are obligate intracellular Gram-negative bacteria that infect a wide range of hosts. However, host specificity and virulence of the individual species differ drastically even though all members of the phylum share the majority of genes which are encoded on a much reduced genome. Striking examples of this contrast are seen in the close relatives Chlamydia (C.) psittaci and C. abortus. C. psittaci is the causative agent of psittacosis, the most widespread zoonotic chlamydiosis, while the less widespread C. abortus is still of clinical relevance because of its ability to colonize the human placenta. Other chlamydia-like organisms, such as Waddlia (W.) chondrophila, also occasionally infect humans, cause similar symptoms and exhibit the Chlamydia-specific biphasic developmental cycle. In this work, differential RNA-Sequencing (dRNA-Seq) was applied to purified infectious and non-infectious developmental forms of C. psittaci, C. abortus and W. chondrophila. The comparison revealed that both, infectious and non-infectious states contain distinct transcriptomes that match their biological functions. Furthermore, considerable differences in the expression of homologous virulence factors were found. A second focus of this work was the reliable annotation of transcription start sites (TSSs) using dRNA-Seq data. The presented approach is based on optimization and combination of three TSS annotation tools and its success was validated with data from Escherichia (E.) coli for which besides the dRNA-Seq another high throughput data set (Cappable-seq) for TSS annotation was available. In total 9,802 TSSs with high precision were identified based on data of E. coli, C. pneumoniae, C. psittaci, C. abortus and W. chondrophila. Knowing the precise TSSs positions, the corresponding 5’ untranslated regions (UTRs) and conservation among species could be analyzed. This revealed that among Chlamydia, positions of TSSs and 5’UTR sequences are evolutionary less conserved than the corresponding coding sequences. This is fascinating because the coding sequences of Chlamydia are conserved and it has been indicated that the differing expression levels of transcripts, rather than sequence dissimilarities alone might contribute to the differences in host specificity and tissue tropism. In concordance, varying TSSs positions, 5’UTR and promoter sequences may contribute to the distinct expression levels observed for highly conserved genes. Furthermore, a promoter motif analysis was performed based on the TSS annotations and 2,157 chlamydial promoters (60.57%) with conserved motifs were found most of which contain potential factor binding sites.σ In summary, the work describes a gene expression analyses of EB and RBs and the reliable annotation of TSSs using dRNA-Seq data.

Chlamydiae sind obligat intrazelluläre Gram-negative Bakterien die eine Vielzahl von Wirtsorganismen befallen. Alle Arten des Phylums besitzen ein reduziertes Genom und die Mehrzahl der proteinkodierenden Gene ist konserviert. Trotz dieser Gemeinsamkeiten sind Wirtsspezifität und Gewebetropismus der einzelnen Spezies stark verschieden. Exemplarische hierfür sind Chlamydia (C.) psittaci und C. abortus. C. psittaci ist der Erreger der Psittakose (Papageienkrankheit), welche die weitverbreitetste zoonotische Form der Chlamydiose darstellt. C. abortus Infektionen sind weniger häufig, aber dennoch von klinischer Relevanz wegen der Fähigkeit des Erregers die Plazenta zu befallen. Neben den „klassischen“ Spezies die alle zur Familie der Chlamydiaceae gehören wurden in den letzten Jahrzehnten verschiedene neue Arten entdeckt. Einige von ihnen, wie z.B. Waddlia (W.) chondrophila, können auch den Menschen befallen und die Krankheitsbilder ähneln den der Chlamydiaceae. Eine weitere Gemeinsamkeit aller Chlamydien ist der charakteristische biphasische Entwicklungszyklus in dem infektiöse Elementarkörperchen (EK) und Retikularkörperchen (RK) wechseln. In der vorliegenden Arbeit wurden die Transkriptome der EK und RK analysiert. Dazu wurde eine Methode namens differentielle RNA Sequenzierung (dRNA-Seq) verwendet und ein Vergleich von C. psittaci, C. abortus und W. chondrophila zeigte, dass beide Formen große Unterschiede in der Genexpression aufweisen. Des Weiteren sind viele homologe Virulenzfaktoren in den Spezies unterschiedlich stark exprimiert, was zu den verschieden Krankheitsbildern beitragen könnte. Ein zweiter Schwerpunkt der Arbeit lag auf der präzisen Bestimmung der Tanskriptionsstartseiten (TSSs) mithilfe der dRNA-Seq Daten. Zu diesem Zweck wurden die Vorhersagen drei verschiedener Programme optimiert und kombiniert. Diese Herangehensweise konnte mit Daten von Escherichia (E.) coli validiert werden, da neben den dRNA-Seq auch ein weiterer Datensatz (Cappable-seq) zum Abgleich zur Verfügung stand. Insgesamt konnten auf diese Weise 9.802 TSSs mit großer Genauigkeit in E. coli, C. pneumoniae, C. psittaci, C. abortus und W. chondrophila bestimmt werden. Des Weiteren, war es möglich durch die genaue Lokalisation der TSSs die 5' untranslatierten Bereiche (5‘UTRs) und deren Konservierung zu analysieren. Dadurch wurde gezeigt, dass die TSS Positionen und 5'UTRs weniger stark konserviert sind als die dazugehörigen kodierenden Sequenzen. Diese Differenz könnte zu den Expressionsunterschieden stark konservierter Gene zwischen den Spezies beitragen. Ferner wurden in 2.157 Promotoren (60,57%) konservierte Motive gefunden von denen die meisten potenzielle σ-Faktor Bindestellen sind. Zusammengefasst beschreibt die vorliegende Arbeit die Analyse der EK und RK Transkriptome und eine präzise TSS Bestimmung.

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.

Rechte

Nutzung und Vervielfältigung: