Development and application of bioinformatics tools for analysis of dual RNA-seq experiments

Entwicklung und Anwendung von Bioinformatikwerkzeugen für die Analyse von dualen RNA-seq Experimenten

Please always quote using this URN: urn:nbn:de:bvb:20-opus-281264
  • Dual RNA-seq captures both host and pathogen transcriptomes at the site of infection, facilitating an exploration of processes that play an essential role in pathogenesis and the host defense. This work presents an application of this technique to explore processes occurring during the infection of the human endothelial cells with two clinical isolates of Orientia tsutsugamushi (Ot) — the causative agent of scrub typhus. Combining comparative genomics, transcriptomics, and proteomics, we investigated the transcriptional architecture of Ot andDual RNA-seq captures both host and pathogen transcriptomes at the site of infection, facilitating an exploration of processes that play an essential role in pathogenesis and the host defense. This work presents an application of this technique to explore processes occurring during the infection of the human endothelial cells with two clinical isolates of Orientia tsutsugamushi (Ot) — the causative agent of scrub typhus. Combining comparative genomics, transcriptomics, and proteomics, we investigated the transcriptional architecture of Ot and identified non-coding RNAs, operon structures, and widespread antisense transcription, that may have a role in regulation of repetitive genes that are abundant in the Ot genome. In addition, the comparative analysis of bacterial and eukaryotic transcriptomes allowed us to investigate factors that drive the difference in virulence between Karp and UT176 and the host response to these two Ot strains. The host and pathogen transcriptional profiles in each dual RNA-seq study are obtained in‑silico by adopting tools developed for RNA-seq data analysis. The Dualrnaseq pipeline presented in the second part of this work is the first publicly available, highly reproducible, scalable, and user‑friendly workflow developed for processing dual RNA‑seq data of any eukaryotic and bacterial organisms with a reference genome and annotation. It provides three mapping and quantification strategies: (i) alignment-based mapping of reads onto the chimeric genome with STAR followed by counting of uniquely mapped reads with HTSeq; (ii) a fast transcriptome quantification method handling multi‑mapped reads (Salmon with Selective Alignment); (iii) and Salmon alignment-based mode which uses a STAR‑derived alignment combined with Salmon quantification. Performing an initial benchmark analysis of the employed methods we provided recommendations ensuring accurate estimation of host and pathogen transcript expression.show moreshow less
  • Duale RNA-seq erfasst sowohl das Transkriptom des Wirts als auch das des Erregers am Ort der Infektion und ermöglicht so die Erforschung von Prozessen, die eine wesentliche Rolle bei der Pathogenese und der Abwehr des Wirts spielen. In dieser Arbeit wird eine Anwendung dieser Technik zur Untersuchung von Prozessen vorgestellt, die während der Infektion menschlicher Endothelzellen mit zwei klinischen Isolaten von Orientia tsutsugamushi (Ot) - dem Erreger von Scrub-Typhus - ablaufen. Durch die Kombination von vergleichender Genomik,Duale RNA-seq erfasst sowohl das Transkriptom des Wirts als auch das des Erregers am Ort der Infektion und ermöglicht so die Erforschung von Prozessen, die eine wesentliche Rolle bei der Pathogenese und der Abwehr des Wirts spielen. In dieser Arbeit wird eine Anwendung dieser Technik zur Untersuchung von Prozessen vorgestellt, die während der Infektion menschlicher Endothelzellen mit zwei klinischen Isolaten von Orientia tsutsugamushi (Ot) - dem Erreger von Scrub-Typhus - ablaufen. Durch die Kombination von vergleichender Genomik, Transkriptomik und Proteomik untersuchten wir die Transkriptionsarchitektur von Ot und identifizierten nicht-kodierende RNAs, Operon-Strukturen und weit verbreitete Antisense-Transkription, die möglicherweise eine Rolle bei der Regulierung repetitiver Gene spielen, die im Ot-Genom reichlich vorhanden sind. Darüber hinaus ermöglichte uns die vergleichende Analyse der bakteriellen und eukaryotischen Transkriptome die Untersuchung der Faktoren, die für die unterschiedliche Virulenz von Karp und UT176 und die Reaktion des Wirts auf diese beiden Ot-Stämme verantwortlich sind. Die Wirts- und Erreger-Transkriptionsprofile in jeder dualen RNA-seq-Studie werden in-silico mit Hilfe von Tools erstellt, die für die RNA-seq-Datenanalyse entwickelt wurden. Die im zweiten Teil dieser Arbeit vorgestellte Dualrnaseq-Pipeline ist der erste öffentlich verfügbare, hochgradig reproduzierbare, skalierbare und benutzerfreundliche Arbeitsablauf, der für die Verarbeitung dualer RNA-seq-Daten beliebiger eukaryotischer und bakterieller Organismen mit einem Referenzgenom und einer Annotation entwickelt wurde. Er bietet drei Mapping- und Quantifizierungsstrategien: (i) Alignment-basiertes Mapping von Reads auf das chimäre Genom mit STAR, gefolgt von der Zählung eindeutig gemappter Reads mit HTSeq; (ii) eine schnelle Transkriptom-Quantifizierungsmethode, die mit mehrfach gemappten Reads arbeitet (Salmon mit selektivem Alignment); (iii) und einen Salmon-Alignment-basierten Modus. In einer ersten Benchmark-Analyse der verwendeten Methoden haben wir Empfehlungen ausgesprochen, die eine genaue Schätzung der Expression von Wirts- und Pathogentranskripten gewährleisten.show moreshow less

Download full text files

Export metadata

Metadaten
Author: Bozena Mika-GospodorzGND
URN:urn:nbn:de:bvb:20-opus-281264
Document Type:Doctoral Thesis
Granting Institution:Universität Würzburg, Graduate Schools
Faculties:Medizinische Fakultät
Graduate Schools / Graduate School of Life Sciences
Referee:Jun.-Prof. Dr. Lars Barquist, Prof. Dr. Vera Kozjak-Pavlovic
Date of final exam:2022/07/28
Language:English
Year of Completion:2022
DOI:https://doi.org/10.25972/OPUS-28126
Sonstige beteiligte Institutionen:Helmholtz Institute for RNA-based Infection Research (HIRI)
Dewey Decimal Classification:6 Technik, Medizin, angewandte Wissenschaften / 61 Medizin und Gesundheit / 610 Medizin und Gesundheit
GND Keyword:Transkriptomanalyse; Orientia tsutsugamushi
Tag:Dual RNA-seq data analysis
Release Date:2022/08/01
Licence (German):License LogoCC BY-SA: Creative-Commons-Lizenz: Namensnennung, Weitergabe unter gleichen Bedingungen 4.0 International