Computational methods for RNA 3D structure prediction and comparison

Petersen, Nils Peter

Titel:	Computational methods for RNA 3D structure prediction and comparison
Sonstige Titel:	Computermethoden für Vorhersagen und Vergleiche von 3D RNA-Strukturen
Sprache:	Englisch
Autor*in:	Petersen, Nils Peter
Schlagwörter:	3D Struktur; Strukturvorhersage; bioinformatics; RNA; simulation; coarse grain; structure comparison; structure alignment; structure prediction; optimizations; 3D structure
GND-Schlagwörter:	BioinformatikGND SimulationGND Kraftfeld RNSGND Struktur Vergleich AlgorithmusGND SoftwareGND Molekülstruktur
Erscheinungsdatum:	2020
Tag der mündlichen Prüfung:	2020-06-26
Zusammenfassung:	This thesis presents several new methods and tools for the computational prediction and comparison of three-dimensional (3D) RNA structures. The prediction of 3D macromolecular structures would reduce the effort invested in costly experiments. The established tool NAST uses molecular dynamics simulations and a knowledge-based force field to sample low resolution structure models of RNA molecules. In this work, a major flaw in the design of the force field is described, which causes numerical instabilities during the simulations. The way in which the respective energy terms are defined results in steep cliffs in the energy landscape for some combinations of bond and torsion angles. A new program NASTI (NAST Improved) is introduced as a numerically stable replacement for NAST. Several improvements were made to the formulation and parameterisation of the energy terms. The most important is a new smoothed energy term for the torsion angles which takes the neighboring bond angles into account removing the instabilities. Simulations were conducted to compare NASTI and NAST. NASTI runs steadily for millions of steps while NAST suffers routinely numerical catastrophes. Sampled structure models were assessed via comparison to crystal structures. For different test cases NASTI produces structures with equal or better quality compared to NAST. Studies of evolution and function are often based on the comparison of large numbers of 3D structures. This requires fast methods. Several approaches to this problem were developed in this project. First, a new structural alphabet description of the RNA backbone is described. Structural alphabets are used to reduce the 3D shape of a macromolecule to a one-dimensional string of letters. The method presented here was developed specifically for RNA structure comparison. Unlike previous approaches, the procedure to find the mapping of backbone fragments to letters is formulated as an optimization task with the objective to find similar regions shared by distinct structures. The next developments presented here are two new tools for RNA 3D structure alignment. ALFONS uses the structural alphabet representation and CVRRY deploys novel geometric descriptors comprising inter-nucleotide distances and a chirality measure. Both tools are implemented into the same framework and share algorithms for alignment and superposition. A benchmark against three state of the art programs shows that the new tools are considerably faster while producing satisfactory alignments. Finally, the programs URSULA and FREEDOLIN were developed for applications where even faster comparisons are required. The tools use the new structural alphabet representation and enhanced suffix arrays for quick alignment-free comparison. An estimate of statistical significance of substring matches improves the accuracy. Database searches were conducted to demonstrate the ability of the two methods to find related structures. Both tools are very fast, while producing results of quality comparable to a previously published method. Diese Arbeit beschreibt neue Methoden und Programme für automatische Vorhersagen und Vergleiche dreidimensionaler (3D) RNA-Strukturen. Mit Hilfe zuverlässiger Vorhersagen makromolekularer 3D-Strukturen ließe sich viel Arbeit für aufwendige Experimente sparen. Das etablierte Programm NAST erzeugt RNA-Strukturmodelle mit niedriger Auflösung mittels Molekulardynamik-Simulation. In dieser Arbeit wird ein grundlegender und schwerwiegender Fehler im Aufbau des verwendeten Kraftfeldes beschrieben. Die Kombination von Termen für Bindungs- und Torsionswinkel führt zu extremen Steigungen in der Energiefunktion und dadurch zu numerisch instabilen Simulationen. Um dieses Problem zu beheben, wurde NASTI (NAST Improved) entwickelt. Form und Parameterisierung der Energieterme wurden durch unterschiedliche Veränderungen verbessert. Die wichtigste Erneuerung ist ein Energieterm für Torsionswinkel, der durch Hinzunahme der benachbarten Bindungswinkel die Simulationen stabilisiert. Während NASTI ohne numerische Probleme über Millionen Zeitschritte läuft, enden NAST-Simulationen regelmäßig in numerischen Katastrophen. Vergleicht man die vorhergesagten Modelle mit bekannten 3D-Strukturen, zeigt sich außerdem, dass NASTI gegenüber NAST gleichwertige oder bessere Ergebnisse erzielt. 3D-Strukturvergleiche sind zentrale Werkzeuge in Studien zur Evolution und Funktion von Makromolekülen. Im Rahmen der vorliegenden Arbeit wurden deshalb Methoden zum schnellen Vergleich von RNA-Strukturen entwickelt. Zunächst wird eine neue Methode, das RNA-Rückgrat durch ein Strukturalphabet zu beschreiben, vorgestellt. Strukturalphabete reduzieren 3D Molekülstrukturen auf eindimensionale Buchstabenfolgen. Die hier vorgestellte Methode ist speziell für den RNA-Strukturvergleich optimiert. Die Abbildung von Strukturfragmenten auf Alphabetsbuchtstaben wurde durch einen Suchalgorithmus mit dem Ziel, ähnliche Bereiche zwischen verschiedenen Strukturen zu finden, optimiert. Anschließend werden zwei neue Programme zur Berechnung von RNA-Strukturalignments vorgestellt. ALFONS verwendet das neue Strukturalphabet und CVRRY beruht auf der Verwendung geometrischer Deskriptoren für Rückgratfragmente. Die beiden Programme sind im Vergleich zu drei etablierten Methoden deutlich schneller und produzieren ähnlich gute Alignments. Für Anwendungen, die noch schnellere Strukturvergleiche erfordern, werden die Programme URSULA und FREEDOLIN vorgestellt. Indexstrukturen auf Sequenzen des neuen Strukturalphabets ermöglichen die Suche nach ähnlichen Strukturen in großen Datenbanken. Ein Signifikanzmaß für einander gleichende Teilsequenzen erhöht die Genauigkeit der Suchen. Im Vergleich zu einem bekannten Programm produzieren FREEDOLINund URSULA vergleichbare bis bessere Ergebnisse.
URL:	https://ediss.sub.uni-hamburg.de/handle/ediss/8466
URN:	urn:nbn:de:gbv:18-106054
Dokumenttyp:	Dissertation
Betreuer*in:	Torda, Andrew E. (Prof. Dr.)
Enthalten in den Sammlungen:	Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:

Datei	Beschreibung	Prüfsumme	Größe	Format
Dissertation.pdf		0cb52680480699080e4f48393d414433	12.98 MB	Adobe PDF	Öffnen/Anzeigen

Zur Langanzeige

Diese Publikation steht in elektronischer Form im Internet bereit und kann gelesen werden. Über den freien Zugang hinaus wurden durch die Urheberin / den Urheber keine weiteren Rechte eingeräumt. Nutzungshandlungen (wie zum Beispiel der Download, das Bearbeiten, das Weiterverbreiten) sind daher nur im Rahmen der gesetzlichen Erlaubnisse des Urheberrechtsgesetzes (UrhG) erlaubt. Dies gilt für die Publikation sowie für ihre einzelnen Bestandteile, soweit nichts Anderes ausgewiesen ist.

Info

Seitenansichten

564

Letzte Woche

Letzten Monat

geprüft am 15.04.2024

Download(s)

247

Letzte Woche

Letzten Monat

geprüft am 15.04.2024

Werkzeuge

Google Scholar^TM

Prüfe

Dateien zu dieser Ressource:

Seitenansichten

Download(s)

Google ScholarTM

Google Scholar^TM