New methods towards the prediction of the structure of transmembrane proteins and the simulation of helix-dynamics on large time-scales

Staritzbichler, René

New methods towards the prediction of the structure of transmembrane proteins and the simulation of helix-dynamics on large time-scales

Methoden zur Strukturvorhersage von Transmembranproteinen und die Berechnung der Langzeitdynamik von Helices

Transmembrane proteins play crucial roles in biological systems as active or passive channels and receptors. Experimentally only few structures could be determined so far. Gaining structural insights enables besides a general understanding of biological mechanisms also further processing such as in drug design. Due to the lack of experimental data, reliable theoretical predictions would be of high value. However, for the same reason, missing data, the knowledge-based class of prediction methods that is well established for soluble proteins can not be applied. The goal of predicting transmembrane protein structures with ab initio methods demands locating the free energy minimum. Main difficulties here are, first, the computational costs of explicitly calculating all involved interactions and, second, providing an algorithm that is capable of finding the minimum within an extremely complex and rugged energy landscape. We have developed promising energy functions that describe the interactions of amino acids on a residue level, reducing computational costs while still containing most information on the atomistic level. We have also found a way to describe the interaction of the residues with its surrounding in a realistic manner by distinguishing residues exposed to the environment from those buried within helices using a sphere algorithm. The sphere algorithm can also be applied for a different purpose: one can measure how densely sidechains are packed for certain helical conformations, and thereby get an estimate of the sidechain entropy. In addition, overcrowding effects can be identified which are not well-described by the energy functions due to the pairwise calculation. To determine the absolute free energy minimum, we assume the helices to be located on an equidistance grid with slightly larger distances than to be expected. Optimizing the helices on the grid provides a starting point that should enable common minimizing algorithms, gradient-based or not, to find the absolute minimum beyond the grid. To simulate the dynamics of the helices on large time scales, we split them into rigid body dynamics and internal dynamics in terms of the dihedrals. The former one is well-known with its inherent problem of numerical drift and plenty of approaches to it, among which we have chosen the quaternions to represent the rotation of the rigid bodies. The latter one requires a detailed analysis of the torque size exerted on the dihedrals caused by the forces acting on the residues.
In dieser Arbeit werden neue Methoden zur dreidimensionalen Strukturvorhersage von Transmembranproteinen vorgestellt. Die Methoden setzen die Kenntnis der Primär- und der Sekundärstruktur der Proteine voraus. Transmembranproteine spielen eine wesentliche Rolle in einer Vielzahl biologischer Prozesse in ihrer Funktion als aktive und passive Kanäle und als Rezeptoren. Fehlfaltungen und andere Störungen ihrer Funktion können am Entstehen von Krankheiten wie z.B. Alzheimer beteiligt sein. Einige Krankheitserreger docken an Transmembranproteine an. Zudem sind sie das Ziel von ca. 50% aller Medikamente. Das Wissen über die Struktur der Transmembranproteine bietet die Grundlage für die weitere Verarbeitung, z.B. in den Methoden des Drug-Designs. Experimentell konnten trotz ihrer Bedeutung und trotz großer Anstrengungen bisher nur wenige Strukturen bestimmt werden. Dies ist bedingt durch technische Schwierigkeiten in der Erzeugung zwei- oder dreidimensionaler Protein-Kristalle. Die Kristalle können mittels Röntgenbeugung bzw. Elektronenmikroskopie Aufschluß über die Struktur geben. Die Struktur kleinerer Transmembranproteine wie z.B. Glycophorin A konnten mit Hilfe der Kernspinresonanz-Spektroskopie gelöst werden, bei der keine Kristallisation der Proteine benötigt wird. Andere spektroskopische Methoden wie Infrarot-Spektroskopie lieferten weitere strukturell-funktionale Informationen. Aufgrund der experimentellen Schwierigkeiten wären verlässliche, theoretische Vorhersagen von hohem Wert. Statistische und Homologie-Methoden, welche für lösliche Proteine sehr erfolgreich sind, können aufgrund der geringen Anzahl gelöster Strukturen noch nicht angewendet werden. Eine Ab-initio-Strukturvorhersage ist die Suche nach derjenigen Struktur mit der geringsten freien Enthalpie, die mit höchster Wahrscheinlichkeit in der Natur zu finden ist. Diese Art der Strukturvorhersage beinhaltet die Berechnung der freien Enthalpie einer gegebenen Struktur und dem Suchen im Raum der möglichen Strukturen nach derjenigen mit der minimalen Enthalpie. Bei den hier vorgestellten Methoden handelt es sich um ein Multi-Skalen- Verfahren, das es erlaubt, die Suche nach der nativen Struktur in verschiedenen Genauigkeiten bzw. Geschwindigkeiten durchzuführen. Eine erste Eingrenzung möglicher Strukturen wird mittels der Reduktion auf ein Residuenmodell und der Beschränkung auf ideale Helices erreicht. Hierdurch werden Freiheitsgrade und die Anzahl der zu berechnenden Wechselwirkungen wesentlich verringert. Die Ergebnisse dieser reduzierten Betrachtung dienen dann als Ausgangspunkt für die Verfeinerung durch atomistische MD-Simulationen der gesamten Proteine und ihrer Umgebung. Die zu berechnende Energie setzt sich zusammen aus den Wechselwirkungen der Aminosäuren untereinander und den Wechselwirkungen der Aminosäuren mit ihrer Umgebung. Umgebung können die drei Phasen der wässrigen Lösung, der Lipidkopfgruppen und die der Lipidketten sein. Die Grundidee ist, die Wechselwirkungsenergien der Aminosäuren im atomistischen Detail zu berechnen und die Ergebnisse mit einer mathematischen Funktion anzunähern. Die Verwendung dieser in der Anwendung weit weniger zeitaufwendigen, angenäherten Funktionen ist der Übergang zu der Residuenskala. Insbesondere bei der Residuen-Residuen-Wechselwirkung werden im wesentlichen Beiträge zur inneren Energie berechnet. Der entropische Anteil ist schwierig vorherzusehen, da er eigentlich erst aus der Gesamtsituation heraus berechenbar wird. Die Entropie ist eine Funktion der Gesamtzahl der für ein System bei gegebenem Energieintervall erreichbaren Zustände. Einige entropische Beiträge können abgeschätzt werden, andere sind relativ konstant. Es bleiben jedoch Beiträge, die einem Residuenmodell nicht zugänglich sind. Um die Wechselwirkung der Aminosäuren im atomistischen Detail zu berechnen, verwenden wir kurze MD-Simulationen von jeweils zwei Aminosäuren. Diese werden für eine ausreichende Anzahl verschiedener Abstände und Orientierungen der betreffenden Aminosäuren durchgeführt. 1 Es gibt verschiede Möglichkeiten, die Energiewerte durch Fit-Funktionen anzunähern. In dieser Arbeit wird ein Satz von einfachen, eindimensionalen und winkelparametrisierten Polynomfunktionen verwendet, die ohne Aufwand differenziert werden können. Anstelle einer Funktion je Residuenpaar, welche die Residuen in allen Orientierungen und Abständen beschreibt, sind es mehrere, rein abstandsabhängige Funktionen, welche die Residuen in jeweils einer bestimmten Orientierung beschreiben. Nach Einführung eines Maximalwertes für die in Betracht gezogenen Energien ist die Fitprozedur stabil und kann automatisiert werden. Die Daten der Fitfunktionen sind im atomistischen Detail berechnet worden, beim Durchsuchen des Konformationsraumes ist die Verwendung der Fitfunktionen jedoch wesentlich schneller als explizite Berechnungen. Um die Wechselwirkung eines Proteins mit seiner Umgebung in einem Residuum- Modell zu berechnen, werden zwei Informationen benötigt. Erstens muss die Wechselwirkung der Residuen mit der jeweiligen Umgebung bekannt sein. Hierfür werden Literaturwerte für die freien Lösungs-Enthalpien der Residuen in Wasser und Chloroform verwendet. Diese wurden in unserer Arbeitsgruppe von Gu et al.[38] durch MD-Simulationen und Methoden der Multiconfiguration-Thermodynamic- Integration berechnet und sind in guter Übereinstimmung mit den existierenden experimentellen Werten. Der Übergang in der Kopfgruppenregion wird durch eine Funktion der hierfür üblichen Form angenähert. Zweitens müssen Residuen, welche ihrer Umgebung ausgesetzt sind, von denen unterschieden werden, die zwischen den Helices "begraben" sind, von denen also keine Wechselwirkung mit der Umgebung zu erwarten ist. Diese Unterscheidung wird insbesondere bei größeren Systemen wesentlich. Hierfür verwenden wir einen einfachen Kugelalgorithmus. Jedem Residuum wird eine Kugel zugeordnet, 1 Aus technischen Gründen werden Tripeptide in helikaler Konformation (G-X-G) simuliert, von denen die äußeren beiden Glycine als Attrappen mitgeführt werden und keine Auswirkung auf die Energiewerte haben. mit dem Mittelpunkt an der Position des Ca-Atoms. Für die Radien werden ebenfalls Literaturwerte genommen. Die Kugeln von Residuen, welche vergraben sind, werden vollständig von anderen Kugeln überlappt. Kugeln von Residuen an der Oberfläche der Proteine haben freie Oberflächen, welche nicht von anderen Kugeln überlappt werden - umso größere, je mehr sie der Umgebung ausgesetzt sind. Wir betrachten daher die Wechselwirkung mit der Umgebung als proportional zu der freien Oberfläche, die einem Residuum zugeordnet werden kann. Die Implementierung des Kugelalgorithmus basiert auf einer vektoriellen Integration in Kugelkoordinaten. Die ideale Größe der Kugeln hängt mit der Additivität der Lipophilizitäten zusammen. Diese wird zur Zeit von Gu et al. untersucht, indem die oben erwähnten Methoden zur Bestimmung der Lipophilizitäten auf Peptide mit mehreren Aminosäuren angewendet werden. Der Vergleich mit diesen Ergebnissen sollte eine Optimierung der Kugelradien ermöglichen. Es hat sich herausgestellt, dass der Kugelalgorithmus in leicht modifizierter Form weitere sinnvolle Anwendungen gestattet. Wir bezeichnen einen Überlapp zweier Kugeln als Überlapp erster Ordnung usw. Je größer der Überlapp einer höheren Ordnung ist, desto dichter sind die Residuen gepackt. Eine höhere Dichte schränkt die Zahl möglicher Konformationen für einen bestimmten Energiebereich ein, d.h. sie führt zu einer geringeren Entropie und damit zu einer höheren freien Enthalpie. Daher ermöglicht die Berechnung des Überlapps höherer Ordnung eine Abschätzung der Seitenkettenentropie. Wird ein bestimmter Grenzwert der Dichte überschritten, wird die freie Enthalpie der Helices stark zunehmen, da nicht mehr ausreichend Raum für die Residuen vorhanden ist. Nach der notwendigen Skalierung ist hiermit auch bei Überschreiten eines Grenzwertes ein Indikator für zu dichte Packungen gegeben, welche bei der üblichen paarweisen Berechnung des Residuenpotentials nicht erfasst werden können. Skaliert werden könnte der Algorithmus durch den Vergleich mit MD-Simulationen ganzer Helices. Für die Abschätzung der Seitenkettenentropie müssen Überlapp und Seitenkettenbeweglichkeit in den Simulationen miteinander verglichen werden. Des Weiteren muß der Grenzwert des Überlapps bestimmt werden, ab dem mit einem drastischen Energieanstieg aufgrund zu hoher Dichte der Seitenketten zu rechnen ist. Schliesslich bedarf es einer Skalierung des Überschreitens dieses Grenzwertes. Diese Skalierungen stehen noch aus. Trotz seiner konzeptuellen Einfachheit stellt der Kugelalgorithmus ein vielseitiges Hilfsmittel auf der Ebene des Residuenmodells dar. Das aus zwei identischen Transmembranhelices gebildete Glycophorin A ist ein ideales Testsystem mit bekannter Struktur um die bislang vorgestellten Methoden zu prüfen. Wenn man Glycophorin A als starren Körper mit den ihm eigenen Symmetrien betrachtet, hat man einen fünfdimensionalen Konformationsraum, den man vollständig durchsuchen kann, ohne die im folgenden dargestellten Suchmethoden verwenden zu müssen. Die Residuen-Umgebung-Wechselwirkung als auch der Dichte-Packung-Algorithmus favorisieren die Umgebung der nativen Struktur. Die Residuen-Residuen-Wechselwirkung dagegen identifiziert eine andere Region als absolutes Minimum. Gründe hierfür können u.a. sein, dass die Residuen-Residuen-Funktionen bislang nur für parallele Helices berechnet wurden und die Verkippung der Helices nicht ausreichend gut beschrieben wurde. Ein weiterer Faktor ist, dass die Funktionen Vakuumwechselwirkungen ohne polarisierbares Medium dazwischen beschreiben. Die Verwendung von im Vakuum berechneten Werten ist nicht immer sinnvoll. Zum Einen sind Teile der Helices durch Lipide voneinander getrennt, zum Anderen werden die Residuen häufig durch andere Residuen abgeschirmt. Hinzu kommt noch der Faktor, dass die Energien paarweise berechnet wurden und eine Abweichung in der Seitenkettenmobilität zu erwarten ist, wenn die Residuen in helikale Strukturen eingebettet sind. Dies sollte ebenfalls die Energiewerte beeinflussen. Park et al.[43] konnten durch eine Verschiebung der Residuenpositionen von den Ca-Positionen zu den geometrischen Zentren der Seitenketten die Qualität der Energiefunktionen deutlich verbessern. Ein ähnliches Vorgehen führte auch in dieser Arbeit zu einer wesentlichen Verbesserung der Ergebnisse. Dieser Schritt ist analog einer Kombination aus Dämpfungsterm und einer Beschränkung der Seitenkettenmobilität. Die Einführung eines Entfernungs-Grenzwertes, der alle Wechselwirkungen gleich Null setzt wenn die Entfernung oberhalb des Grenzwertes liegt, führte zu einer weiteren Verbesserung. Obwohl aufgrund dieser Modifikationen die Qualität der Energiefunktionen deutlich verbessert werden konnte, ist es zweifelhaft, ob zu dem aktuellen Stand für größere Systeme wie Bakteriorhodopsin verlässliche Ergebnisse zu erwarten wären. Insbesondere die Verkippung bis hin zu antiparallelen Helices spielt bei Bakteriorhodopsin eine noch wesentlichere Rolle. Die weiteren Methoden werden daher nur grundsätzlich beschrieben und einige einfache Tests duchgeführt. Die ursprüngliche Idee für die Suche nach dem absoluten Minimum war eine Kombination aus einer Monte-Carlo Suche und einem genetischen Algorithmus. Es stellte sich heraus, dass dieses Vorgehen nicht der Komplexität der Energielandschaft gewachsen ist. Auch Methoden, die auf einer Gradientenbildung beruhen, sind dieser Aufgabe allein nicht gewachsen. Um in der weitläufigen und zerklüfteten Energielandschaft nicht in einem lokalen Minimum hängen zu bleiben, bedarf es einer Hilfestellung. Eine erfolgreiche Anwendung existierender Minimierungsalgorithmen ist nur dann zu erwarten, wenn die Anfangskonformation so geschickt gewählt wird, dass keine groben Hindernissse den Algorithmus stören können. Den Konformationsraum vollständig zu durchsuchen, ist zu aufwendig; andererseits dürfen keine Regionen unabgetastet bleiben. Wir betrachten die Energielandschaft zunächst aus der Vogelperspektive, indem wir die Helices auf einem Equidistanzgitter plazieren, deren Abstand größer ist als der zu erwartende Abstand im Protein. Die Helices auf diesem Gitter zu optimieren, um sie dann loszulassen und dem Minimierungsalgorithmus zu übergeben, ist längst nicht so aufwendig wie das Durchsuchen des gesamten Konformationsraumes und gleichzeitig ausreichend vollständig. Um die Helices auf dem Gitter zu optimieren, werden die in Frage kommenden Helices in Dreier-Kombinationen systematisch abgetastet. Aus diesen Dreier-Scans lassen sich dann die minimalen Konformationen des gesamten Proteins rekombinieren. Praktisch bedeutet dies für die Untersuchung eines Proteins, dessen Struktur gänzlich unbekannt ist, dass zunächst die möglichen Gitteranordnungen bestimmt werden müssen. Die möglichen Gittertypen hängen von der Anzahl der Helices ab. Die Helices werden in allen Permutationen den Gitterpunkten zugeordnet. Ausscheidungskriterium ist die Länge der Peptidkette zwischen den Helices. Für die in Frage kommenden Helix-Dreier-Kombinationen werden dann systematische Energieberechnungen auf der Basis des entwickelten Residuenpotentials durchgeführt und in "Karten" abgespeichert. Die Wahl von Helix-Trios für das systematische Durchsuchen erlaubt, ausgehend von den Konformationen minimaler Energie des Ausgangstrios, die darauffolgenden Helices schnell und zuverlässig in Konformationen ebenfalls minimaler Energie hinzuzufügen. Da die Berechnung der Karten und die Rekombination nur auf der Residuen-Residuen-Wechselwirkung beruht, wird dem Minimierungsalgorithmus ein Ensemble möglicher Konformationen übergeben 2.Der letzte Schritt der Strukturbestimmung wäre das Hinzufügen der zuvor vernachlässigten Residuen und der Seitenketten und die Übergabe der resultierenden Protein-Konformationen an ein MD-Programm, um die Struktur im atomistischen Detail zu verfeinern. Abschließend werden einige Ansätze für eine Helix-Dynamik auf größeren Zeitskalen vorgestellt, die es ermöglichen sollen, die Dynamik von Proteinen über die zeitlichen Begrenzungen von MD-Simulationen hinaus zu beschreiben. Die Zeiträume, über die gegenwärtig mit MD ein System von ungefähr 100 000 Atomen simuliert werden kann, bewegen sich in der Größenordnung von einigen 10 Nanosekunden. Die Funktion der Proteine ist häufig mit einer teilweise großräumigen Konformationsänderung verbunden. Bei der Verschiebung von Helices kann beispielsweise zwischen offenen und geschlossenen Zustand von Kanälen hin- und hergeschaltet werden, wie bei dem spannungsgesteuertem K+ Kanal KvAP. Andere Proteine, wie Bakteriorhodopsin und Ca2+ATPase, schalten durch Strukturänderung zwischen aktivem und ruhenden Zustand hin und her. Bakteriorhodopsin durchläuft durch die Absorption eines Photons einen Zyklus, bei dem ein Proton entgegen eines äußeren Gradienten durch das Protein gepumpt wird. Unser Ansatz besteht aus einem Zwei-Schritt-Algorithmus. Im ersten Schritt werden die Helices als starre Körper betrachtet und für ein bestimmtes Zeitintervall werden die Bewegungsgleichungen starrer Körper gelöst. Die Berechnung der internen Dynamik, welche sich innerhalb des Residuenmodells auf die Verbiegung der Helices beschränkt, wird im zweiten Schritt berechnet. Hierfür müssen die Kräfte, welche auf die Residuen wirken, in Drehmomente umgerechnet werden, welche auf die Bindungen zwischen den Rückgrat-Atomen wirken. Die wesentlichen Freiheitsgrade der Peptidgeometrie sind jeweils die beiden Torsionwinkel der Bindungen des Protein-Rückgrats an die Ca-Atome. Für deren Auslenkung von der idealen Helix-Konformation werden die Bewegungsgleichungen gelöst - unter der Annahme, dass die Gleichungen entkoppeln. 2 Im Prinzip können die gleichen Methoden auch auf der atomistischen Skala angewendet werden.

Metadaten
Author:	René Staritzbichler
URN:	urn:nbn:de:hebis:30-0000004740
Referee:	Werner Mäntele ORCiD GND
Document Type:	Doctoral Thesis
Language:	English
Date of Publication (online):	2004/11/23
Year of first Publication:	2004
Publishing Institution:	Universitätsbibliothek Johann Christian Senckenberg
Granting Institution:	Johann Wolfgang Goethe-Universität
Date of final exam:	2004/09/29
Release Date:	2004/11/23
HeBIS-PPN:	124927955
Institutes:	Physik / Physik
Dewey Decimal Classification:	5 Naturwissenschaften und Mathematik / 53 Physik / 530 Physik
Licence (German):	Deutsches Urheberrecht

Open Access

New methods towards the prediction of the structure of transmembrane proteins and the simulation of helix-dynamics on large time-scales

Methoden zur Strukturvorhersage von Transmembranproteinen und die Berechnung der Langzeitdynamik von Helices

Download full text files

Export metadata

Additional Services