Sequenzoptimierung eines synthetischen bifunktionalen Proteins durch multikriterielle genetische Algorithmen

Diese Arbeit beschreibt die erfolgreiche Vereinigung der aktiven Regionen zweier unterschiedlichen Protein zu einem bifunktionalem. Ein einfacher Austausch kodierender Strukturen in ein neues Protein führt ggf. zu einer erhöhten Instabilität wodurch die Funktion des Proteins nicht mehr garantiert werden kann. Um diese Probleme zu eliminieren und die Stabilität des Proteins wieder zu gewährleisten wird die Aminosäurensequenz computergestützt basierend auf physikalischen und chemischen Eigenschaften rekonstruiert. Indem nicht die Aminosäurensequenz sondern die Eigenschaften der Aminosäuren für die Optimierung verwendet werden, konnte der Rechenaufwand soweit minimiert werden, dass Genetische Algorithmen effizient eingesetzt werden können. Neben den elektrostatischen Eigenschaften wird die Sekundärstruktur, die Hydrophobizität und das Molekulargewicht zum in einem angepassten Genetischen Algorithmus für die Optimierung verwendet. Ziel der Optimierung ist es, diese Eigenschaften zu einer Referenz hin zu Optimierungen, in diesem Fall die Z-Domäne. Somit wird die räumliche Struktur der Z-Domäne in das neue Protein übertragen, neuen Funktionen bleiben jedoch weiterhin erhalten. Es werden vier unterschiedliche Methoden verwendet, um die Ergebnisse aus der Optimierung durch den Genetischen Algorithmus zu verfeinern und zu verifizieren. So wird die große Nummer an Sequenzen, die als Ergebnis der Optimierung vorliegen, auf wenige vielversprechende eingeschränkt. Neben Vorhersagen der Proteinstabilität durch GROMACS und ERIS Simulationen werden auch die Bindeeigenschaften der neuen Sequenzen mittels BrownDye und AMBER genauer untersucht. Manuelle und computergestützte Vergleiche zwischen nicht optimierten Ausgangssequenz und den Optimierungsergebnissen zeigen klar den Vorteil der Optimierung durch den Genetischen Algorithmus. Neben einer vergleichbaren Stabilität der Kandidaten im Vergleich zur Z-Domäne sind auch die Bindeeigenschaften des neuen Proteins zu denen der Wildtypen vergleichbar.

The Thesis describes how to successfully combine the active regions of two distinct proteins into one bifunctional one. Simply exchanging a piece of the protein with a sequence coding for a new specific function comes to a rise of protein instability. With that protein stability and thus the functions of it cannot be guaranteed anymore. To challenge these problems and regain protein stability, the amino acid sequence was computationally reconstructed by using its physical and chemical properties. By not using the amino acid sequence itself to optimize the protein, it was possible to lower the computational costs. With that, an effective use of genetic algorithm was possible. Secondary structure, hydrophobicity, molecular weight of the amino acids as well as the electrostatic properties of the protein were optimized using a adapted genetic algorithm implementation. Target of the optimization was to match these properties to a reference protein, in this case the z-domain. In a result, the overall structure of the z-domain was transferred to the new protein but its new binding properties were conserved. Four different methods have been used to refine and test the results of the genetic algorithm and the large number of resulting individuals was elaborated to the most stable ones with best conserved binding properties. Beside a stability prediction using GROMACS simulation and ERIS stability prediction BrownDye and AMBER were used to examine the candidates binding affinities. Numerous manual and computer supported comparisons between the optimized and non-optimized sequences clearly showed the benefit of the genetic algorithm optimization. In addition comparable binding properties in respect to the binding sites wild types have been observed at the optimized sequences during analysis.

Vorschau

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten