Insights into accelerated protease autolysis and classifier uncertainty

Proteases cleave peptide bonds in proteins and play a crucial role in various physiological functions such as digestion and post-translational modification. Poor regulation can cause medical emergencies by e.g. enzymatic digestion of gastrointestinal walls. Conventional small-molecule protease inhibitors usually rely on blocking the protease’s active site. A radically different approach exploits the enyzme’s autolysis. The presence of certain polymers or colloids accelerates the cannibalistic digest, which effectively eliminates the proteolytic activity in a short period of time. Developing inhibitors that take advantage of this phenomenon may be a promising alternative to conventional inhibitors for medical or biotechnological use. A detailed understanding of the acceleration is therefore necessary.

This thesis starts with an introduction to proteases, their conventional inhibitors and the novel inhibition strategy (section 1.1). Since this thesis heavily features Bayesian statistics, its central ideas and advantages are presented in chapter 2. The main results of my doctoral work are summarized in my publications (chapter 3).

The first study (section 3.1) is a joint experimental/computational investigation of accelerated self-digest. It extends previous work by Gilles et al., which among other things described substoichiometric inhibition of proteases through polymers. Our new study proves that polymers can accelerate trypsin’s self-digest under physiological conditions. Computational surface scanning indicates that the polymers bind multivalently to trypsin’s surface without blocking the active site or all cleavage sites. We hypothesize that the polymers serve as template where many trypsin molecules bind, leading to a drastically increased local concentration that would explain the accelerated self-digest. This local enrichment is also modeled computationally.

While this hypothesis is plausible and in agreement with the experimental and computational findings, more evidence is needed to prove it. Johnson and Whateley suggested a different explanation for the accelerated loss of trypsin activity they observed when colloidal silica or negatively charged polymers were present. They assumed that adsorbed trypsins are more susceptible to autolysis. According to their hypothesis, the substrate trypsins are adsorbed while the digester trypsins attack from solution. The reaction cannot be monitored experimentally on a molecular level. Simulations are infeasible since the system, including at least two trypsin molecules and a polymer or colloid, is too large for combined quantum mechanical/molecular mechanical techniques, which would be required to observe the cleavage of the substrate. Therefore, kinetic modeling is the most viable approach to compare the rivaling hypotheses. Since kinetic models are often under-determined, I developed an approach for Bayesian data integration to include all available kinetic and thermodynamic data from Johnson’s publication (section 3.2). While this study falsifies several of Johnson’s assumptions and conclusions, the available data is insufficient to disprove the increased susceptibility hypothesis or the local enrichment hypothesis.

In addition to the work on accelerated self-digest, this thesis is also concerned with the evaluation of classifiers. Prediction if a molecule is a protease inhibitor or a non-inhibitor would be an example of classification. The basic concepts of classification are explained in section 1.2. Small sample sizes make it difficult to definitively measure a classifier’s performance. In many classification experiments, this is ignored. I developed a Bayesian approach to determine the uncertainty of all classification performance metrics that can be calculated from the confusion matrix (section 3.3). In addition, this work shows how large the uncertainty in published classifiers can be due to small data sets, which are common in biology or chemistry. Some of them could be worse than random guessing. To facilitate the design of new classification experiments, a simple rule that allows to estimate the necessary sample size beforehand is derived.

Proteasen spalten Peptidbindungen in Proteinen und spielen eine entscheidende Rolle bei verschiedenen physiologischen Funktionen wie der Verdauung und der posttranslationalen Modifikation. Eine schlechte Regulierung kann medizinische Notfälle verursachen, z.B. durch enzymatische Verdauung der Wände des Magen-Darm-Trakts. Herkömmliche Proteaseinhibitoren beruhen in der Regel auf der Blockierung des aktiven Zentrums der Protease. Ein völlig anderer Ansatz nutzt die Autolyse des Enzyms aus. Die Präsenz bestimmter Polymere oder Kolloide beschleunigt den kannibalistischen Verdau, wodurch die proteolytische Aktivität in kurzer Zeit wirksam eliminiert wird. Die Entwicklung von Inhibitoren, die sich dieses Phänomen zunutze machen, kann eine vielversprechende Alternative zu herkömmlichen Inhibitoren für den medizinischen oder biotechnologischen Gebrauch sein. Ein detailliertes Verständnis der Beschleunigung ist daher notwendig.

Diese Arbeit beginnt mit einer Einführung über Proteasen, ihre konventionellen Inhibitoren und die neuartige Inhibitionsstrategie (Abschnitt 1.1). Da diese Arbeit stark von der Bayes’schen Statistik geprägt ist, werden ihre zentralen Ideen und Vorteile in Kapitel 2 dargestellt. Die wichtigsten Ergebnisse meiner Doktorarbeit sind in meinen Publikationen (Kapitel 3) zusammengefasst.

Die erste Studie (Abschnitt 3.1) ist eine gemeinsame experimentelle/computergestützte Untersuchung der beschleunigten Autolyse. Sie erweitert frühere Arbeiten von Gilles et al., die u. a. die substöchiometrische Hemmung von Proteasen durch Polymere beschrieben. Unsere neue Studie beweist, dass Polymere den Selbstverdau von Trypsin unter physiologischen Bedingungen beschleunigen können. Das computergestützte Oberflächenscreening zeigt, dass die Polymere multivalent an die Trypsinoberfläche binden, ohne das aktive Zentrum oder alle Spaltstellen zu blockieren. Wir stellen die Hypothese auf, dass die Polymere als Templat dienen, auf dem viele Trypsinmoleküle binden, was zu einer drastisch erhöhten lokalen Konzentration führt. Somit würde der beschleunigte Selbstverdau erklärt. Diese lokale Anreicherung wird zusätzlich mit einem Computermodell untersucht.

Diese Hypothese ist zwar plausibel und stimmt mit den experimentellen und simulierten Ergebnissen überein, doch sind weitere Beweise erforderlich, um sie zu belegen. Johnson und Whateley schlugen eine andere Erklärung für den beschleunigten Verlust der Trypsinaktivität vor, den sie beobachteten, wenn kolloidales Siliciumdioxid oder negativ geladene Polymere vorhanden waren. Sie nahmen an, dass auf dem Kolloid adsorbierte Trypsine anfälliger für Autolyse sind. Ihrer Hypothese zufolge sind die adsorbierten Trypsine das Substrat, während die verdauenden Trypsine aus der Lösung angreifen. Die Reaktion lässt sich experimentell nicht auf molekularer Ebene verfolgen. Simulationen sind nicht durchführbar, da das System, das mindestens zwei Trypsinmoleküle und ein Polymer oder Kolloid enthält, für kombinierte quantenmechanische/molekülmechanische Simulationen, die zur Beobachtung der Spaltung des Substrats erforderlich wären, zu groß ist. Daher ist die kinetische Modellierung der naheliegendste Ansatz, um die beiden Hypothesen zu vergleichen. Da kinetische Modelle oft unterbestimmt sind, habe ich einen Ansatz für Bayes’sche Datenintegration entwickelt, um alle verfügbaren kinetischen und thermodynamischen Daten aus Johnsons Publikation einzubeziehen (Abschnitt 3.2). Während diese Studie mehrere Annahmen und Schlussfolgerungen von Johnson widerlegt, reichen die verfügbaren Daten nicht aus, um eine der beiden Hypothesen (lokale Anreicherung oder erhöhten Anfälligkeit für Verdau) auszuschließen.

Neben den Arbeiten zur beschleunigten Autolyse beschäftigt sich diese Arbeit auch mit der Bewertung von Klassifikatoren. Die Vorhersage, ob ein Molekül ein Proteaseinhibitor ist oder nicht wäre ein Beispiel für eine Klassifizierung. Die grundlegenden Konzepte der Klassifikation werden in Abschnitt 1.2 erläutert. Kleine Stichprobengrößen machen es schwierig, die Leistung eines Klassifikators genau zu messen. In vielen Klassifikationsexperimenten wird dies ignoriert. Ich habe einen Bayes’schen Ansatz entwickelt, um die Unsicherheit aller Leistungskennzahlen der Klassifikation zu bestimmen, die sich aus der Konfusionsmatrix berechnen lassen (Abschnitt 3.3). Darüber hinaus zeigt diese Arbeit, wie groß die Unsicherheit in veröffentlichten Klassifikatoren aufgrund kleiner Datensätze sein kann, die in der Biologie oder Chemie häufig vorkommen. Einige der Klassifikatoren könnten schlechter sein als einfaches Raten. Um das Design neuer Klassifikationsexperimente zu erleichtern wird eine einfache Regel hergeleitet, die es erlaubt, die erforderliche Stichprobengröße im Voraus zu schätzen.

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten