h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Mass spectrometric data processing for metabolomics and fluxomics : a flexible evaluation framework with quality awareness = Auswertung massenspektrometrischer Rohdaten für Metabolomics und Fluxomics : ein flexibles Framework mit besonderer Berücksichtigung der Auswertequalität



Verantwortlichkeitsangabevorgelegt von Max von Haugwitz

ImpressumAachen 2016

Umfang1 Online-Ressource (xv, 291 Seiten) : Illustrationen, Diagramme


Dissertation, RWTH Aachen, 2016

Veröffentlicht auf dem Publikationsserver der RWTH Aachen University


Genehmigende Fakultät
Fak04

Hauptberichter/Gutachter
;

Tag der mündlichen Prüfung/Habilitation
2016-02-18

Online
URN: urn:nbn:de:hbz:82-rwth-2016-029536
URL: https://publications.rwth-aachen.de/record/572757/files/572757.pdf
URL: https://publications.rwth-aachen.de/record/572757/files/572757.pdf?subformat=pdfa

Einrichtungen

  1. Lehrstuhl für Computational Systems Biotechnology (FZ Jülich) (420410)

Inhaltliche Beschreibung (Schlagwörter)
Ingenieurwissenschaften und Maschinenbau (frei) ; metabolomics (frei) ; fuxomics (frei) ; mass spectrometry (frei) ; chromatography (frei) ; raw data evaluation (frei)

Thematische Einordnung (Klassifikation)
DDC: 620

Kurzfassung
Metabolomics und Fluxomics haben ein breites Anwendungsspektrum, das von der funktionellen Genomik bis hin zum Metabolic Engineering reicht. Zentrale experimentelle Techniken in diesem Bereich beinhalten die Markierung von Molekülen mit stabilen Isotopen, insbesondere 13C, in Kombinationen mit chromatographischen und massenspektrometrischen Analyseverfahren (LC-MS/MS). Die Auswertung der analytischen Rohdaten ist ein Faktor, der Dauer und Qualität der Analysen wesentlich beeinflusst. Diese Arbeit befasst sich mir der Entwicklung von Methoden zur Analyse der in 13C-Experimenten mit einem speziellen LC-MS/MS-Verfahren, dem Multiple Reaction Monitoring, generierten Rohdaten, sowie deren kritischer Bewertung. Ein wesentlicher Bestandteil dieser Arbeit ist die Entwicklung eines neuartigen Workflows zur semiautomatischen Prozessierung der Rohdaten, der Methoden der Signalprozessierung und Mustererkennung vereint. Die Anwendbarkeit des Workflows, implementiert in der in dieser Arbeit entwickelten Endnutzer-Software MRMQuant, wird durch Anwendung auf Metabolomics-, stationäre (Datensatz CG STAT) und dynamische (Datensatz CG DYN) Fluxomics-, sowie Proteomics-Daten demonstriert. Für CG DYN mit 15.000 Chromatogrammen kann die Dauer der Auswertung der Daten von 1,5 Arbeitswochen mit der bisher etablierten Herstellersoftware Analyst TM durch MRMQuant auf 1,5 Arbeitstage verkürzt werden. Am Beispiel von CG STAT werden die mit MRMQuant generierten Resultate mit einer von einem Experten generierten Lösung quantitativ verglichen. Die berechneten 13C-Markierungsverhältnisse stimmen in 97% aller Fälle bis auf eine absolute Abweichung kleiner 2% überein, auf Ebene der Peakflächen gibt es dagegen klare Diskrepanzen zwischen den Lösungen (40% der Fälle mit einer relativen Abweichung größer 2,5%). Zur Bewertung dieser Abweichungen wurden zwei Studien durchgeführt, in denen 10 Mitarbeiter des IBG-1 synthetische und experimentelle Rohdaten manuell auswerteten. Selbst zwischen sehr erfahrenen Teilnehmern ist bei Auswertung komplizierter Chromatogramme eine Streuung der Peakflächen im Bereich von 10% bis 20% keine Seltenheit, wodurch die Limitierungen hinsichtlich der Bewertung der absoluten Richtigkeit der Analyseergebnisse aufzeigt werden. Es wird jedoch ebenfalls demonstriert, dass die mit MRMQuant generierten Ergebnisse vergleichbar zu den manuell generierten Lösungen der Teilnehmer sind. Die Analyse der Resultate für CG DYN zeigt auf, dass eine weitere Beschleunigung der Auswertung eine Automatisierung der zeitintensiven manuellen Verifikation der Resultate voraussetzt. Erstmals wird untersucht, ob One-Class Support Vector Machines zur Identifikation inkonsistenter Integrationen von Chromatogrammen eingesetzt werden können. Für Datensätze mit stabilen chromatographischen Messbedingungen wird mehrheitlich eine Sensitivität und Spezifizität oberhalb von 90% erreicht, das Verfahren muss aber optimiert werden, um graduelle Integrationsfehler erkennen zu können. Als zentrales Resultat dieser Arbeit wurde die MRMQuant-Software, die insgesamt 67.000 Zeilen C++-Code umfasst, als Werkzeug zur Analyse der 13C-Markierungsdaten im IBG-1 etabliert und hat die vormals etablierte Herstellersoftware ersetzt.

Metabolomics and fluxomics have found ubiquitous applications in both applied and fundamental research disciplines ranging from functional genomics to metabolic engineering. Important experimental methods in these fields involve the utilization of stable isotope labeling, in particular 13C, in combination with liquid chromatography coupled to tandem mass spectrometry (LC-MS/MS). The conversion of measurement data to biologically interpretable use data is a major determinant of the time necessary for and the quality of analyses. This thesis investigates data processing concepts for the evaluation of mass chromatographic data in the context of 13C-based metabolomics and fluxomics experiments acquired using multiple reaction monitoring, a particular LC-MS/MS measurement mode. As part of this thesis, a novel data evaluation workflow combining techniques from signal processing and pattern recognition is developed. Applicability of the workflow, implemented in the software framework MRMQuant developed in this thesis, is demonstrated by application to metabolomics, steady-state (data set CG STAT) and dynamic (data set CG DYN) fluxomics, and proteomics data. For CG DYN, containing 15,000 chromatograms, evaluation is sped up from 1.5 work weeks to 1.5 work days compared to the previously established vendor solution Analyst TM. The comparison of the results generated using MRMQuant, Analyst TM , and another state-of-the-art solution reveals that in case of CG STAT in the majority of cases the solutions agree well with respect to labeling fractions (in 97% of cases the absolute deviation in labeling between solutions is smaller than 2%), but relative differences, in particular for peak areas, can be substantially higher (40% of cases with a relative deviation greater 2.5% in case of peak areas). To judge the significance of deviations two user studies involving 10 operators each were carried out to investigate differences between integrations obtained by operators using manual integration techniques and using MRMQuant. The comparison reveals a strong variability of peak integration among human operators, and in complicated cases even for trained users a scatter of 10-20% is no exception. While this study demonstrates the limits of integration accuracy for complex chromatographic data, it is also shown that integrations obtained using the software are comparable to human operators. Irrespective of the question of absolute correctness of results, it is found that the major factor hindering further speed-up of the data evaluation is the manual verification of integrations to ensure a consistent data evaluation. For the first time One-Class Support Vector Machines are utilized to identify spurious integrations. Sensitivity strongly varies together with the stability of the chromatographic data, but for data sets with stable chromatographic conditions in several cases specificity and sensitivity is above 90%. However, measures have to be further optimized to also enable a detection of gradual integration errors. As a major result of this thesis, the MRMQuant framework, containing 67,000 lines of C++ code, has replaced the previously available software and is now established in routine usage at IBG-1.

OpenAccess:
Download fulltext PDF Download fulltext PDF (PDFA)
(additional files)

Dokumenttyp
Dissertation / PhD Thesis

Format
online

Sprache
English

Externe Identnummern
HBZ: HT018950805

Interne Identnummern
RWTH-2016-02953
Datensatz-ID: 572757

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Faculty of Mechanical Engineering (Fac.4)
Publication server / Open Access
Public records
Publications database
420410

 Record created 2016-04-15, last modified 2023-04-08