Evolutionary-functional genomics for an enhanced resolution of arthropod gene function

Details

Ressource 1Download: thèse-RL-OK.pdf (5440.56 [Ko])
State: Public
Version: After imprimatur
License: Not specified
Serval ID
serval:BIB_26D5A182653A
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Evolutionary-functional genomics for an enhanced resolution of arthropod gene function
Author(s)
RUZZANTE Livio
Director(s)
Waterhouse Robert
Codirector(s)
Salamin Nicolas
Institution details
Université de Lausanne, Faculté de biologie et médecine
Publication state
Accepted
Issued date
2022
Language
english
Abstract
The fast accumulating data on genetic sequences from all branches of the tree of life, supported by recent advances in genome sequencing technologies, has enabled rapid scientific progress in the field of evolutionary biology and in our understanding of gene evolution through natural selection. Such progress, however, requires the support of dedicated bioinformatics software to efficiently aid hypothesis formulation on gene function and evolution through comparative genomics approaches. These must furthermore be designed to be freely accessible and able to analyse an ever increasing amount of genomes from public repositories. Specifically, detailed experimental characterisation of the biological processes and functions associated with the increasing numbers of newly sequenced genes from less-known species is not scalable. Computational approaches are therefore required to build on existing knowledge from better-studied species and make predictions or inferences that are supported by a cross-species evolutionary framework. This thesis showcases new approaches aiming to support such research efforts through automated comparative genomics tools, by characterising the evolutionary trajectories of genes from hundreds of species and associating them with putative functional roles.
Arthropods are invertebrate animals, comprising almost 80% of the total described animal diversity. Including crustaceans, arachnids, myriapods, and insects, among others, they constitute an ideal study system for characterising gene evolutionary-functional correspondences, given their vast range of physiological and ecological adaptations over more than 600 million years of evolution. Furthermore, they comprise key species of fundamental epidemiological and agroecological interest, and a better understanding of their genetic sequences is fueled by global societal challenges, including the spread of devastating diseases, agricultural pest control, and biodiversity conservation. This thesis work thus aims to specifically improve the resolution of evolutionary-functional correspondences across arthropod species with available genomic data, and provide a readily-available resource to explore evolutionarily-informed putative gene function predictions of previously undescribed genes. These include the generation of statistically supported
hypotheses associating the evolutionary histories of gene families with biological processes such as organismal development, cellular organisation, immune response mechanisms, chemosensation, and insecticide resistance among others.
The first chapter presents the Evol-Feat toolkit, a scalable bioinformatics workflow to characterise the evolutionary trajectories of genes from multiple species. Used to compare the genes from 170 arthropod genome sequences, the first chapter focuses on the design and computation of “evolutionary features”: metrics designed to quantify changes in genetic sequences and gene repertoires. The second chapter focuses on clustering methods applied to the distributions of arthropod gene evolutionary features, to identify subsets of genes that show similar evolutionary profiles, and presents methodologies for associating these sets of genes with putative functions. The third chapter presents the application of the Evol-Feat toolkit to investigate the evolutionary-functional relationships between immune-related genes, in a proof-of-concept case-study focussed on the African malaria mosquito, Anopheles gambiae. The fourth and last chapter showcases the collaborative scientific work which accompanied the design and development of the Evol-Feat workflow through specific research studies including phylogenomic reconstructions of arthropod lineages, the exploration and description of available genomic resources, the investigation of physiological and ecological adaptations in hymenopterans, and bioinformatics software development.
(FR) Resumé
L'accumulation rapide de données sur les séquences génétiques de toutes les branches de l'arbre du vivant, soutenue par les récentes améliorations des technologies de séquençage du génome, a permis des progrès scientifiques rapides dans le domaine de la biologie évolutive et dans notre compréhension de l'évolution des gènes par la sélection naturelle. Ces progrès nécessitent toutefois l'utilisation de logiciels bioinformatiques spécialisés pour faciliter la formulation d'hypothèses sur la fonction et l'évolution des gènes par des approches de génomique comparative. Ces logiciels doivent en outre être développés pour être librement accessibles et capables d'analyser un nombre toujours croissant de génomes provenant de banques de données publiques. Plus précisément, la caractérisation expérimentale détaillée des processus et fonctions biologiques associés au nombre croissant de gènes nouvellement séquencés provenant d'espèces moins connues n'est pas extensible. Des approches computationnelles sont donc nécessaires pour s'appuyer sur les connaissances existantes des espèces mieux étudiées et faire des prédictions ou des déductions soutenues par un cadre évolutif inter-espèces. Cette thèse présente de nouvelles approches visant à accompagner de tels efforts de recherche par le biais d'outils automatisés de génomique comparative, en caractérisant les trajectoires évolutives de gènes de plusieurs centaines d'espèces ainsi qu’en leur associant des rôles fonctionnels hypothétiques.
Les arthropodes sont des animaux invertébrés, qui représentent près de
80 % de la diversité animale totale actuellement décrite. Comprenant entre autres des crustacés, des arachnides, des myriapodes et des insectes, ils constituent un système d'étude idéal pour caractériser les correspondances évolution-fonction des gènes, étant donné leur vaste gamme d'adaptations physiologiques et écologiques sur plus de 600 millions d'années d'évolution. En outre, ils comprennent des espèces clés d'un point de vue épidémiologique et agroécologique, et une meilleure compréhension de leurs séquences génétiques est nécessaire au vu des défis sociétaux globaux rencontrés, notamment la propagation de maladies dévastatrices, le contrôle des parasites agricoles et la conservation de la biodiversité. Ce travail de thèse a donc pour but d'améliorer la
résolution des correspondances évolution-fonction chez les espèces d'arthropodes ayant des données génomiques disponibles, et de fournir une ressource facilement accessible pour explorer les prédictions de fonctions génétiques informées par l'évolution de gènes non décrits auparavant. Ces prédictions comprennent la génération d'hypothèses soutenues statistiquement, associant l'histoire évolutive des familles de gènes à des processus biologiques tels que le développement de l'organisme, l'organisation cellulaire, les mécanismes de réponse immunitaire, la chimiodétection et la résistance aux insecticides, entre autres.
Le premier chapitre présente la boîte à outils Evol-Feat, un workflow bioinformatique permettant de caractériser les trajectoires évolutives des gènes de plusieurs espèces. Après la description théorique et méthodologique d’Evol-Feat, utilisé pour comparer les gènes de 170 génomes d'arthropodes, le premier chapitre se concentre sur la conception et le calcul des "caractéristiques évolutives" : des métriques conçues pour quantifier les changements dans les séquences génétiques et les répertoires de gènes. Le deuxième chapitre se concentre sur les méthodes de regroupement appliquées aux distributions des caractéristiques évolutives des gènes d'arthropodes, afin d'identifier des sous-ensembles de gènes qui présentent des profils évolutifs similaires, et présente des méthodologies pour associer ces ensembles de gènes à des fonctions putatives. Le troisième chapitre présente l'utilisation d’Evol-Feat pour étudier les relations entre évolution et fonctions chez les gènes liés à l'immunité, dans le cadre d'une étude de validation de concept axée sur le moustique africain de la malaria, Anopheles gambiae. Le quatrième et dernier chapitre présente le travail scientifique collaboratif qui a accompagné la conception et le développement d’Evol-Feat par le biais d'études de recherche spécifiques, notamment des reconstructions phylogénomiques de lignées d'arthropodes, l'exploration et la description des ressources génomiques disponibles, l'étude des adaptations physiologiques et écologiques chez les hyménoptères et le développement de logiciels bioinformatiques.
Create date
05/04/2023 9:21
Last modification date
31/05/2023 11:16
Usage data