Project

Back to overview

Reconstructing ancestral microsyntenies across the tree of life, and inferring their impact on gene function and species adaptation

English title Reconstructing ancestral microsyntenies across the tree of life, and inferring their impact on gene function and species adaptation
Applicant Dessimoz Christophe
Number 205085
Funding scheme Project funding
Research institution Department of Computational Biology University of Lausanne
Institution of higher education University of Lausanne - LA
Main discipline Genetics
Start/End 01.10.2021 - 30.09.2025
Approved amount 810'248.00
Show all

All Disciplines (4)

Discipline
Genetics
Information Technology
Zoology
Molecular Biology

Keywords (12)

large-scale data analysis; phylogenetics; parasites; orthology; algorithms; gene order; gene function; bioinformatics; comparative genomics; genome rearrangements; synteny; gene clusters

Lay Summary (German)

Lead
Die Erhaltung der Genposition innerhalb und zwischen den Arten ("Syntenie") bzw. deren Fehlen hat viele potenzielle Auswirkungen auf die Zellfunktionen und die sexuelle Fortpflanzung und damit auf die Anpassung und Evolution der Arten. Doch trotz der raschen Zunahme genomischer Daten bleibt unser Verständnis der Beziehung zwischen Syntenie und Genfunktion in weiten Teilen des Lebensbaums begrenzt. Insbesondere gibt es widersprüchliche Berichte über die Neigung benachbarter Gene, am selben biologischen Prozess beteiligt zu sein.
Lay summary
Auf methodischer Ebene ist die Rekonstruktion von Syntenien der Vorfahren alles andere als trivial. Es wurden zwar viele Algorithmen entwickelt, die jedoch in der Regel nicht über einige Dutzend Genome hinausgehen. Darüber hinaus benötigen die Algorithmen zur Ableitung von Syntenien die entsprechenden Gensätze über die verschiedenen Arten hinweg ("Orthologe"), was jedoch selbst ein schwieriges Problem darstellen kann, insbesondere über lange evolutionäre Zeiträume, in denen die orthologen Beziehungen oft nicht eins zu eins sind (aufgrund von Genduplikationen und -verlusten). Umgekehrt kann die Ableitung der Orthologie im Prinzip auch von Syntenie-Informationen profitieren. Die Frage, wie Syntenie und Orthologie gleichzeitig und effizient abgeleitet werden können, bleibt also ein offenes Problem. 

Das übergeordnete Ziel des Projekts besteht darin, die ungebremste Zunahme der verfügbaren Genome im Stammbaum des Lebens zu nutzen, um die Syntenie der Vorfahren zu rekonstruieren und die biologischen Folgen der Syntenie für die Genfunktion und die Anpassung der Arten besser zu verstehen. Zu diesem Zweck werden wir hochgradig skalierbare Methoden entwickeln, um die Syntenie der Genome der Vorfahren abzuleiten, indem wir die hierarchischen orthologen Gruppen der in unserem Labor entwickelten OMA (Orthologous Matrix) Ressource nutzen. Ergänzend dazu werden wir eine Methode entwickeln, um die Informationen über die Syntenie der Vorfahren zu nutzen, um die Genauigkeit der Orthologie-Inferenz zu verbessern.

Diese methodischen Verbesserungen werden es uns ermöglichen, die Evolutionsgeschichte und die funktionellen Auswirkungen von konservierten und abweichenden Syntenien im gesamten Lebensbaum zu untersuchen. Insbesondere werden wir die abgeleiteten Adjazenzen der Vorfahren nutzen, um die mögliche Rolle der Umstrukturierung bei der Anpassung von Arten zu beleuchten (z. B. den Übergang zum Parasitismus bei Trematoden) und ultrakonservierte Gencluster im gesamten Stammbaum des Lebens zu identifizieren.

Neben diesen Fortschritten bei den Methoden zur Ableitung von Syntenie und Orthologie und den neuen biologischen Erkenntnissen, die sich aus den vorgeschlagenen empirischen Studien ergeben, erwarten wir, dass die Ergebnisse dieses Projekts auch auf andere Bereiche der biologischen und medizinischen Forschung anwendbar sein werden, z. B. auf die regulatorische Genomik (durch die Verwendung syntenischer Orthologe, um orthologe nicht-kodierende Regionen über verschiedene Arten hinweg einzugrenzen) oder die Krebsgenomik (durch die Ableitung von Genom-Umlagerungsereignissen aus der Phylogenetik von Einzelzelltumoren). 
Direct link to Lay Summary Last update: 06.10.2021

Lay Summary (French)

Lead
La conservation de la position des gènes au sein des espèces et entre elles ("synténie"), ou son absence, a de nombreux effets potentiels sur la fonction cellulaire et la reproduction sexuelle, et donc sur l'adaptation et l'évolution des espèces. Cependant, malgré l'accumulation rapide de données génomiques, notre compréhension de la relation entre la synténie et la fonction des gènes reste limitée dans une grande partie de l'arbre de la vie. En particulier, il existe des rapports contradictoires sur la propension de gènes voisins à être impliqués dans le même processus biologique.
Lay summary
D'un point de vue méthodologique, la reconstruction des syntégies ancestrales est loin d'être triviale. Bien que de nombreux algorithmes aient été conçus, ils sont généralement trop lents pour aller au-delà de quelques dizaines de génomes. De plus, les algorithmes d'inférence de synténie nécessitent en entrée les ensembles de gènes correspondants entre les espèces (les "orthologues"), mais c'est en soi un problème difficile, en particulier sur de longues distances évolutives où les relations orthologues n'ont souvent pas de correspondence 1-à-1 (en raison des duplications et des pertes de gènes). Inversement, l'inférence orthologique peut en principe également bénéficier des informations sur la synténie. Ainsi, la manière d'inférer simultanément et efficacement la synténie et l'orthologie reste un problème ouvert. 

L'objectif principal du projet est de profiter de la croissance continue des génomes disponibles dans l'arbre de la vie pour reconstruire les syntéries ancestrales et mieux comprendre les conséquences biologiques de la synténie sur la fonction des gènes et l'adaptation des espèces. À cette fin, nous développerons des méthodes hautement évolutives pour déduire la synténie des génomes ancestraux, en exploitant le cadre des groupes orthologues hiérarchiques de la ressource OMA (Orthologous Matrix) développée dans notre laboratoire. En complément, nous développerons une méthode pour exploiter les informations sur la synténie ancestrale afin d'améliorer la précision de l'inférence orthologique.

Ces améliorations méthodologiques nous permettront d'étudier l'histoire de l'évolution et les implications fonctionnelles des synténie conservées et divergentes dans l'arbre du vivant. En particulier, nous utiliserons les adjacences de gènes ancestraux déduites pour mettre en lumière le rôle potentiel du réarrangement dans l'adaptation des espèces (illustré par la transition vers le parasitisme chez les trématodes), et identifier les groupes de gènes ultraconservés dans l'arbre du vivant.

Au-delà de ces avancées dans les méthodes d'inférence de la synténie et de l'orthologie, et des nouvelles connaissances biologiques acquises à partir des études empiriques proposées, nous nous attendons également à ce que les résultats de ce projet soient applicables à d'autres domaines de la recherche biologique et médicale, tels que la génomique de régulation (en utilisant les orthologues syntétiques pour lier les régions non codantes orthologues à travers différentes espèces), ou la génomique du cancer (en inférant les événements de réarrangement du génome à partir de la phylogénétique des tumeurs unicellulaires). 
Direct link to Lay Summary Last update: 06.10.2021

Responsible applicant and co-applicants

Employees

Associated projects

Number Title Start Funding scheme
186397 An integrated evolutionary and functional characterisation of the Drosophila immune peptidic secretome 01.07.2019 Sinergia
191163 Reconstructing Deep Ancestral Genomes Through Integrative Phylogenomics 01.01.2020 Scientific Exchanges
167276 Efficient and accurate comparative genomics to make sense of high volume low quality data in biology 01.04.2017 NRP 75 Big Data
183723 Embracing Phylogenetic Incongruence Among Genetic Loci 01.09.2019 SNSF Professorships

Abstract

The conservation of gene position within and across species (“synteny”), or lack thereof, has many potential effects on cellular function and sexual reproduction, and thus on the adaptation and evolution of species. But despite rapidly accumulating genomic data, our understanding of the relationship between synteny and gene function remains limited across much of the tree of life. In particular, there are conflicting reports on the propensity of neighbouring genes to be involved in the same biological process (a hypothesis we refer to as the “synteny conjecture”).At a methodological level, reconstructing ancestral syntenies is far from trivial. Though many algorithms have been devised, they typically do not scale well beyond a few tens of genomes. Furthermore, synteny inference algorithms require as input the sets of corresponding genes across species (“orthologs”), but this can itself be a difficult problem, particularly over long evolutionary ranges where orthologous relationships are often not one-to-one (due to gene duplications and losses). Conversely, orthology inference can in principle also benefit from synteny information. Thus, how to simultaneously and efficiently infer synteny and orthology remains an open problem. The overarching goal of the project is to take advantage of the unabated growth in available genomes across the tree of life to reconstruct ancestral syntenies, and better understand the biological consequences of synteny on gene function and species adaptation. To this end, we will develop highly scalable methods to infer the synteny of ancestral genomes, by leveraging the hierarchical orthologous groups framework of the OMA (Orthologous Matrix) resource developed in our lab. Complementary to that, we will develop a method to exploit ancestral synteny information to improve the accuracy of orthology inference.These methodological improvements will enable us to investigate the evolutionary history and functional implications of conserved and divergent syntenies across the tree of life. In particular, we will use inferred ancestral gene adjacencies to test the synteny conjecture, shed light on the potential role of rearrangement in the adaptation of species (exemplified by the transition to parasitism in trematodes), and identify ultraconserved gene clusters across the tree of life.Beyond these advances to synteny and orthology inference methods, and the new biological insights gained from the proposed empirical studies, we also expect the outputs of this project to be applicable to other areas of biological and medical research, such as regulatory genomics (by using syntenic orthologs to bound orthologous non-coding regions across different species), or cancer genomics (by inferring genome rearrangement events from single-cell tumour phylogenetics).
-