Projekt

Zurück zur Übersicht

Efficient computational solutions for advanced codon models of natural selection

Gesuchsteller/in Salamin Nicolas
Nummer 143768
Förderungsinstrument Interdisziplinäre Projekte
Forschungseinrichtung Département d'Ecologie et d'Evolution Faculté de Biologie et de Médecine Université de Lausanne
Hochschule Universität Lausanne - LA
Hauptdisziplin Zoologie
Beginn/Ende 01.04.2013 - 31.12.2016
Bewilligter Betrag 511'916.00
Alle Daten anzeigen

Alle Disziplinen (3)

Disziplin
Zoologie
Informatik
Mathematik

Keywords (7)

codon model; hybrid parallelisation; Markov chain Monte Carlo; phylogenetics; maximum likelihood; high-performance computing; positive selection

Lay Summary (Französisch)

Lead
Le développement d'outils informatiques en biologie devient un enjeu important compte tenu de la vaste quantité de données génomiques disponibles. Ce projet a pour but de présenter des approches novatrices pour permettre la détection d'évènements ponctuels de sélection positive durant l'évolution des espèces.
Lay summary
L'augmentation de la puissance de calcul disponible aujourd'hui offre de nouvelles possibilités dans plusieurs domaines de la biologie. De ce fait, la biologie computationnelle est en train de devenir un domaine de recherche à part entière. La phylogénétique, qui permet la reconstruction de l'histoire évolutive des organismes ou des gènes, a été à l'avant-garde de l'utilisation d'approches informatiques en biologie. Un des défis actuels dans ce contexte est la détection de la sélection positive, ou darwinienne, sur les grands jeux de données génomiques. En effet, le développement récent de modèles mathématiques permettant la détection d'évènements ponctuels de sélection positive durant l'évolution des espèces a suscité beaucoup d'intérêt. Toutefois, ces développements mathématiques et statistiques sont complexes à mettre en œuvre efficacement d'un point de vue computationnel, surtout lorsque l'on considère la taille des données génomiques déjà disponibles et à venir.
Dans ce projet, nous souhaitons offrir des solutions efficaces de calcul pour estimer et tester des modèles avancés d'évolution des protéines. Notre objectif est de combiner l'expertise de trois différents groupes de recherche et de proposer des approches de modélisation et des implémentations hybrides qui se sont avérées utiles pour la parallélisation de la diversité biologique et des systèmes complexes. Notre projet est composé de deux parties:
1) développer de nouveaux algorithmes pour permettre la parallélisation efficace des calculs des modèles d'évolution des protéines
2) étendre cette approche en utilisant les méthodes Bayesienne, qui sont plus à même de profiter pleinement de infrastructures informatiques de hautes performances
Le projet bénéficiera également de collaborations internationales afin de développer des librairies informatiques facilitant la mise en œuvre de modèles novateurs permettant l'étude de l'évolution de centaines de milliers de génomes.

Direktlink auf Lay Summary Letzte Aktualisierung: 05.03.2013

Verantw. Gesuchsteller/in und weitere Gesuchstellende

Mitarbeitende

Publikationen

Publikation
Accelerating Bayesian inference for evolutionary biology models
Meyer Xavier, Chopard Bastien, Salamin Nicolas (2016), Accelerating Bayesian inference for evolutionary biology models, in Bioinformatics, btw712-btw712.
State aggregation for fast likelihood computations in molecular evolution
Davydov Iakov I., Robinson-Rechavi Marc, Salamin Nicolas (2016), State aggregation for fast likelihood computations in molecular evolution, in Bioinformatics, btw632-btw632.
Optimization strategies for fast detection of positive selection on phylogenetic trees
Valle Mario, Schabauer Hannes, Pacher Christoph, Stockinger Heinz, Stamatakis Alexandros, Robinson-Rechavi Marc, Salamin Nicolas (2014), Optimization strategies for fast detection of positive selection on phylogenetic trees, in Bioinformatics, 30(8), 1129-1137.

Zusammenarbeit

Gruppe / Person Land
Formen der Zusammenarbeit
vital-IT / Swiss Institute of Bioinformatics Schweiz (Europa)
- Publikation
Institut des Sciences de l'Evolution / Université de Montpellier Frankreich (Europa)
- vertiefter/weiterführender Austausch von Ansätzen, Methoden oder Resultaten

Wissenschaftliche Veranstaltungen

Aktiver Beitrag

Titel Art des Beitrags Titel des Artikels oder Beitrages Datum Ort Beteiligte Personen
PASC 2017 Vortrag im Rahmen einer Tagung Scheduling finite difference approximations for DAG-modeled large scale applications 05.06.2017 Lugano, Schweiz Salamin Nicolas; Meyer Xavier;
Evolution 2016: Spotlight session Vortrag im Rahmen einer Tagung Accelerating Bayesian inference of evolutionary biology models 27.06.2016 Austin, Texas, Vereinigte Staaten von Amerika Meyer Xavier;
Sixth IMS ISBA Poster Accelerating Bayesian Inference for Evolutionary Biology Models 04.01.2016 Lenzerheide, Schweiz Meyer Xavier;
SMBE 2015 Vortrag im Rahmen einer Tagung Speeding up tree likelihood computation using state aggregation 13.07.2015 Vienna, Österreich Davydov Iakov;
BC2 conference Poster Speeding up tree likelihood computation using state aggregation 08.06.2015 Basel, Schweiz Davydov Iakov;
PASC 2015 Vortrag im Rahmen einer Tagung Efficient approaches to model evolution in computational biology 02.06.2015 University of Zurich, Schweiz Salamin Nicolas;


Anwendungsorientierte Outputs

Software

Name Jahr
HOGAN 2017
FastCodeML 2016
godon 2016


Verbundene Projekte

Nummer Titel Start Förderungsinstrument
138282 Developing and using models of codon evolution in a phylogenetic framework 01.03.2012 Projektförderung (Abt. I-III)
163872 Positive selection and horizontal gene transfer in prokaryotes 01.04.2016 Russland
153341 Bioinformatics search for adaptive evolution in vertebrate development 01.10.2014 Projektförderung (Abt. I-III)

Abstract

The increase in computing power available nowadays is providing new opportunities to several areas of biology. Consequently, computational biology has grown in importance and is now becoming a field of research on its own. Phylogenetics has been at the forefront of the use of computational approaches largely because of the difficulty to reconstruct phylogenetic trees from molecular data. There are, however, other complex computational challenges related to phylogenetic trees. One of them is the detection of positive, or Darwinian, selection along lineages and sites of protein sequences. There has been recent and interesting advances in the development of models available to detect episodic events of positive selection. However, these mathematical and statistical developments have resulted in models that are computationally complex to efficiently implement, especially when considering large scale genomic data that are now available.In this project, we would like to provide efficient computational solutions to estimate and test advanced models of protein evolution. Our goal is to combine the expertise from three different research groups to propose multiscale modelling approaches and hybrid implementations that have proven useful in the parallelisation of complex biological systems. Our project is composed of two parts:- to develop novel algorithms to enable efficient parallelisation of the likelihood calculations of codon models- to extend our approch to a Bayesian estimation of positive selection that can take full advantage of high-performance computing infrastructuresThe project will also benefit from collaborations currently developping computing libraries and we will provide in return a platform for the easy implementation of innovative models of codon evolution scaling efficiently to tens or hundreds of thousands of genomes.
-