Lead
L'histoire évolutive des gènes est souvent modélisée à l'aide d'arbres. Or, même si l'on considère un groupe d'espèces fixe, les arbres induits pour chaque famille de gène peuvent varier considérablement. Cette extension de projet continue à chercher à mieux comprendre cette hétérogénéité par le développement de nouvelles méthodes statistiques et computationnelles, avec des applications à la reconstruction de l'Arbre de la Vie, et à une caractérisation des phénomènes d'hybridization dans les plantes domestiquées.

Lay summary
Les arbres phylogénetiques sont utilisés à travers tous les domaines du vivant pour représenter des relations évolutives entres espèces et gènes. Ils jouent un rôle important non seulement en biologie évolutive, mais aussi en génomique fonctionnelle, biologie développementale, oncologie, ou encore en épidémiologie. Cependant, les caractères moléculaires des génomes ne découlent pas nécessairement tous d'un arbre unique, à cause de duplication de gènes, recombinaison, assortiment incomplet des espèces, transfert de gène latéraux, etc. Sous le paradigme actuel, ces incongruités sont souvent ignorées, ce qui peut conduire à des estimations d'arbres incomplètes, biaisées, ou excessivement confiantes.

Dans le cadre de cette extension de projet, nous continuerons à développer des méthodes d'inférence phylogénétique en présence de signaux incongrus, et nous utiliserons ces avancées pour résoudre des problèmes biologiques de longue date, compliqués par de multiples sources d'incongruence phylogénétique. Plus précisément, nous (1) améliorerons l'évolutivité, l'utilisabilité et l'interprétabilité de notre nouvel outil logiciel "treesignal", qui modélise l'incongruité en utilisant un cadre d'apprentissage machine ; (2) contribuerons à la résolution de l'arbre de vie aviaire en utilisant des méthodes qui évitent l'assemblage et l'annotation du génome et qui sont robustes à multiples sources d'incongruité (en particulier le triage incomplet des lignées et les artefacts d'annotation du génome) ; (3) étudier les conséquences fonctionnelles de l'allopolyploïdisation (hybridisation suivie par duplication complète du génome) en génomique végétale, avec un intérêt particulier sur le coton Upland.