Lead
Les répétitions en tandem (RT) sont abondantes en protéomes dans tous les royaumes de la vie. Les RT sont souvent associées à des fonctions liées à la maladie et à l'immunité. Des combinaisons spécifiques d'unités RT sont capables d'assurer des propriétés protéiques souhaitables. La capacité de construction avec des modules RT a été exploitée avec succès dans la bio-ingénierie. Cependant, la recherche expérimentale pour trouver des configurations TR optimales est difficile et inefficace en raison du nombre énorme de combinaisons possibles. Nous aborderons ceci en modélisant l'évolution et la sélection naturelle dans les protéines naturellement observées avec les modules RT. Nos prédictions basées sur des modèles évolutifs serviront d'hypothèses vérifiables dans les expériences d'ingénierie des protéines, ce qui permet d'affiner la recherche vers des combinaisons avec des propriétés optimales en fonction de l'évolution naturelle.

Lay summary

Les répétitions en tandem (RT) sont abondantes en protéomes dans tous les royaumes de la vie. Ayant une variété impressionnante de tailles, de structures et de fonctions, les RT offrent souvent des propriétés de liaison améliorées et sont associées à des fonctions liées à la maladie et à l'immunité. Alors que les mécanismes générant des RT protéiques sont mal compris, la sélection naturelle contribue à façonner leur évolution, et l'expansion de RT peut être liée à l'origine de nouveaux gènes. Des combinaisons spécifiques d'unités RT avec mutations ponctuelles ou indels sont capables d'assurer des propriétés protéiques souhaitables. En effet, la capacité de construction avec des modules RT a été exploitée avec succès dans la bio-ingénierie. Cependant, la recherche expérimentale pour trouver des configurations TR optimales est difficile  et inefficace en raison du nombre énorme de combinaisons possibles. Nous aborderons ceci en modélisant l'évolution et la sélection naturelle dans les protéines naturellement observées avec les modules RT de domaine. Combinés avec des annotations de structure, de fonction et d'interactions protéines-protéines, nous identifierons les innovations évolutives naturelles, c'est-à-dire les configurations RT qui ont été corrigées par sélection en raison des avantages adaptatifs. Ces prédictions peuvent servir d'hypothèses vérifiables dans les expériences d'ingénierie des protéines, ce qui permet d'affiner la recherche vers des combinaisons avec des propriétés optimales en fonction de l'évolution naturelle. Pour les répétitions d'ankyrine et d'armadillo, utilisées pour concevoir des protéines médicalement pertinentes, des recommandations spécifiques seront faites pour d'autres essais expérimentaux.