Project

Back to overview

C16.0072: Discovering evolutionary innovations by assessing variation and natural selection in protein tandem repeats

English title C16.0072: Discovering evolutionary innovations by assessing variation and natural selection in protein tandem repeats
Applicant Anisimova Maria
Number 174836
Funding scheme COST (European Cooperation in Science and Technology)
Research institution Zürcher Hochschule für Angewandte Wissenschaften
Institution of higher education Zurich University of Applied Sciences - ZHAW
Main discipline Genetics
Start/End 01.01.2017 - 29.02.2020
Approved amount 99'216.00
Show all

Keywords (5)

COST action BM1405; tandem repeats; evolution; computational prediction; bioengineering

Lay Summary (French)

Lead
Les répétitions en tandem (RT) sont abondantes en protéomes dans tous les royaumes de la vie. Les RT sont souvent associées à des fonctions liées à la maladie et à l'immunité. Des combinaisons spécifiques d'unités RT sont capables d'assurer des propriétés protéiques souhaitables. La capacité de construction avec des modules RT a été exploitée avec succès dans la bio-ingénierie. Cependant, la recherche expérimentale pour trouver des configurations TR optimales est difficile et inefficace en raison du nombre énorme de combinaisons possibles. Nous aborderons ceci en modélisant l'évolution et la sélection naturelle dans les protéines naturellement observées avec les modules RT. Nos prédictions basées sur des modèles évolutifs serviront d'hypothèses vérifiables dans les expériences d'ingénierie des protéines, ce qui permet d'affiner la recherche vers des combinaisons avec des propriétés optimales en fonction de l'évolution naturelle.
Lay summary

Les répétitions en tandem (RT) sont abondantes en protéomes dans tous les royaumes de la vie. Ayant une variété impressionnante de tailles, de structures et de fonctions, les RT offrent souvent des propriétés de liaison améliorées et sont associées à des fonctions liées à la maladie et à l'immunité. Alors que les mécanismes générant des RT protéiques sont mal compris, la sélection naturelle contribue à façonner leur évolution, et l'expansion de RT peut être liée à l'origine de nouveaux gènes. Des combinaisons spécifiques d'unités RT avec mutations ponctuelles ou indels sont capables d'assurer des propriétés protéiques souhaitables. En effet, la capacité de construction avec des modules RT a été exploitée avec succès dans la bio-ingénierie. Cependant, la recherche expérimentale pour trouver des configurations TR optimales est difficile  et inefficace en raison du nombre énorme de combinaisons possibles. Nous aborderons ceci en modélisant l'évolution et la sélection naturelle dans les protéines naturellement observées avec les modules RT de domaine. Combinés avec des annotations de structure, de fonction et d'interactions protéines-protéines, nous identifierons les innovations évolutives naturelles, c'est-à-dire les configurations RT qui ont été corrigées par sélection en raison des avantages adaptatifs. Ces prédictions peuvent servir d'hypothèses vérifiables dans les expériences d'ingénierie des protéines, ce qui permet d'affiner la recherche vers des combinaisons avec des propriétés optimales en fonction de l'évolution naturelle. Pour les répétitions d'ankyrine et d'armadillo, utilisées pour concevoir des protéines médicalement pertinentes, des recommandations spécifiques seront faites pour d'autres essais expérimentaux.

Direct link to Lay Summary Last update: 13.07.2017

Responsible applicant and co-applicants

Employees

Publications

Publication
A New Census of Protein Tandem Repeats and Their Relationship with Intrinsic Disorder
Delucchi Matteo, Schaper Elke, Sachenkova Oxana, Elofsson Arne, Anisimova Maria (2020), A New Census of Protein Tandem Repeats and Their Relationship with Intrinsic Disorder, in Genes, 1.
Tandem repeats lead to sequence assembly errors and impose multi-level challenges for genome and protein databases
Tørresen Ole K, Star Bastiaan, Mier Pablo, Andrade-Navarro Miguel A, Bateman Alex, Jarnot Patryk, Gruca Aleksandra, Grynberg Marcin, Kajava Andrey V, Promponas Vasilis J, Anisimova Maria, Jakobsen Kjetill S, Linke Dirk (2019), Tandem repeats lead to sequence assembly errors and impose multi-level challenges for genome and protein databases, in Nucleic Acids Research, 47(21), 10994-11006.
Optimising of the Tandem Repeat Annotation Library (TRAL) and Copy Number Variations of Tandem Repeats in RNAseq Illumina Data
NäfPaulina (2019), Optimising of the Tandem Repeat Annotation Library (TRAL) and Copy Number Variations of Tandem Repeats in RNAseq Illumina Data, ZHAW, Wädenswil.
Tandem Repeat Variation in Genomic Databases
DelucchiMatteo (2019), Tandem Repeat Variation in Genomic Databases, ZHAW, Wädenswil.
Analyzing the symmetrical arrangement of structural repeats in proteins with CE-Symm
Bliven Spencer, Lafita Aleix, Rose Peter, Capitani Guido, Prlić Andreas, Bourne Philip (2018), Analyzing the symmetrical arrangement of structural repeats in proteins with CE-Symm, in Biorxiv, 1.

Datasets

Tandem Repeat and Intrinsic Disorder Annotations in Swiss-Prot

Author Delucchi, Matteo; Anisimova, Maria
Publication date 11.04.2020
Persistent Identifier (PID) NONE
Repository https://github.com/acg-team/swissrepeats


Collaboration

Group / person Country
Types of collaboration
Andreas Plückthun, University of Zurich Switzerland (Europe)
- in-depth/constructive exchanges on approaches, methods or results
- Publication

Scientific events

Active participation

Title Type of contribution Title of article or contribution Date Place Persons involved
1st REFRACT symposium - as part of the MSCA RISE project H2020 EU GA N 823886 Talk given at a conference Protein Tandem Repeats and Their Relationship with Intrinsic Disorder (M. Delucchi) 05.11.2019 Lima, Peru Näf Paulina;
1st REFRACT symposium - as part of the MSCA RISE project H2020 EU GA N 823886 Talk given at a conference Selection on Protein Tandem Repeats 04.11.2019 Lima, Peru Anisimova Maria;
ACLS lunch time seminar series Individual talk Annotating Tandem Repeats with TRAL 20.05.2019 Wädenswil, Switzerland Näf Paulina;
Fachkonferenz Technik, Architektur und Life Sciences. Poster Designing novel peptide-binding proteins from armadillo repeat proteins 18.10.2018 Lugano, Switzerland Bliven Spencer;
Life in Numbers 3 Talk given at a conference Designing amardillo scafforlds with help of bioinformatic predictions 04.10.2018 Wädenswil, Switzerland Bliven Spencer;
4th Symposium on Non-Globular Proteins. 2018. COST Action BM1405 Talk given at a conference A census of protein tandem repeats and their relationship with intrinsic disorder 12.09.2018 Druskininkai, Lithuania Anisimova Maria;
4th Symposium on Non-Globular Proteins. 2018. COST Action BM1405 Talk given at a conference Practical application of bioinformatics predictions for synthetic biology: an example with armadillo repeats 12.09.2018 Druskininkai, Lithuania Bliven Spencer;
Swiss Institute of Bioinformatics SIB Days 2018 Poster Designing novel peptide-binding proteins from armadillo repeat proteins. 26.06.2018 Biel, Switzerland, Switzerland Bliven Spencer; Anisimova Maria;
3rd Symposium on Non-Globular Proteins Talk given at a conference Phylogentics of Tandem Repeats with Circular HMMs: A Case Study on Armadillo Repeat Proteins 28.08.2017 Košice, Slovakia Bliven Spencer;
Open Bio Foundation Codefest Individual talk MolQL: The Molecular Query Language 20.07.2017 Prague, Czech Republic Bliven Spencer;


Knowledge transfer events

Active participation

Title Type of contribution Date Place Persons involved
Molecular phylogeny and evolution (as part of "Computational Biology for Infectious Disease") Workshop 17.09.2017 Quy Nhon, Vietnam Anisimova Maria; Bliven Spencer;


Communication with the public

Communication Title Media Place Year
Media relations: print media, online media Repeat please! TRANSFER German-speaking Switzerland 2019

Use-inspired outputs

Associated projects

Number Title Start Funding scheme
176316 Frequentist estimation of the evolutionary history of sequences with substitutions and indels 01.05.2018 Project funding
193832 Trans-omic approach to colorectal cancer: an integrative computational and clinical perspective 01.10.2020 Sinergia

Abstract

Tandem repeats (TRs) are abundant in proteomes across all kingdoms of life. Having an impressive variety of sizes, structures and functions, TRs often offer enhanced binding properties and are associated with disease and immunity related functions. While mechanisms generating protein TRs are poorly understood, natural selection contributes to shaping their evolution, and TR expansion may be linked to the origin of novel genes. Specific combinations of TR units with point mutations/indels are able to ensure desirable protein properties. Indeed, the design-ability of domain TRs has been successfully exploited in bioengineering. However, the experimental search for optimal TR configurations is difficult/inefficient due to the huge number of possible combinations. We will address this by modeling the evolution and natural selection in naturally observed proteins with domain TRs. Combined with annotations of structure, function and protein-protein interactions, we will pinpoint the naturally occuring evolutionary innovations, i.e., TR configurations that have been fixed by selection due to adaptive benefits. These predictions can serve as testable hypotheses in protein engineering experiments, allowing to narrow down the search to combinations with optimal properties according to the natural evolution history. For ankyrin and armadillo repeats, employed to design medically relevant proteins, specific recommendations will be made for further experimental testing.
-