Project

Back to overview

Transcriptional landscape of repetitive elements in single cells: does the genomic dark matter delineate cell identity?

English title Transcriptional landscape of repetitive elements in single cells: does the genomic dark matter delineate cell identity?
Applicant Mallona Izaskun
Number 190824
Funding scheme Spark
Research institution Institut für Molekulare Biologie Universität Zürich
Institution of higher education University of Zurich - ZH
Main discipline Genetics
Start/End 01.02.2020 - 31.01.2021
Approved amount 99'245.00
Show all

All Disciplines (2)

Discipline
Genetics
Molecular Biology

Keywords (7)

bioinformatics; computational biology; transcriptomics; single-cell ; repetitive elements; non-coding RNA; methods

Lay Summary (French)

Lead
En analysant les données scRNA-seq (niveau d'ARN de cellules individuelles), nous voulons étudier si les profils d'expressions des éléments répétés sont d'aussi bons indicateurs des types de cellules que les gènes.
Lay summary
Contenu et objectifs du travail de recherche

Depuis les développements récents de la technologie, les laboratoires de biologie ont la capacité de mesurer la transcription (niveau d'ARN) de cellules individuelles grâce au scRNA-seq. Bien que presque toutes les cellules d'un organisme partagent le même matériel génétique, elles n'en expriment qu'une partie pour remplir leurs fonctions principales. Le consensus actuel en biologie cellulaire est que chaque type de cellule est défini par l'expression d'un ensemble de gènes, principalement car les gènes transcrits sont ensuite traduits en protéines qui réalisent les fonctions nécessaires à ce type de cellules.

Plus intéressant encore, les cellules transcrivent également des séquences d'ADN qui ne sont pas traduites en protéines, séquences appelées ADN non codant («matière noire génomique» ou de «junk DNA»). Dans la plupart des organismes, y compris chez les humains, cet ADN non codant est beaucoup plus abondant que l'ADN codant. Fréquemment, l'ADN non codant est composé d'unités génétiques hautement répétées appelées séquences répétées.

Dans ce projet, nous voulons étudier si les profils d'expressions des éléments répétés sont d'aussi bons indicateurs des types de cellules que les gènes.

Contexte scientifique et social du projet de recherche

Nous développerons les méthodes nécessaires pour mesurer et décrire l'expression des éléments répétés dans des cellules individuelles à l'aide d'outils bioinformatiques et statistiques. Par soucis de transparence et de reproductibilité et afin de diffuser notre outil au plus d'utilisateurs possibles, nous le dévoilerons sous licence open source.
Direct link to Lay Summary Last update: 22.11.2019

Responsible applicant and co-applicants

Abstract

Understanding the determinants of cell identity is a large challenge in biology, especially with the uptake of new technologies. Cell identity is intimately linked to transcriptional regulation. Overall protein coding gene expression is well accepted as a proxy to cell identity, whilst the repetitive elements expression contribution to cell phenotypes is largely unknown.Taking advantage of the single-cell RNA-Seq (scRNA-seq) technology we propose a methodological development to profile repeat expression and to cluster cells according to repeats transcriptional landscapes. Largely abundant in eukaryotic genomes, repeats are expressed and show regulatory signatures; studies carried out in bulk RNAseq indicate that repeat transcription is linked to cell identity.To further dissect the repeat expression landscape in single cells, we will compare cell-to-cell variability arising from repeat expression to that of protein-coding genes in adult brain cells (with strongly defined cell types), in a model for cardiac differentiation (transcriptional trajectories) and in cancer (dysregulated repeat expression).Methodologically, we will address the sequencing, mappability, quantification and normalization challenges and will implement an open, robust and flexible computational biology workflow.As a proof of concept to test the project feasibility we have run a prototype on a droplet-based (10x) dataset of peripheral mononuclear blood cells (PBMCs), known by the shallow sequencing and 3' RNA enrichment. We detected a noticeable amount of repeat expression and variability across cell identities.From the impact point of view, we will open a window into the overlooked transcriptomics of repetitive DNA in single-cells, and will release a tool to dissect any present or future dataset in any species.
-