近日,相关成果论文在Frontiers in Genetics杂志发表了中国科学院北京基因组研究所胡松年项目组的研究成果。研究人员利用新一代测序数据,运用生物信息学方法,在小鼠的几个组织中发现了几千个新的转录本。该研究成果的完成拓宽了转录组数据分析的思路,有利于更全面地认识小鼠的转录组组成,并进一步补充了其基因组的注释。
本研究运用通过去除核糖体技术构建的转录组文库的二代测序数据,该项技术理论上可以捕获较全面的RNA分子。通过深入分析,在小鼠的大脑、睾丸和胚胎干细胞中发现了几千个新的转录本(大部分是非编码RNA)。这些新检测到的转录本与转录起始和延伸的信号密切相关,在这些转录本上游,科研人员看到了H3K4me3,RNAPII结合位点和CAGE等标志转录起始的特征。而且这些转录本的基因组位置、外显子序列和启动子经过了进化的选择,由此可以看出它们潜在的功能性。
这些结果定义了一个小鼠基因组的新的转录本集合,这些转录本在小鼠的细胞和组织中有一定的功能。
新鉴定的转录本示意,分别定位于基因Tmem180的内含子区域(上)和基因Sap130邻近的基因间区
转录组研究是一种被广泛应用的、从整体的层次研究材料中基因表达与调控的研究手段,在探索生命过程以及形形色色的生物学问题,如疾病发生等的研究中发挥重要的作用。以前的转录组研究主要侧重于对mRNA的研究,随着不同类型RNA分子的发现以及其重要生物学功能的揭示,转录组的研究内容也随之拓展。新一代测序技术以其高通量数据的产出为鉴定低丰度表达的转录本提供了机会,另一方面,文库构建技术的发展也使科研人员有机会更高效全面的捕获RNA分子。人们将有机会更全面深入地认识转录组,并在此基础上开展研究。(生物谷Bioon.com)
doi:10.3389/fgene.2011.00093
PMC:
PMID:
Thousands of novel transcripts identified in mouse cerebrum, testis, and ES cells based on ribo-minus RNA sequencing
Wanfei Liu, Yuhui Zhao, Peng Cui, Qiang Lin, Feng Ding, Chengqi Xin, Xinyu Tan, Shuhui Song, Jun Yu and Songnian Hu
The high-throughput next-generation sequencing technologies provide an excellent opportunity for the detection of less-abundance transcripts that may not be identifiable by previously available techniques. Here, we report a discovery of thousands of novel transcripts (mostly non-coding RNAs) that are expressed in mouse cerebrum, testis, and embryonic stem (ES) cells, through an in-depth analysis of rmRNA-seq data. These transcripts show significant associations with transcriptional start and elongation signals. At the upstream of these transcripts we observed significant enrichment of histone marks (histone H3 lysine 4 trimethylation, H3K4me3), RNAPII binding sites, and cap analysis of gene expression tags that mark transcriptional start sites. Along the length of these transcripts, we also observed enrichment of histone H3 lysine 36 trimethylation (H3K36me3). Moreover, these transcripts show strong purifying selection in their genomic loci, exonic sequences, and promoter regions, implying functional constraints on the evolution of these transcripts. These results define a collection of novel transcripts in the mouse genome and indicate their potential functions in the mouse tissues and cells.