蛋白和核酸资料库日益丰富,伊利诺斯大学研究人员最近研制出一种新型软件,可以更有效地分析、比对序列和结构数据。
Zaida Luthey-Schulten “MultiSeq(发音为Multi-seek)能够帮助您对结构和序列进行分析,并且能够利用包含在结构和序列中的全部信息,分析该基因或蛋白在不同物种进化过程中出现的差异,”
化学教授、伊利诺斯大学Beckman Institute 研究所(主要负责尖端科技研究)研究人员Zaida Luthey-Schulten说,“通过将生物信息放在进化背景中考虑,我们可以对不同物种来源的蛋白进行比较动态研究(comparative dynamics studies,生物通编者译)。”
目前蛋白和核酸,序列数达3百万以上,结构达3亿5千万种。MultiSeq软件能够结合环境因素对这些数据进行分析,有助于研究人员对于一些基础科学问题能够得到更有价值的资料,比如生命起源现象,和抵抗抗生素(作用于核糖体)的抗性增强现象。
VMD(Visual Molecular Dynamics,可视分子动力学)是一种观察和分析分子动力学模拟(molecular dynamics simulations)的程序,由伊利诺斯大学研究人员研制并免费向广大用户开放。VMD能够控制大型的包括1百多万个原子的三维体系。多重芯片(Multiple Alignment tool)是VMD一个重要组成部分。Luthey-Schulten和研究生Elijah Roberts、John Eargle 、Dan Wright在多重芯片的基础上研制得到MultiSeq。MultiSeq通过在分析过程中结合已知的多样的进化数据扩展了VMD的功能。
比如,科学家可以借助MultiSeq软件研究核糖体的进化过程。蛋白翻译是生命活动的一个重要组成部分,核糖体是蛋白的加工厂。“要想弄清翻译过程中DNA-RNA-蛋白途径的变化,至少要将不同核糖体中的DNA序列、RNA序列和蛋白序列分别比对,”
Luthey-Schulten说:“去年,同时比对两个核糖体中的三个序列都感到困难,但是现在,在MultiSeq的帮助下,我们可以对20多种核糖体中的序列信息同时进行比对了。”
MultiSeq就序列和结构改变,利用信息科学来组织与检索数据、利用信息可视化来协助相关性识别、利用数学来阐明统计学推论、利用生物学来分析理化性质,在一个进化框架里,整合了序列及结构数据。
研究合作单位包括:Beckman 研究所Theoretical and Computational Biophysics小组和National Institutes of Health (NIH,美国国立卫生研究所) Resource for Macromolecular Modeling and Bioinformatics。MultiSeq软件的具体内容发表于《BMC Bioinformatics》,并且出现在该杂志的网络版首页。在秋季,MultiSeq将作为教学工具进入课堂教学。
“我们认为,不以进化为基础理论框架的话就不能够对一些复杂的生物学问题充分理解,”论文中写到,“MultiSeq可以预先剔除一些事倍功半的任务,或者通过引入看似亲缘关系较远但是相关的数据摸索出一些新的研究方法,加速科学研究。”
研究受到美国国家基因委员会(National Science Foundation)、美国能源部(U.S. Department of Energy)、美国国立卫生研究院(National Institutes of Health)资助。