我国核酸(DNA)序列公共数据库今天正式上网运行,国家人类基因组南方研究中心率先向公共数据库提供了10多万条核酸 序列数据。从此,我国科研人员测定的核酸序列信息,可以上网 注册,并可获得惟一的与注册时间相关的注册号,有助于保护知 识产权。这表明,我国有了自己的“基因库”。
面向全国生命科学研究的核酸序列数据库,是由国家863计划 生物技术领域资助的一个生物信息学项目,由中国科学院上海生命科学研究院生物信息中心和国家人类基因组南方研究中心共同开发,是我国第一个自主开发的核酸数据库。
按照国际惯例,科研人员获得基因序列后,要进入“基因库 ”进行注册登记,注册号表示资料提交时间的先后,也是对“谁 首先测定了该序列”的一个确认,亦即认定该序列知识产权归属的重要凭证。在此之前,中国科学家获得基因序列后,都是提交 给美国、欧洲、日本等国外的“基因库”申请保护。
中科院上海生命研究院副院长赵国屏介绍,目前,科学家凭 借所掌握的“遗传密码”知识,找到十几万个基因已不成问题。 但是,这些基因仅是遗传“指令语句”中的一部分“实词”,还 有许多“虚词”并不清楚。一句话,要从基因组的全核苷酸序列 获得完整的遗传信息,还要走很长的路。惟有掌握了这些信息, 才算读懂了“生命天书”。
科学家介绍,人类基因组研究的迅速发展,造成了生物学数据的迅速膨胀,对数据的搜集、管理、处理、分析、释读能力的 要求迅速提升。现在,基因数据的总量每14个月翻一番。每个月至少测出150种蛋白质结构。处理和利用如此浩瀚的数据,必须靠 信息科学,靠日益先进的计算机技术。于是,也就衍生出生命科学和信息科学的重大交叉前沿学科:生物信息学。中科院院士郝 柏林预计,近几年内,如何利用生物信息库和生物计算手段,必将影响生物、医学、农业乃至军事等众多领域。 欧美发达国家早已着手积累生物信息,美国在60年代开始建立手工搜集的蛋白质数据库,其洛斯阿拉莫斯国家实验室1979年 建起基因库,该库现在由1988年成立的国家生物信息中心管理维 护。欧洲分子生物学实验室1982年开始提供服务的EM?BEL数据库 和随后建立的欧洲生物网,1994年改由建在英国剑桥大学的欧洲 生物信息研究所管理。日本1984年着手建立国家级的核酸数据库 DDBJ,1987年正式提供服务。
目前,世界绝大部分核酸和蛋白质 数据,在由美国、欧洲和日本建立的国际核酸序列数据库中每天 同步更新。其它国家,如德国、法国、意大利、澳大利亚、以色列等,在分享其它国家的生物信息资源的同时,也纷纷建立了自 己的生物信息中心,为本国服务。我国科学家多年来也不断呼吁,打破条块分割局面,建立具有国家规模和国际水平的生物信息中 心。
今天开通的核酸序列公共数据库,就是中国生物信息集成数据库的一部分。与此同时,中国生物信息网站也正式开通。赵国 屏介绍,近期,他们在建设人类基因组数据库的同时,将加快建 设国家级的生物信息库,以人类基因组大规模测序为核心,发展 生物信息学软件,培养生物信息学人才,推动生命科学研究的更 快发展。