生命及其所处的环境构成的系统是宇宙中最为复杂的系统,从微观的DNA和蛋白质分子系统到宏观的大尺度生态系统,其结构变化和功能过程的实现,都蕴含有大量的信息结构和信息传递过程。解译这些信息结构和信息传递过程,用以服务生命科学的研究,是生命科学中的信息科学的重大课题。
如果说生物信息学是解释人 类自身结构信息的学科,信息生态学则为人类生存环境问题指出了信息科学研究方向。因此“生命科 学中的信息科学”就成为了国家自然科学基金委员会“21核心科学 问题论坛”的第一次会议的主题。 会议通过研究认为90年代初期生物信息学、信息生态学等的提出为解决象基因组、生态学研究中的重大问题提供了有效途径。会议研讨了以下关键问题。
生物信息学
专家们一致认为生物信息学的含义与内容是明确。具体的。它是80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科。它是使用数学、物理学和信息科学的观点、理论与方法从研究遗传物质的载体DNA出发,分析其编码的蛋白质等的序列和空间结构,以及它们的动态变化和相互作用,目的是认识生命的起源、进化。 遗传和发育的本质,破译隐藏在DNA序列中的遗传语言。专家们指出当前基因组相关信息的增长速度只有计算机的增长速度可以与之比拟,因此要破译生物遗传密码必须以计算机为工具,发展信息学的理论、方法。当前生息学的主要研究领域应集中下几个方面:
1.建立国家生物医学数与服务系统
国家生物医学数据库与系统应具备如下职能:为全国教育、科研人员免费提供数据、整理我国科学家测定的相 据和资料,构建我国自己的数据库。同时发展专门的二级数据库;发展若干算法及软件,包括数据库存 质量评估软件,可视化软件等。建立若干重要服务器;进行相关的培训;实现重要文献的检索;过多成适量的基础研究工作。
2.人类基因组的信息结构分析
A、发现新基因。利用国际 数据库和我国科学家测定的数据,经过大规模并行计算发基因和新SNPs以及各种功能 是各国科学家当前争夺的热点
B、研究占人类基因组95非编码区的信息结构,阐明该区的重要生物学功能。普遍认为,非编码区与基因在四维时空的调控有关。因此寻找这些区域码特征,信息调节与表达规律来相当长时间内的热点课题,得重要成果的源泉。
C、进行模式生物完整基因的信息结构分析和比较研究。对伴随人类基因组而完成的大量微生物完整基因的信息分析,不仅将直接帮助破译人类遗传密码,其导致的比较基因组学也必将为后基因组研究开辟新的领域。
3.功能基因组相关信息分析
A、获得基因的功能表达谱,将存在于人类基因组上的静的基因图谱,向时间、空间维上展开是新一阶段基因组研究的核心。为了得到基因表达的功能谱,国际上在核酸和蛋白质两个层次上都发展了新技术。在核酸层次上主要是DNA芯片,在蛋白质层次上则是二维凝胶电泳和测序质谱组成的蛋白质组学技术。这些新技术的出现导致了大规模基因功能表达谱的分析问题。因此需要发展新的信息分析方法、工具与数据库。
B、与基因组信息相关的核酸、蛋白质空间结构的预测以及蛋白质功能预测。要了解蛋白质的功能、要找到某些蛋白质致病的分子基础,只有氨基酸顺序的知识是不够的,必须知道它们的三维结构。与此同时,要设计药物治疗这些疾患也需要了解蛋白质的三维结构。这是摆在科学家面前的紧迫任务。
4.从生物信息数据出发开展遗传密码起源和生物进化的研究
自 1859年Darwin的物种起源发表以来,生物进化是对人类自然科学和自然哲学发展的最重大贡献之一。现在随着大量完整基因组的测序完成为开展分子研究和探索遗传密码的起源创造了极好时机。利用这些数据也有利于开展从数量遗传学、群体遗传学和分子生态学出发的信息研究。
信息生态学
信息生态学是以现代系统理论、方法和现代计算机技术来分析、处理整日趋膨胀的试验和观测的生态学信息,寻求生态学系统整体水平的规律。专家们认为,现今世界科学研究的发展趋势的应该是强调整合和系统的整体论,而强调解析的还原论的结果通常是导致科学家对越来越小局部和的片断的越来越深的了解。对于象生态系统这样的复杂系统而言,仅仅了解系统的内部的局部环节远远不足以解释系统的行为,因为系统各部分(子系统)之间的相互作用在解释系统行为方面同等重要。专家们提出如下信息生态学优先研究领域。
1.生态学数据采集技术的规范化及数据库的系统化
在生态学数据的采集方法、技术、手段、及数据精度等方面,应尽量实现规范化和标准化,尽可能利 用新的数据传感技术(如近红外技 术),使之尽可能符合国际、国家。或者行业的标准,为后续的信息分析和处理打下良好的基础,为信息的交流传播和共享创造条件。鉴于数据生态学数据的形式、时空范围、获取背景等诸多方面的多样化,有必要对现有的生态学数据进 行系统化的整编、改造,使之能够 互相补充,互相印证。同时,有必要就上述问题展开方法和技术方面的研究。
2.生态系统信息分析与模型化以不同方法手段对生态学数据进行分析和处理,从中导出有关生态学规律
发展各种不同类型、不同尺度、不同层次的生态系统模型,通过对系统的模拟分析,从生态学数据中提取有关生态系统的行为和规律方面的信息。主要包括如下方面:①.生物群落的综合信息分析理论。发展包括环境、空间因素、生物要素在内的群落学多元统计分析方法将是信息生态学在群落分析方面的重要的潜在突破曰。②.基于过程的植物个体(包括农作物、森林树木)生长发育动态模拟模型。模拟不同气候、土壤条件下,植物个体各部分的生长。发育以及净第一性生产力、产量。材积形成的过程。③.森林群落结构动态模型。建立适合于我国特殊情况的(灾害频繁、人为活动干扰强度大等)森林群落物种演替动态模拟模型。④.空间耦合动态模拟模型理论、空间模拟软件系统。很有必要建立一个空间异质生态系统模拟的计算机环境,专门用于各种不同的空间异质生态系统的模拟模 型的建立。⑤.空间异质生态系统模拟模型。针对景观尺度和区域尺度的生态学问题,建立生态系统结构和功能耦合、空间格点耦合的双重耦合生态系统模拟模型。⑹.不同尺度生态系统模拟模型的尺度转换。
3.生态系统管理的信息化咨询与决策
结合理论模型和生态系统管理方面的定性的和定量的专家经验性知识,建立生态系统管理咨询与决策系统。关键问题包括:专家经验和知识的规范化和知识库建立。理论模型与专家经验的结合。研究有关的方法和技术,正确客观地处理理论模型结果和专家经验知识之间的矛盾。
生命科学中的信息科学的新理论、新方法、新技术、新软件
尽管处理的科学问题不同、时空尺度不同,但生物信息学和信息生态学所用的信息分析工具却有许多是相同的或相近的。研究和发 展一些通用的信息工具是共同的需要。
生物信息学和信息生态学的研究需要发展有效的能支持大尺度作图与测序需要的软件和数据库以及若干数据库工具,包括互联网络上的远程通讯工具,使之能容易地处理日益增长的物理图、遗传图和序列信息、地理信息。改进现有的理论分析方法,如统计方法,隐含马尔科夫过程方法,非线性动力系统方法,特别是混浊和分维方法,神经网络方法,复杂性分析方法,密码学方法,多序列比较方法等;要研究系统自组织问题、熵或其它信息的测度问题,创建一切适用于基因组信息和信息生态学分析的新方法、新技术,包括引人复杂系统分析技术、信息系统分析技术等,例如,发展离散数学和组合数学相结合的方法;发展统计语言学和代数语言学相结合的方法;发展研究基因组完整信息结构和信 息网络的研究方法等。如近红外光谱技术、计算计视觉技术、图像和图形的识别技术的研究,也是非常重要的。这一切是我国生物信息学和信息生态学研究取得突破的技术保障。