在过去的一年里,随着双向电泳和质谱以及不同研究程序的核心技术的改进,蛋白质组学保持持续快速进步。注释充分的蛋白质组学数据库现在在一些领域出现了,为系统研究提供了一个平台,在临床应用诸如心血管和肿瘤学中尤其有发展前途。大规模定量研究,在功能和敏感性上与基因表达所达到的相媲美,因而在蛋白质水平正变为现实。
简介
如果90年代是基因组的十年,新世纪的头十年正成为蛋白质组学的十年。蛋白质组学技术生成的定量表达数据第一次可以在规模和敏感性上与基因水平相媲美。这个进展对于我们理解健康和疾病的细胞组成结构以及对药物、农业生物技术有重要意义。确实蛋白质组学业已在大范围应用中产生了重要发现。这篇文章综述了蛋白质组研究中的新概念、革新技术以及生物应用。
概念:结构对量化调节蛋白质组学
蛋白质组学的最终目标不仅仅是将健康和疾病状态下细胞表达的蛋白质分类。最终目标是阐明细胞生命赖以进行的代谢、信号传导和调控网络的组织和动力学。另外,蛋白质组学寻求理解这些网络如何在疾病中失去功能以及如何通过干预诸如药物和基因操作操纵它们的功能。
这些是模糊不清的目标,在它们能够充分实现之前需要敏感性增强的技术和新的概念,但是对调节网络作图和细胞状态诊断的任务在不断进展。在微生物中, VanBogelen等[1]已经识别了特殊细胞状态的蛋白质组信号,诸如分泌功能障碍和特殊磷来源的使用,并且目前正在结合基因组和蛋白质组方法试图作出完全的调节网络[2]。
然而,大多数蛋白质组研究都指向具体生理状态下蛋白质表达和功能的更近期的目标。这里,两个对立但是互补的策略已经出现了。一个是"表达"或者"定量调节"蛋白质组学监控一个细胞或组织里大数量蛋白质的表达以及定量观察在不同环境下,诸如药物的存在或者在疾病组织里表达方式是如何改变的[3]。这使得它可能识别疾病特异性蛋白质、药物靶标和药物毒性与效力的标记物,以及通过识别表达进行协调改变的蛋白质。这是目前最广泛应用和有效的蛋白质组学模型,现在还主要依赖于双向电泳(2DE)。
第二个策略被称为"细胞图谱"或者"结构"蛋白质组学[4]。这里,近期目标是识别蛋白质的结构,尤其是识别与其它蛋白质相互作用并形成复合体的蛋白质的结构。通过记录蛋白质的物理相互作用,尽管没有定量调节蛋白质组学的所集中的幅度,这个策略可能对特别通路的具体研究证明高度有效。尽管双杂交以及相关的分析[5]对特异蛋白质-蛋白质相互作用的识别是重要的,结构蛋白质组学的最重要的技术是质谱(MS)。
技术:2DE和MS的改进
定量调节和结构蛋白质组学的区分是有用的,然而必须强调大多蛋白质组项目结合两种方法并同时依赖2DE和MS。在过去的几年里这些核心技术已经看到了显著的进展。通过建立在zwitterionic去污剂[6]和有机溶剂[7]基础上的样品制备的持续进展,令人烦恼的用2DE分离高度憎水的膜蛋白质的问题有了逐渐的进展,但是仍然是一个重要和未解决的问题。从一个组织获得单一细胞类型样品的挑战通过使用一个激光捕获显微切割系统有所解决,一个组织样品附着在一个胶片上然后同样的兴趣细胞用一个激光束脱离下来[8]。
蛋白质组学中MS的使用在功能和多样性方面已经有了一些显著改进而继续演进。一些研究组已经引入了新的蛋白质标记方法学改进MS的功能和敏感性[9,10]。Aebersold和合作者[10]已经发展了一个用同位素编码的亲和标签(ICAT)标记肽的方法,它不仅支持复杂肽混合物的增强的分析也允许在蛋白质表达水平对差异的精确定量,这是MS为基础的蛋白质组学以前所没有的功能。MS与一个软件工具FindMod的配对增强了该方法识别转录后修饰的能力[11]。定性蛋白质复合体的技术也被引进,包括基于液相色谱/串联MS[12]的系统以及发展一个新的串联亲和纯化(TAP)标签从细胞样品快速纯化复合物[13]。其它样品处理方法的进展近来允许对分泌囊中的肽用MS直接进行分析,可望用同样的技术对其它细胞器进行分析[14]。
当然通过结合2DE和MS为基础的方法蛋白质组学获得最低点的功能。一个代表性的结合例子是Hochstrasser研究组[15]所发展的系统,整个2DE凝胶进行原位消化,电转移到膜上并直接用MS扫描,生成注释的2D图谱。这样的发展在一些专业蛋白质组学公司已经开创,现在可以使得蛋白质组学在与项目本身复杂性相对应的规模上开展起来。
蛋白质组数据库
蛋白质组数据库含有不同细胞状态下获得的注释的2DE数据,它是基本的平台,从数据库蛋白质组研究解决具体的生物学和药物学问题。然而值得注意的是到目前相对少的大规模数据库已经出现到公共区域里来了。酵母蛋白质数据库(YPD; http://www.proteome.com/databases/index.html) 是一个最好和建立最久的大规模数据库,它的主办者Proteome Inc(Beverly, MA)现在构建WormPD[16],它是一个线虫C.elegans的蛋白质组数据库,该线虫的完整基因组已经被测序。在过去一年里最重要的数据库发展是Hoffmann-La Roche构建的流感噬血杆菌数据库,包含超过1000个独立的2DE蛋白质点的图谱,其中超过500个独立蛋白质目前已经被识别[17]。Klose和合作者[18]近来也报道了它们正在进行的程序发展小鼠蛋白质组的数据库,开始的重点放在大脑蛋白质。在人类,Celis等建立的膀胱癌数据库[19]仍然是目前所能获得的最大和注释最好数据库之一,尽管再过几年一定会看到生成大范围的人组织的蛋白质组数据库。设计解决人和其它生物体具体生物问题的较小蛋白质组数据库的数目现在已经很庞大,超过了此综述所谈的范围。Expasy网站是主要SWISS-2D PAGE蛋白质组数据库和其它资源的主页,含有大量的链接,仍然是探索公共蛋白质组学数据库的最佳平台。
基础生物学
解决基础生物学问题的蛋白质组学项目的数目目前已经很大了并且继续增长。一部分这反映了"蛋白质组学"这个词的广泛用途,不仅包含了大规模生物技术研究也包括了使用2DE、MS或其它技术系统研究蛋白质的任何项目。
从蛋白质组学浮现出来的对普通生物学的一个最重要的主题是深入探索基因和蛋白质关系的本质。在上述Klose及同伴的小鼠蛋白质组项目中[18],基于蛋白质多样性,几百个小鼠基因被定位到染色体上。这些研究所呈现的是许多蛋白质修饰与具体的基因相关,于是一个蛋白质应该被认为不是一个而是许多基因的表现型[20]。同样的,一个基因突变会影响许多蛋白质。最终,这种研究会导致更成熟的理解健康和疾病中基因和细胞功能的关系。
结合免疫层析技术和2DE以及随后的MS仍然是研究一个细胞蛋白质组的一个具体亚系的主要载重马。无数基础细胞机制的研究正用这个方法进行着。比如,用抗磷酸酪氨酸和抗磷酸色氨酸抗体的免疫印迹被用来从小鼠成纤维细胞中提取超过500个磷酸化的蛋白质,其中至少100个在用血小板衍生的生长因子(PDGF)刺激后进行了磷酸化改变[21]。这些研究揭示了PDGFb受体下游新的推测的信号传导途径,并使用到其它信号传导途径。第二个例子,免疫沉淀被用来从E.coli提取伴娘分子GroEL,与超过300各新翻译的多肽形成复合体,它们随后用2DE进行分离。这个技术使得能够研究介导蛋白质折叠的GroEL的功能,并是一个典型的蛋白质组学技术如何能够被用来靶向和研究一个具体的细胞成分亚系。这一部分的最后值得提出蛋白质组学是植物生物学和农业生物技术的新兴领域[23]。植物蛋白质组学研究包括定性个体和系的鉴定、评估群体内部和之间的遗传多变性[23]。
临床研究
蛋白质组学的潜能在临床范围似乎是无限的,因为与任何给定疾病状态相关的蛋白质现在能够容易地被识别,如果样本充分而且在一个合适的规模上进行研究。现在有无数个蛋白质组学为基础临床研究,每个月项目的数目都在增加。一组有意思的数据近来来自新西兰的奥克兰大学,那里人海马蛋白质组图谱的构建导[24]致了在精神分裂症中识别出18个异常表达的蛋白质,其中的一些发现定位在6号染色体的同一区域[25]。这些蛋白质在此疾病的发病原理中的作用目前正被研究之中。
英国Harefield医院的Dunn及同事几年来致力于蛋白质组学在心脏疾病中的一个主要临床应用,此项目近来已经被综述[26]。这项工作建立在良好的蛋白质组学数据库的坚实基础之上,近年的工作包括识别扩张性心肌病的疾病特异性蛋白质[27,28]以及研究抗内皮细胞抗体作为潜在的预测慢性心脏移植排斥的实验[29]。但是在肿瘤学蛋白质组学找到了其最广泛的临床应用,主要通过用2DE为基础的技术比较正常和肿瘤组织。过去的一年里已经看到在一定范围肿瘤类型的蛋白质组学研究的文献发表,其中最引人注意的是膀胱和乳腺癌的研究。在膀胱鳞状细胞癌中,Celis等[30]使用上述的他们的数据库识别出几个疾病特异的蛋白质,它们被用来制作抗体识别转移损伤。该组发现了psoriacin作为膀胱鳞状细胞癌的蛋白质标记物,它可能提供了一个有用的、非创伤性的方法进行疾病监控[31]。
在过去的几年里,一些研究组已经描述了乳腺癌的蛋白质组研究。最近研究报道的第一步是在正常腔和肌上皮乳腺细胞中分离超过1700个蛋白质点,它们在两种细胞类型中差异表达[32]。两种细胞类型的分离是这个研究的一个重要特点,因为~95%的乳腺肿瘤是腔细胞起源的。这个详细研究的下一阶段将确定肿瘤细胞的蛋白质组以及鉴别其与健康腔细胞蛋白质组的区别。
毒理学
毒理学可能是蛋白质组学应用的一个最重要的应用。2DE是一个高度敏感的手段筛选毒性和探索毒性机制。通过比较一个给定药物治疗后蛋白质的表达与未处理情况下蛋白质表达的比较,有可能凭与药物效力或毒性相关的成套蛋白质改变识别生物化学通路的改变。当为已知毒性的化合物构建一个足够大的蛋白质组标志的文库时,有可能用它来评价新化合物的毒性。然而,进入公共范围的对毒理学的大规模蛋白质组学研究还很少。一个在Imperial College London/SmithKline Beecham的一个研究组所进行的研究,其报道了在大鼠暴露在puramycin aminonucleside后用2DE和NMR为基础对肾小球毒性的研究[33]。通过监控尿中的蛋白质,该研究使得能够比以前更详细地理解与肾小球毒性相关的蛋白质尿的本质与演进。第二个近来的例子,在兔铅毒性模型的研究中识别了一些蛋白质在增加铅剂量后表达的改变,其中的一些分子暂时识别为谷胱苷肽-S-转移酶的突变体,可能会发展为人类铅毒性的有价值的标记物[34]。其它近来出现的值得注意的蛋白质组毒理学研究报告包括一个环孢菌素A毒性的分析,它揭示了一个新的牵涉到钙结合蛋白质calbindin-D的毒性机制[35],以及正在进行的暴露啮齿类动物于过氧化物酶体增殖物后肝蛋白质的改变[36,37]。然而,尽管无数其它毒理研究使用了蛋白质组学工具诸如2DE和MS,蛋白质组学在常规毒理学的潜力还未实现。
结论
过去的一年已经看到蛋白质组学持续的技术进展以及生物体蛋白质组织和功能上主要和持续的数据流的开端。尤其是,在编辑从微生物到人肿瘤范围的蛋白质表达数据库以及在无数生物体中识别大范围细胞状态特异的蛋白质上有了重要进步。2DE和MS技术是现代蛋白质组学的主要驱动力,并在不仅的将来仍会是这样,尽管更长的时间内新方法包括抗体为基础的技术和蛋白质芯片会挑战它们的主导地位。然而,在将来的几年里有可能通过现存的技术,蛋白质组学会帮助克服许多现代生物学和生物技术的最有挑战性的问题。