王建伟 译
吉林大学药学院
蛋白质组学是大规模的蛋白质分析,它将极大地促成我们在后基因组时代对基因功能的理解。蛋白质组学能被分为3个主要领域:(1)针对大量蛋白质鉴定的蛋白微观特性学;(2)潜在的应用于一大系列疾病的基于蛋白水平比较的"差异展示"蛋白质组学;(3)用质谱法或者酵母双杂交等技术研究的蛋白质与蛋白质相互关系学。因为即使基于和其它蛋白同源性或者甚至三维结构的比较,也往往难于预测一个蛋白的功能,所以对一个蛋白复合物的成分或者细胞结构的测定在功能分析中是重要的。蛋白质学在该方面的研究也许是大有希望的领域。在分子生物学发生巨变后,例如通过DNA方法使克隆变得容易,蛋白质组学在未来几年内将增加我们对于蛋白质、加工和路径的生物化学的理解。
在很短时期内大规模的DNA测序已经使生物医学的研究发生了变革。随着大多数人类基因的发现,现在很明显如果我们能够得到对于复杂生物过程一个全面的了解,那么一个解决生物问题的"工厂化方法"是值得要的。在本篇中我们将回顾一下蛋白质组学是如何通过对全球基因产品的分析,来对我们理解生物学和医学同样地作出至关紧要的贡献的。
蛋白质组学的定义
蛋白质组学是大规模蛋白质的研究,通常是利用生物化学的方法。蛋白质组学这个词传统上是和通过一个已知的细胞系或生物体在双向聚丙烯酰胺凝胶上展示大量蛋白相关的1-4。在这种意义上,蛋白质组学已经可以回溯到20世纪70年代末,当时研究者们开始用当时最新的发达技术双向凝胶电泳技术来构建蛋白质数据库5(框1)。这导致通过广泛的编目双向凝胶像点来对所有表达的蛋白建立数据库。然而,尽管当时这样的凝胶跑动可以在实验室间再现,但是确定蛋白的身份是困难的,因为缺少对于蛋白特性灵敏而快速的分析方法(例如聚合酶链反应和自动化的DNA分析的测序仪)。在20世纪90年代,生物的质谱仪作为一个强大的分析方法诞生了,以至弥补了大多数蛋白质分析的局限性。这个发展,加上在公共数据库中整个人类编码序列的实用性,标志着一个新纪元的开始。如今,蛋白质组学这个术语涵盖了多数基因产品的功能分析即功能基因组学,包括大规模的蛋白质鉴定或定位研究以及用酵母双杂交系统(yeast two-hybrid system)研究其相互作用。然而,更为焦点的大规模的蛋白质结构的研究通常改为不包括和标定"结构基因组学"6。同样地,仅仅靶向基因或mRNA的策略,例如大规模的突变或反义实验,是不应该被考虑为蛋白质组学的一部分的。
蛋白质组学的必要性
随着数据库中大量DNA序列的积累,研究者们意识到仅仅完成基因组的测序是不足以阐明生物的功能的。一个细胞正常来说是基于众多的代谢和调节路径来维持其生存的。在细胞的基因和蛋白成分即蛋白质组间没有严格的线性关系。蛋白质组学是基因组学的补充,因为它集中在细胞中的活性因子:基因产品的研究。因此,蛋白质组学直接导致了药物发展,因为几乎所有的药物是直接定向蛋白的。
基因组数据库中一个开放读码框(open reading frame ,ORF)的存在并不必要地意味着一个功能基因的存在。尽管生物信息学已飞速发展,仍然难于从基因数据库中精确地预测基因(见该期Eisenberg等的综述,823-826页,和参考文献7, 8)。虽然相关生物的测序通过比较基因组学将减轻基因预测的问题,但是初级结构的正确预测的成功率仍低9,10,特别是在小基因(小基因整个都能被忽视掉)或者那些与其它已知基因少有或没有同源关系的基因中。最近一项研究表明在对来自Mycoplasma genitalium 基因组的340个基因的注释中,错误率至少为8%11。如果这样的错误率推断到人类基因组,结果和推论是容易想象得到的。因此,通过蛋白质组学的方法确认一个基因产物在"注释基因组"这项工作中是重要的最初的一步。蛋白质的修饰显然不是源于DNA序列,例如异构体和转录后修饰,这些修饰仅能被蛋白质组学的方法论所测得。此外,也许有必要立即确定蛋白的表达水平,因为mRNA水平和蛋白水平也许有或者没有相关性12,13。基因产品的定位常常难以从序列来预测,却可用实验的方法确定。诸如细胞间通过蛋白质水解、再生和隔离来调节蛋白功能等机制影响了基因产物而非基因本身。最后,蛋白和蛋白间作用以及细胞结构的分子成分如细胞器,仅能在蛋白水平测定到。
蛋白质的鉴定和分析
蛋白质的制备方法
蛋白质组学中最至关紧要的步骤之一是获得和处理蛋白样本。与大约有100,000个基因的整个基因组不相称的是,一个指定的细胞系也许可以表达约10,000个基因并且更高的在组织中的表达。此外,生物样本内动态的蛋白质充裕的范围能达到106。因为即使最好的双向凝胶能分解不多于1,000种蛋白,所以显然如果采用未加工的蛋白混合物,那么只能含量最丰富的蛋白质才能用凝胶电泳显现出来。降低复杂性和差异性的理想解决方法是用基于亲和力的利用整个蛋白质组的蛋白纯化方法。例如,中等丰裕度的促红细胞生成素受体,每个细胞内约存在1,000个拷贝,或者每升细胞培养液中少于2皮摩尔(100ng)。该蛋白不能从整个细胞抽取液中显现出来,但能很容易通过抗体相关亲和力纯化法浓缩而产生一个银染的带子。如果信号分子和其它调节分子要被研究的话,那么这个事实是必须要牢记的。
在得到蛋白碎片后,选择的蛋白质组学研究方法是单向或双向凝胶电泳法。作为一个预备方法,单向电泳的优点实质上是所有的蛋白质在SDS中是可溶的,很容易覆盖从10,000到300,000范围的相关分子量的蛋白,而且极为酸性和碱性的蛋白容易被显出。
蛋白质的质谱鉴定
蛋白质组学中意义最为重大的突破是凝胶分离后蛋白的质谱检测的出现,这极大地扩大了纯粹的蛋白显示分析。质谱已经从本质上取代了经典的埃德曼降解技术甚至是在传统的蛋白质化学中,因为它更为灵敏,能处理蛋白质混合物并提供更高的生产量。该法通过利用特异序列水解酶如胰蛋白酶,来水解凝胶分离后的蛋白成肽段。之所以分析肽段而不是蛋白,是因为凝胶分离后的蛋白难以被洗脱和被质谱分析,并且蛋白的分子量通常不能满足数据库鉴定的需要。相反,肽段容易从凝胶上洗脱下来,并且即使来自蛋白的一小批的肽段也能提供足够的用于鉴定的信息。如图1,展示了一个与源于血小板的生长因子(platelet-derived growth factor ,PDGF)信号有关的分子的分析。通过这个图可以阐明这些步骤典型地与一个蛋白的质谱分析有关。此外一个详细的描述质谱鉴定信号分子的方法和策略草案在参考14中能找到。
蛋白的质谱鉴定有两种主要方法。在最初由Henzel及其合作者提出的"肽段质谱图"(peptide-mass mapping)方法中,需要在质谱法中对肽段混合物进行预洗脱,这导致了致力于蛋白质"肽段质谱指纹"(peptide-mass fingerprint)的研究。这种质谱法是从一个相关的单一质谱法--介质辅助的激光解吸/离子化(matrix-assisted laser desorption/ionization ,MALDI)中得到的,该法导致一段混合肽段的发散飞行时间(框2和图1b)。MALDI鉴定程序的自动化有了发展,由此数以百计的蛋白斑点能被切离、酶法消化,所得到的质谱能自动地在数据库中收索16,17。随着数据库中更多完整长度的人类基因的描绘,MALDI法所鉴定的成功率将更进一步地提高。
在一个对快速和确定的蛋白鉴别二步法中,MALDI的指纹识别是第一步18。蛋白识别的第二种方法依靠肽段混合物中的单个肽段的碎裂片断来得到序列信息。在这个方法中,肽段直接从液相中被"电喷雾离子化"(electrospray ionization)所电离。肽段离子被喷进一个"串联质谱仪"(tandem mass spectrometer)中。该质谱仪能分解混合物中的肽段,每次隔离一类片断然后分裂成以氨基或羧基结尾的片断(图1c)。串联质谱法在技术较MALDI指纹识别法更为复杂且不可升级。它主要的优点是对于一个蛋白的鉴别,由几个肽段得到的序列信息要比一列肽段集合得到的序列信息更为特异。碎裂片断的数据不仅能用于搜索蛋白质序列数据库还能用于核苷数据库例如表达序列标记(expressed sequence tag ,EST)数据库,甚至最近有用于天然的基因组序列数据库 (B. Küster, P. Mortensen, J. S. Andersen 及 M. Mann,该数据尚未出版)。
质谱法的新发展
生物质谱法仍在迅速的发展,这要归功于在各个领域内持续的技术发展。例如,一种MALDI离子源和高效串联质谱仪联用的新型质谱仪最近已经开发出来,它能打碎独特的肽段19。假如这个MALDI使飞行时间增加3倍的装置被证明是足够灵敏的话,那么它将使高产量的肽段绘图法和特异性的肽段测序法联用起来,从而用一步法代替原来的二步法质谱分析策略。以我们的经验,这套装置已经有效地增强了小蛋白的分析能力提高了分析简单蛋白混合物时的产量。在利用微型人造芯片使蛋白质小型化的准备中,成就也是有的,在此已经得到了有前途的结果20-22。然而,这些方法仍没有产生出利用标准试管或微量滴定板形式预备的灵敏度或稳定度。用MALDI质谱法直接扫描单向或双向凝胶仍然需要长时间的精力。最近一个变化是在电泳转移到一个收集膜时利用一个插入的隔膜,隔膜包括固定不动的用于降解蛋白质的胰蛋白酶。然后这个膜通过MALDI产生出的一个针对每个凝胶定位的肽段图来光栅化而被分析。
在未来,值得直接通过质谱法来分析一个蛋白样本,而不用凝胶分离或酶解。Smith等把天然的蛋白提取物装进一个毛细管然后利用蛋白质的等电点通过毛细管电泳来分离蛋白27。被分离的蛋白然后直接被注入到一个专门的傅立叶变换离子回旋共振(FTICR)质谱仪中(图2),然后数以百计的精确的蛋白质分子量在一个单一跑动即可得到。在这个实验中,集中的发布趋向于小蛋白,而且仅是大多数的而不是同一的蛋白能被确定。但是在未来也许有可能用这种策略通过在线的蛋白碎裂片断来鉴定蛋白28-29。这将使研究者们在一个单一的自动化实验内可以完成整个蛋白质组的分析,这种方法至少对于中等丰度的可溶性蛋白这个子集来说是可以的。
翻译后修饰
蛋白质组学研究的一个独特性是分析蛋白翻译后修饰的功能。磷酸化、糖基化和硫酸化还有许多其它的修饰对蛋白的功能是极为重要的,因为它们能决定蛋白的活性、稳定性、定位和循环。这些修饰显然通常不是来自基因组序列或者mRNA表达的数据。然而质谱法是精选的蛋白质组学方法来确定蛋白质的修饰,这项工作比纯粹的蛋白特性的确定要困难的多。最小限度的数据--经常少至一两个肽段需要被成片断化,已经足够鉴别序列数据库里的蛋白质。然而,为了得到翻译后修饰的种类和位置,所有没有达到预期分子量的肽段需要进一步的分析。由于种种原因,较之蛋白质识别来说,更多的材料需要被用来研究翻译后修饰。在该领域中已经有了持续的进展,特别是在磷酸化事件中。磷酸化事件能用普通的策略研究,因为磷酸化的肽段要比未被修饰过的重80Da,从而能引起一个特殊的质谱片断(PO3-,质量79)。磷酸化的肽段能吸附到金属树脂上,能被特异的抗体识别而且磷酸基团能被磷酸酶去除掉30-34。例如:图1显示了依据基于金属树脂吸附的微净化和磷酸酶处理的磷酸化肽段的探测。
磷酸化作用和信号途径
个别受体介导的信号途径导致一大批的酶作用底物发生酪氨酸磷酸化作用。为了鉴别这些底物,没受刺激的和受生长因子刺激的细胞的溶菌液能被双向凝胶特殊处理而分解。所关心的蛋白能被32P标记物所探测到,或者可以用带仅能识别活性态分子的抗体的western-blotting来探测(例如特异的磷酸化的酪氨酸或磷酸化的丝氨酸抗体)。最近证明这些斑点然后能被质谱所鉴别35。然而有一个更好的替代方法:首先利用质谱鉴定,在免疫沉淀步骤用抗磷酸化酪氨酸的抗体来浓缩这些底物。在关于表皮生长因子(EGF)受体途径这样一个研究中,几个已知的和新的成分最近被报道了36。
差异展示蛋白质组学
双向凝胶法
直到现在,蛋白质组学与双向凝胶电泳法几乎是同义的。比较双向凝胶法在生物医学中的应用,其目的通常是识别那些在特异疾病中用于诊断标识物或治疗对象的高度规则或低度规则的蛋白质。在这些实验中要面临几个技术性的挑战。首先,疏水的和大的蛋白通常不通过凝胶的第二走向。其次,动态分布的流动使得几乎最为丰裕的蛋白质难以显现出。特别是在体内流体,象血浆和脑脊液,超过99%的蛋白完全是由血清蛋白和球蛋白组成的。再次,由于生物学的突变在这些样本中遗传下来了,所以很难定义与疾病状态下相对应的正常的蛋白表达模式。就这些应用中的几个而言,基于阵列的mRNA表达其氨基酸组成的方法不仅能更为广泛(因为他们提供了用于芯片的所有基因上的数据),而起更快、更方便。这已被许多研究所揭示(参见该期由Lockhart 和 Winzeler写的综述,827-836页,以及参考文献37-40)。
尽管有这些比较双向凝胶法模式存在的困难,一些应用仍然再一些著作中出现了。例如,Celis和她的合作者们已经发现了一个公认的尿标记物--牛皮癣素--能被用来追踪调查患有膀胱鳞状细胞癌的病人41。当用来自正常组织分泌的蛋白和来自癌组织的蛋白进行比较的时候,这个标记物就能被识别到。一个类似的研究比较了利用免疫纯化的细胞群得到的正常人类腔状和肌上皮的乳腺细胞的蛋白质组。该研究探测了170个蛋白点阵(是双重差异表达的结果),其中51个是确定的。然而几乎所有的这些蛋白是大量的细胞骨架蛋白,如肌动蛋白和角蛋白。最近一项研究比较了两种来自不同血统的小鼠中提取到的脑髓片断的蛋白质补体43,发现超过1,000个能遗传的突变蛋白的点阵。如此研究在其它位置也许有用,例如在野生型和基因敲除型小鼠的蛋白质组的比较中。毒理学研究经常用蛋白质组的分析来理解药物作用机制或确定药物作用的靶部位。当比较对肾毒性缺乏免疫力或者有抵抗力的肾脏样本时,Aicher和同事们发现钙黏蛋白(钙黏素-D,28K)水平下降与环孢霉素A引导的肾毒性有关44。
当双向凝胶法作为一种分离某种定性的蛋白亚类的方法和作为反对整个细胞比较制备法时,或者当免疫学的方法用来使某蛋白亚类显露出时,生物学上的有关问题就更容易解决了。如许多分泌蛋白能用双向凝胶法分析细胞系的上清液和肿瘤组织的移植物而被识别45。几个研究团体已经用来自患过敏症病人体内的抗体,探测到了来自引起过敏症的生物体内的双向凝胶蛋白46,47。用合理的预防和治疗策略的设计方法可以开发一个通过质谱法识别过敏源的方法。
我们预测蛋白表达分析在良好定义的区域内将最为有用,如(1)不含mRNA的样本的分析,如某些体内流体的分析;(2)蛋白发丰度和mRNA的丰度不相关的情况下;(3)涉及蛋白翻译后修饰(如糖基化或磷酸化)的关键变化而非蛋白丰度的变化的情况下;(4)全面描述最为丰裕的特殊来源的蛋白,其本身是重要的情况下;(5)双向凝胶允许相关地全面描述一个简单蛋白质组样本(如对于微生物的描述)的情况下。
蛋白质芯片
在蛋白质芯片方法中,许多"诱饵"蛋白如抗体,能以阵列的格式被固定在特殊处理的物体表面上(图4)。然后其表面用感兴趣的样本探测,而且只有那些能与相关抗体吸附的蛋白能继续吸附在芯片上48。这种方法本质上是已用于临床诊断的酶联免疫吸附试验(ELISA)的一个大型版。在某个版本中,用来自两种不同期细胞的荧光标记的蛋白探测蛋白质芯片。细胞裂解液用不同荧光标记然后混合,其显色效果显示了附着在抗体上的蛋白质的丰度发生变化的信息。这个系统取决于相当特异的且特征性很好的抗体,而且许多技术问题仍需克服。然而,一旦该系统完善,它将提供便利的蛋白质组分析。在其它蛋白修饰中,随着粘合物的发现,肽段、蛋白质片断或蛋白质也许也能固定到芯片和样本(如抗生素库或病人血清)上来应用于芯片技术。一种用蛋白质芯片的方法结把以上的技术与一个直接的具有吸附材料的MALDI读出器结合起来。
通过质谱法定量
除了以上的方法,差异展示蛋白质组学也能通过质谱定量法用有限的或不用蛋白片断来完成。因为质谱图中的一个肽峰的强度是无法预测的,所有定量要通过稳定同位素标记的两个状态之一来完成。这种方法已被用于传统的小分子的质谱测定法中,但是最近才被用到蛋白质组学上。细菌的生长,例如在普通培养基中生长是一种状态,在仅含N15而不含N14的培养基中又是一种状态。来自两种状态的的蛋白制备物然后被混合、分离和用质谱分析。任何肽段的两种翻译现在能被探测到。 其中一个在质谱中通过氮原子的数量而显得较强而且峰高的比值精确地量化了相应蛋白的相对数量。作为另外一种可选方法,Aebersold和他的同事们在质谱法定量样本前,引进一个非放射性同位素标记物标记了细胞裂解后的半胱氨酸51。这种策略使得那些没经过凝胶电泳的极为天然的蛋白混合物中最为丰裕的肽段能被定量。
蛋白和蛋白间的作用
除了蛋白质被表达的时间、位置以外,一个关于蛋白质的关键问题是它和其它哪些蛋白质相互作用。相互作用的伴侣是可以立即直接引起生物学功能而且有可能因其治疗目的而被开发。细胞的蛋白质-蛋白质相互作用图的产生对理解细胞的生物学内容有着巨大的价值。
蛋白质复合物的纯化
蛋白质组学能对蛋白质-蛋白质的相互作用的研究做出关键性的贡献52-55。一个研究蛋白质-蛋白质相互作用的诱人的方法是通过基于亲和力的方法纯化这个完整的多蛋白复合体。这可以通过多种方法达到,比如:用谷胱甘肽S-转移酶(GST)-融合蛋白、抗体、肽、DNA、RNA或是用一个特异吸附到细胞靶部位的小分子。与新蛋白质相互作用的伴侣的普通识别方法之一是用抗原决定簇标记它。然后这个蛋白质和与其相互作用的伴侣一起能在细胞里被过渡表达。而且这个蛋白质能通过一个抗抗原决定簇的抗体发生免疫沉淀反应。这只需要这个基因的足够长的互补DNA克隆,而且不用花时间用来产生一个针对感兴趣的基因的沉淀抗体。因为足够长的cDNAs也许不久就可用于多数人类基因56,所以大规模的相互作用的研究将有可能进行。制作融合蛋白如GST-融合法,是另一个获得相互作用伴侣的一般方法(图5)。这个多蛋白复合物和"诱饵"联合,这个诱饵被固定在一个载体上。洗掉那些非特异性作用的蛋白后,这个蛋白质复合物被洗提、被凝胶电泳分离,然后用质谱分析。因此在一个单一的试验里,整个多蛋白复合物的成分能被鉴定出。例如,人的接合体作为结合复合物?quot;诱饵",已通过用生物素化作用的RNA纯化到57。它的蛋白质成分然后被用双向凝胶电泳展示出来(图6a)。从单一的双向凝胶中有19个新因子被得到了(大多数在EST数据库中)。他们中的一些被克隆和进一步分析了。用新蛋白和复合物内的其它成分的免疫荧光检验法得到的共同定位,被用于固定那些是复合物真正的成分(图6b)。一些从这个研究中鉴别出的新因子被克隆和用GST-融合蛋白法生成了。用图5里所示的策略,这些蛋白质中的一个被命名为S14的蛋白,沉淀了一系列接合体蛋白(图6c),这结合其它实验及序列的生物信息学分析,显示这个蛋白的一项功能。现在用以上略述的策略已经定性了许多蛋白复合物。其中一些复合物含有酵母Arp2/3复合物58,该复合物是在酵母的核-孔复合体中发现的和能结合分子伴侣GroEL的蛋白复合物60。
这些研究洞穿了作用机制并且启动了一系列新的调查研究。因为没有关于复合物的假设,细胞作用之间不可置疑的因果关系例行公事地出现了。例如:一个在小鼠大脑的抑制蛋白-Ⅰ和抑制蛋白-Ⅱ结合蛋白的研究导致了两套蛋白的发现,一个是由控制调节肌动蛋白细胞骨架的信号分子组成,另一个与细胞的内吞作用密切相关。这个显示了信号转换途径和包括抑制蛋白的微丝组装间存在联结61。
一旦多蛋白联合体的成分被质谱分析所确定,他们的功能就会被有关的化验研究。在这个发展阶段,蛋白质组学作为一个重复方式被用来定义与复合物中新蛋白质直接相互作用的伴侣,并且/或者在细胞里和其它的复合物相连接62。
以上提到的策略的成功依赖于蛋白复合物与诱饵充分的亲和力,以及为了纯化步骤而需要的最优化的条件。例如:双标记策略的应用提高了复合物的回收和减少了非特异性蛋白的结合63。低亲和力的相互作用的蛋白在亲和纯化前能潜在的被化学交联的蛋白质复合物所捕获,因为它依赖于空间的接近而不是亲和力。交联也能通过确定最接近的蛋白来帮助阐明蛋白质复合物的拓扑结构64。
特殊的细胞器官的成分也开始被分析了。酵母的高尔基体已被编目,而且为了确定参与光和作用复合物处理,靶向,插入和组装的蛋白质,豌豆的叶绿体的成分也被类似地研究了65,66。通过分析从完整的样品溶液中消化获得的天然的肽混合物,染色质间的颗粒已经被检验分析了67。
酵母双杂交系统
酵母双杂交系统是作为一个研究蛋白质-蛋白质相互作用的强大的工具出现的68。他是一个基于转录因子模块结构的遗传学方法,这个因子在DNA结合区与引起一套基因的转录增强的活化区紧密结合的部位。当蛋白质是被酵母细胞核里相互作用的两个ORFs所编码时,酵母双杂交系统是用融合到GAL4 的DNA的结合区(DNA binding domain,DNA-BD)或转录激活区(DNA activation domain,DNA-AD)的ORFs来增强一个通讯基因转录的结果。它的一个主要结果是一旦一个阳性的相互作用被发现,仅仅通过测序相关的克隆就能确定ORF。因为这些原因,它是一种普通的方法,它简单而且很适于作为高通量的蛋白质与蛋白质相互作用的筛选法。
在大的规模上,这个策略以两种形式使用。在阵列法里,包含了作为DNA融合物或激活区的ORFs的酵母菌株,被排列在一个格子上;然后要被检验的ORFs(作为互补的融合物)在整个格子里被筛选以确定能相互作用的菌株(图4)。在库筛选法里,一套ORFs首先总体合并产生一个库,然后互补的ORF融合物和这个库一个接一个地或几个同时发生配对(图7c)。
在基因组层面上的这种分析已经在酿酒酵母(Saccharomyces cerevisiae) 中被报道过了,而且在canorhabditis elegans中到了更限制的程度。在酵母中,阵列法被应用在192个ORF,库筛选法完成了对87%的酵母基因组的测定。结合起来,这个实验产生了957个假定的相互作用70。另一组分析了酵母中10%详尽的库筛选的结果,产生了183个假定的相互作用71。在这两个大规模的研究中发现的相互作用的大多数是新的。这些相互作用中的一些凭借早先的遗传学或是生化学的研究看似乎是合理的,然而大多数其它的关联不能很容易地确定。因此,这个研究仅仅提供了可能的相互作用,这些可能的相互作用必须被进一步的生物学实验确定或是排除。这些方法主要的优点是他们可以高产量而且是自动化的样式完成。一个最近所描述的酵母双杂交方法的改良,术语叫"逆转"双杂交,可用来鉴定能使蛋白质与蛋白质相互作用中断的复合物和肽段72。这个可以指导在体内具有活性的药物的开发,与这相反传统的药物筛选是在体外进行的。
噬菌体展示技术
噬菌体展示技术是一种用噬菌体表达肽或是表达融合到衣壳/外壳蛋白上的所感兴趣的蛋白质的技术。它可以被用来筛选肽的抗原决定簇,肽的配合基,酶作用底物或是单链抗体片断。尽管组合肽库逐渐被应用在大多数的以噬菌体展示为基础的研究中,但是假如这个cDNA库的产物被展示在噬菌体颗粒上,那么更多信息丰富的大规模的蛋白质相互作用的研究就可以进行了。任何一个"诱饵"蛋白可以被固定而捕获显示相互作用蛋白的噬菌体颗粒。这个方法在简单性和高产量方面,与酵母双杂交系统有些相似。依赖所研究的特殊类型的蛋白质(例如细胞质对细胞表面蛋白),这个方法可能优于或是不如双杂交系统,因为其相互作用发生在溶液中而非酵母细胞核里。此外,这个方法原则上适用于不能用酵母双杂交系统处理的转录因子。为了在噬菌体上展示cDNA库来分离在EGF-受体信号途径上的信号分子,同时也为了确定和特定抗体反应的抗原,方法最近被完善了73,74。
结论
为了直接在蛋白质水平上进行大规模基因功能的研究,蛋白质组学提供了一套强大的工具。尤其是,凝胶分离后的蛋白质的质谱研究正在导致一场用生化方法研究蛋白质功能的复兴。蛋白质的特性描述将继续在产量、敏感性、和完整性上提高改善。翻译后修饰当前不能在高产量下研究,但是某些种类如磷酸化开始能用一般方法处理了。我们预测蛋白质组学将不再是用双向凝胶电泳监测蛋白质表达。基于质谱分析的方法的重要性将继续增强,该方法采用以单向凝胶电泳指导的亲和层析。在不久的以后,蛋白质组学将提供出大量的蛋白质与蛋白质相互作用的数据,这可能是它在生物科学上最重要和最直接的影响。因为蛋白质比基因更接近功能,这些研究常常直接导致生物学的发现或假说。作为全部克隆的许多人类基因的现成可用性,其本身是基因组计划的极为重要的扩展,这将使几个蛋白质组策略变为可能。用纯化蛋白质的方法作为确定蛋白质功能的化验将对成千的蛋白质自动地以小型化格子的形式平行地执行。最后,基因组学的进展将直接促进大规模的用遗传学作为表达方法的蛋白质化验,就像双杂交筛选一样。