Michael J Dutt and Kelvin H Lee
School of Chemical Engineering, Cornell University, Ithaca, NY 14853-5201, USA
Correspondence: Kelvin H Lee; e-mail: khlee@cheme.cornell.edu
Current Opinion in Biotechnology 2000, 11:176?79
摘要
蛋白质组研究领域随着基因组序列逐渐完成和不断注解正变得越来越重要。近来基因组学的进展包括:表明需要用蛋白质分析补充微阵列分析(microarray) 的实验和数学的证据、分离蛋白质的质谱分析的敏感性增强、出现更好的凝胶分析和蛋白质点注解的信息学工具、迈出了实验步骤自动化的第一步和出现新的检测蛋白质改变的定量技术。
缩写
2DE two-dimensional protein electrophoresis双向蛋白质电泳
ESI electrospray ionization电喷雾离子化
IPG immobilized pH gradient固定pH梯度
MALDI matrix-assisted laser desorption ionization基质辅助的激光解吸电离
MS mass spectrometry质谱
PTM post-translational modification翻译后修饰
SDS-PAGE sodium dodecyl sulfate polyacrylamide gel Electrophoresis十二烷基硫酸钠-聚丙烯酰胺凝胶电泳 引言
生物系统的核酸为基础的分析(比如:DNA序列信息或mRNA表达微阵列) 开始能够提供个体基因以及多个基因之间协调调节本质的数据资料。然而,实验证据明确地表明mRNA和它们相应的蛋白质的相对表达水平存在差异[1,2]。另外,通过数学方法证明需要mRNA和蛋白质两者的表达信息来理解一个基因网络 [3]。理解总蛋白质表达的需求和需要都推动了"蛋白质组学"领域。蛋白质为基础的分析的重要性是研究转录后调控以及翻译后蛋白质的修饰(PTMs)。但蛋白质组分析近来不是完全绝对依赖通过二维蛋白质电泳(2DE)分离进行微化学的肽定性的,能够监测合成速率、表达水平和蛋白质的PTM。蛋白质组分析的领域也主要为技术的发展所驱动。和基因组信息或从微阵列分析获得的数据一样,蛋白质组资料需要一个信息学的框架结构来组织。另外一个信息学挑战是建立关于基因和基因网络的蛋白质水平和核酸水平信息的有效关联。
由于此综述的版面限制,我们将只集中讨论蛋白质组领域的技术发展。我们尤其将讨论建立在蛋白质电泳分离和随后的微化学鉴定溶解的多肽基础上的蛋白质组学,并讨论近来的技术进展。在过去的12-24个月里,蛋白质组学的分枝领域享受到近来的技术发展,其中的一些将在此文中重点讨论,并将其放在早期的工作环境下。我们也引用一些生物技术团体应用此技术的关键性的范例.
技术
尽管"蛋白质组学"这个在1996年最早形成[4],监控基因组-广泛蛋白质表达的主要实验工具-2DE自1975年就已经有了[5]。2DE首先使用等电聚焦通过电荷分离蛋白质,然后通过十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)通过分子大小分离。Fig1中显示了2DE成像的一个例子。
建立在2DE基础上的分析蛋白质混合物的一个关键性例子是同时在分析水平和微制备水平上进行分析,而没有实验方案、步骤或设备的显著改变。在初始实验中,微克级的蛋白质可以被研究鉴定表达或PTM以有趣的方式改变的蛋白质。在此水平上,可以从单一混合物中分辨到11,200个蛋白质(J Klose, 个人通讯)。随后,同一样本可以在毫克级纯化以进一步进行分析,如氨基酸分析、质谱、氨基末端或内部氨基酸测序和其它技术[6]。固定pH梯度(IPG)胶条的出现在此领域特别重要[7]。IPG胶条通过将pH梯度共价迁移到聚丙烯酰胺支持的基质上(几乎消除了pH偏移),增强了等电聚焦的可重复性,并增强了毫克量蛋白质混合物的分辨能力。另外一个IPG胶条的益处是能够将pH分离范围调到任何所需范围内的能力。
其它2DE的重要技术进展包括敏感的蛋白质染色方法的发展,诸如氨基银染色[8],其在钠克或低于钠克量能够检测到蛋白质,以及凝胶内样品上样到IPG梯度凝胶条的使用[9[。凝胶内样品上样,与在凝胶阳极或阴极端上样相比,允许应用更大体积和量的蛋白质,并减少观察到的与蛋白质沉淀相关的聚焦问题。
分析性2DE应用局限,因为所得的结果(通过电荷和分子大小分离蛋白质的表达模式)在蛋白质的实际身份和起源基因或基因之间不能建立联系。确实,不能够完全定性兴趣蛋白的改变可能是为什么原先的技术不能够普及的原因。向此技术的一些简单的延伸,如Western blotting和凝集素亲和层析[10,11],只提供蛋白质信息的缓慢的增长,这些技术通常用来确定所怀疑的蛋白质身份。 Aebersold等[12]的工作是创新性的,他们证实氨基末端和蛋白质内部的序列信息可以从印迹到膜上的2DE分离的蛋白质获得。直接氨基酸测序提供了蛋白质组学和基因组学信息之间的重要连接,为未定性的蛋白质提供了遗传基础;然而,设备和试剂费用以及直接测序有限的敏感度一直限制了发展。最近,多肽(从2DE凝胶或印迹获得的消化后的蛋白质)通过质谱(MS)来定性[13]。两个蛋白质的常见离子化技术是电喷射电离(ESI)(或更小颗粒的纳米喷射)和基质辅助的激光解吸电离(MALDI)。这些技术与不同的质谱分析仪配合,它们都有各自的优缺点。总的来说,MALDI-飞行时间MS对于分析高分子量的蛋白质更为有效,而ESI离子捕获MS提供更好的检测敏感性,可以达到飞摩尔(10-15摩尔)水平。跟详细的ESI和MALDI技术的综述参见一篇技术方面的综述[14]。凝胶分离蛋白质和多肽的MS分析的一个关键特点是能够产生关于一个特殊的兴趣肽的结构信息。比如,质谱仪能够直接提供一个肽的质量的信息,并又能够被用来从用源后衰变或碰撞诱导的解离获得的串联质谱生成从头氨基酸序列信息[15,16]。另外,质谱仪可以通过检测肽段的质量偏移提供糖基化模式、磷酸化或其它PTM的资料。这种灵活性以及研究其它非蛋白质小分子的能力促成了目前对质谱的兴趣。下面我们将讨论具体应用于蛋白质组学研究的MS技术的进展。
近来串联MS已经被用来识别大分子复合物中的蛋白质[17]。该步骤利用双向层析分离、肽裂解和随后的氨基酸序列和基因组序列的比较。这是一个快速蛋白质鉴定的方法,它依赖于整个基因组序列准确性和预计的能力。另外,另外一种串联质谱力图取代对SDS-PAGE的需求[18]。此方法提供了亚皮摩尔的敏感度(0.3-3pmol),质量测量的准确性达到+/-0.05%而且减少了样本处理的损失;但是在蛋白质定量上能力有限。
信息学
蛋白质组学分析在许多水平上需要信息学工具。首先,需要发展蛋白质表达分布图的在线数据库。这样的数据库应该与核酸序列和表达序列标签的数据库无缝链接和整合。一个优秀的可进入的因特网蛋白质组数据库资源是Expert Protein Anlysis System(ExPASy),现在可以在http://www.expasy.ch/[19]在线获得。另外,需要发展能够接受多个蛋白质表达分布图并自动识别兴趣蛋白量变的软件包。一些模式识别软件可以从许多商家商业购买,其中的一个例子是Melanie 3(瑞士生物信息学研究所,Swiss Institute for Bioinformatics)[20]。Melanie 3的主要特点包括能够对数据进行多变量统计学分析,与在线数据库进行比对,并与MS谱交互界面作用。
目前急切需要发展其它软件工具,能够将从不同实验获得的未识别的肽的生物化学数据(比如等电点、分子量和串联质谱)和蛋白质序列、核酸序列和表达序列标签数据库的搜寻结合起来,进行最可能的遗传基础识别。
一套蛋白质组学工具现在可以在ExPASy网点获得[19]。瑞士生物信息研究所持有该数据库,近来公布了蛋白质序列数据库的一个优秀的概要[23]。
应用
差异蛋白质组分析比较一个细胞、组织或生物体的任意一个参考状态的2DE分离的蛋白质分布图和一个非标准状态,如疾病状态或者在系统中加入毒素后,的分布图。两个蛋白质组之间的差异表明系统在扰乱后的反应机制。差异蛋白质组学分析应用到有兴趣的问题上的种类不断增多。比如肾脏暴露于铅后,皮质中76种和髓质中13种蛋白质的量发生了改变[24]。这项工作突出了蛋白质组学在鉴定毒理学研究的标记物中的应用。细胞膜表面受体在血小板衍生的生长因子刺激下的磷酸化状态[25]和温度对中国仓鼠卵巢(CHO)细胞生成能力[26]的影响是应用蛋白质组分析突出在对环境刺激作用下对蛋白质PTM作用的两个例子。低温CHO细胞实验是特别值得注意的,因为它提供了哺乳类细胞对冷刺激反应,包括PTM改变,尤其是两个蛋白质的酪氨酸残基的磷酸化。差异蛋白质组分析也能够帮助识别转录后/翻译前水平的调控。通过测量翻译控制的肿瘤蛋白质和其mRNA丰度的水平,已经表明在Cos-7细胞中钙的水平在转录水平和转录后步骤调节蛋白质表达[27]。建立在一个关键调节子和其蛋白质基础上的蛋白质组分析已经提供鼠伤寒沙门氏菌发病机制的线索[28]。鼠伤寒沙门氏菌在早期和晚期的指数生长期的差异研究已经识别了一系列与生长调控相关的蛋白质[29]。
未来前景
我们在蛋白质组学的目的是蛋白质的快速的和定量的特征描述。使用质谱和同位素标记的新进展很有前景。15N的同位素代谢标记能够帮助从纯化的蛋白质亚群中识别和定量蛋白质,包括它们的修饰[30]。此技术对不同的质谱分析仪和离子化技术都是适用的。但是此技术对于测量低丰度蛋白质有困难,这是因为样品的上样对分析性2DE的限制。近来发展了另外一个没有这种限制的方法[31]。此新方法不局限于与代谢标记相容的细胞,使得它广泛应用于几乎任何细胞或者组织类型。在一个还原蛋白质样品侧链半胱氨酸残基从一个化学试剂的同位素轻(细胞状态1)或重(细胞状态2)型衍生出来。细胞聚集、酶解、用亲和层析分离并最后用串联质谱分离。LCQTM离子捕获质谱(Finnigan MAT, San Jose, CA)以双模式操作同时允许不同细胞状态下肽的定量和序列识别,这是由于它们使用了不同的标签。此方法与在DNA芯片上结合分析两个不同状态细胞的mRNA样品类似。这个新的蛋白质方法提供了定量比较细胞和组织的蛋白质的一个广泛适用的方法。仍然,在研究低丰度的蛋白质有一个重大的局限性,因为缺少一个类似核酸的聚合酶链反应的扩增策略。
一个特别激动人心的进展是Denis Hochsstrasser和同事研制的分子扫描仪(Molecular Scanner)[32]。此新技术利用2DE凝胶,并结合蛋白酶消化和电印迹到膜上为单一步骤,随后生成电印迹"凝胶"的单个区域的MS指纹图(用MALDI-MS)。此方法理论上可以在一个凝胶上完全定性所有蛋白质。蛋白质组学中自动化的深入讨论,读者可以参见澳大利亚蛋白质组学分析机构和瑞士联邦技术研究所的文章[34]。
结论
在蛋白质水平基因表达信息在不同条件下的基因型-表现型相互关系之间提供了至关重要的资料。这样的资料在理解此非线性关系中很关键,并对代谢和细胞工程努力是需要的。在过去12-24个月中,在定性和定量蛋白质混合物中已经有一些重大进展,然而,还有很多需要做。从对mRNA和蛋白质表达的分布图平行分析的需要,以及目前对核酸分析新技术的瞩目来看,我们可以预计发展蛋白质组分析的新技术将变得越来越重要。