蛋白质是基因表达的最终产物,也是基因功能的执行者,蛋白质间的相互作用、相互协调是细胞进行一切代谢活动的基础。蛋白质在翻译合成后,需经过复杂的修饰加工,一个基因对应的可能不是一种蛋白质而是几种甚至是数十种,因此蛋白质组的研究可能远远要比基因序列的测定繁杂的多。蛋白质组学“proteomics”一词是由“protein”和“genomics”派生出来的,医学蛋白质组的研究的目标就是明确阐述基因的功能,发现疾病的诊断和预防标志,以及药物筛选和疾病治疗的靶标,在分子水平解读生命的奥秘。
蛋白质的功能研究
蛋白质组学研究的对象大多是未知的,在基因组数据中,有40%以上的开放阅读框序列编码的蛋白质没有功能或者功能解释不全甚至是错误的。蛋白质的功能可以有很多方法定义,取决于实验方法和所要解决的问题。“化学功能”主要是指化学反应中所起到的酶的催化作用,“生物化学功能”是指特殊作用底物下生成的产物及其两者之间相互转化机制。“细胞功能”是指蛋白在细胞内信号传导通路中发挥的作用。蛋白质行使的功能具有多层次,要真正全面理解蛋白质功能,必须掌握蛋白质之间相互作用的级联和网络。
大部分蛋白的功能不是确定不变的,通过改变翻译后的加工修饰,可以赋予蛋白质以全新的功能。例如,酶的激活、磷酸化和糖苷化、乙酰化和泛素化、氧化还原状态等等。这些修饰可以直接或间接的改变蛋白的生物化学功能及细胞功能,有些时候,仅仅改变蛋白质在细胞内的定位或者和其他蛋白及小分子物质结合就可以改变蛋白的生化角色。蛋白质组学的研究如果不考虑到这一点是不可能真正全面的理解蛋白质功能的。单只是筛查出全部蛋白质并进行分类和定量还远不是蛋白质组学研究的目标。人体大约含有300,000种蛋白质,每种蛋白都要经过翻译、成熟、调节、降解等各个过程,每个过程中都包含有无数其他蛋白相互作用。除了蛋白与蛋白之间的相互作用,各种配体如:金属离子、激动剂、抑制剂等也都能改变蛋白的天然特性。蛋白质自身构象的改变还可以导致疾病的发生,Prion病就是蛋白构象改变,发生错误折叠导致疾病的一个例子。即便弄清楚一个基因所编码的蛋白的结构和功能状态也不是一件很简单的事,由此可见,蛋白质组学的研究要比基因组复杂的多。
目前已经建立起蛋白序列数据库、蛋白结构数据库、蛋白表达分析数据库。生物实验技术的发展为蛋白质的研究带来了便利。蛋白在细胞内的定位可以用绿色荧光蛋白测定,而蛋白与蛋白之间的作用可以用亲和色谱法、免疫沉淀、酵母双杂交系统。其中细胞内蛋白的定位相对较准,而蛋白与蛋白之间的相互作用的数据则不够准确。显然,还急需要更加可以信赖的技术方法用于蛋白组学的研究。目前常用的分离鉴定和分析蛋白的方法是双向电泳和液相色谱串联质谱,具有较高的特异性和敏感性。此外,应用蛋白芯片还可以高通量的筛选出疾病相关的蛋白质。
临床应用
医学蛋白质组学的研究要领先于其他领域,将蛋白质组学研究尽快应用于临床和公共卫生是其近期所要达到目标。目前,临床蛋白质组学的研究旨在找到更多具有医学实际意义的蛋白标志物,用以帮助疾病的诊断、分期、危险性预测、以及药物作用靶点。研究蛋白之间相互作用、蛋白剪切体、蛋白表达丰度,可以有效地识别病变与正常组织。
1.疾病早期诊断
靠检测某种蛋白标志物来诊断疾病显然是不可靠的。例如,前列腺血清抗原(PSA)常常用于筛查前列腺癌,但是PSA水平在良性前列腺疾病的患者中也同样升高。利用先进的蛋白质组学技术,可以同时分析检测上千种与疾病早期诊断相关的低分子量蛋白。肿瘤是疾病蛋白组学研究的焦点,先进的蛋白质组学技术可以帮助对肿瘤做出早期诊断,这点在卵巢癌中显得尤为重要。大部分卵巢癌患者,肿瘤在最初被发现时已处于进展期,该病5年生存率只有35%,而如果早期发现治疗,5年生存率可达90%,因此早期诊断至关重要。利用蛋白质组学研究,可以识别患者不同于正常人的血清蛋白谱,诊断阳性率可达94%。一些腹部肿瘤,很难辨别其组织来源,如卵巢癌和结肠癌,而两者的治疗是完全不同的。利用基因组和蛋白组工具,研究者只需检测到两种肿瘤各自的蛋白标志,即存在于结肠癌villin蛋白和卵巢癌的moesin蛋白,就可以明确肿瘤的原发部位。同样蛋白组学也适用于感染性疾病。全世界数以百万计的结核患者中,抗药分枝杆菌的感染问题日益严重,血清蛋白筛查实验可以对临床上潜伏期的感染做出早期诊断,以便早期治疗减少疾病的传播。在SARS患者血清中发现一种高滴度的截短型α1抗胰蛋白酶,这种蛋白很可能作为诊断标志蛋白,并成为治疗以及疫苗研制的靶标。
2.预后
免疫排斥是心脏移植手术后重要的问题,准确地诊断要靠心肌活组织检查,新近一项移植心肌蛋白质组的研究显示,当发生排斥反应时,大约有100个蛋白表达丰度上调,包括心肌休克蛋白,血清中αB-crystallin和原肌球蛋白表达也显著增高。因此血清蛋白组研究可能是为排斥反应提供一种非侵入性诊断方法。多型性神经胶母细胞瘤患者脑组织内多药耐药相关蛋白和cystatin B表达丰度远远高于正常脑组织,对疾病诊断、治疗指导和预后估计都有重要意义。
治疗
肿瘤对化疗药物的抵抗是多方面的,揭示这种抵抗作用的起因有助于提高现有治疗策略的疗效和开发新的治疗方案。在对儿童急性淋巴细胞性白血病细胞的蛋白组学研究中发现,药物抵抗和药物敏感细胞的蛋白表达谱有所不同,从中筛选出10多种与长春新碱耐药相关蛋白,包括:细胞骨架蛋白(β-tubulin,α-tubulin 和actin)、骨架调节或结合蛋白(热休克蛋白90β)等。这些蛋白中有些是首次被发现与药物抵抗相关的,有望成为新研发的抗肿瘤药物作用的靶点。抗有丝分裂剂埃坡霉素是一种新型抗肿瘤药物,但一些白血病细胞已经对其产生了耐药性,通过蛋白组学的研究发现耐药性的产生是因为该药作用的靶蛋白微管蛋白发生了突变,进一步研究发现埃坡霉素和泰素耐药的肿瘤细胞却对长春新碱表现出异常的敏感,因此,临床上依据实验室的研究结果可以选择更加有效的用药策略。
同样,对于感染性疾病的治疗,耐药也是临床上很难处理的问题之一,而且大多数耐药发生的机制不明。目前,许多病原微生物的基因和蛋白组数据库的建立,使了解其耐药产生机制和找到新的药物作用靶点成为可能。例如,白色念珠菌产生氟康唑耐药是与蛋白Erg10p相关,Erg10p是一种参与麦角固醇生物合成的蛋白,可以作为新药物研发的目标。氯喹曾经是治疗疟疾最为成功的药物,但目前在世界大范围内出现了氯喹耐药。利用蛋白组学技术不但可以找到疟原虫其他药物作用的靶点,还可以弄清宿主与病原体、蛋白与药物之间的相互作用等。蛋白组学在不远的将来将对药物的研发产生重要的影响,比较正常和疾病组织蛋白差异表达谱可以发现药物潜在作用靶标,使药物对疾病的治疗更加有针对性。
挑战
目前蛋白组学研究还存在很多技术上的困难。首先,用于蛋白质研究的组织标本或者体液是混合性的。通常一个基因平均可以表达三种蛋白产物,这些蛋白产物再经过翻译后修饰加工,使蛋白的功能在不同组织均有差异,使研究异常复杂。此外,低丰度表达蛋白常常被丰度高的蛋白遮盖而被漏掉。蛋白质分离纯化和浓缩技术的改进以及分析仪器的敏感性的提高,可以帮助克服这些困难。生物化学、基因组和蛋白组的大量数据的整合分析是当今医学发展所要面临的更大的挑战。人类蛋白组学的研究正在飞速发展,终将为人类揭示每个蛋白在疾病发生发展中起到的作用以及蛋白之间相互作用网络。2001年国际蛋白质组织成立,大大推动了蛋白组学技术研究的进展和世界范围的协作。科学的发展可以为临床提供高通量高效率的样本分析,为医生提供科学的早期检测、诊断、预后评估以及有效的治疗策略,最终使患者受益。