Dolores J. Cahill
Max-Planck-Institute of Molecular Genetics, Ihnestrasse 73, D-14195 Berlin, Germany
Proteomics: A Trends Guide 2000,July, 47-51
摘要
高密度DNA和蛋白质芯片是小的平面,它允许在一次实验中同步分析几千个分子指标。DNA芯片导致了更小的样本体积、更有效的分析和更高的输出。因为蛋白质与核酸相比更加复杂和多样,发展类似的蛋白质组学平台已经表明是困难的。此综述概括近期用于高密度蛋白质芯片制作和应用的技术,重点介绍它在蛋白质组学近期的进展和应用。
微阵列的生产是一个高度自动化的过程,它使用点样针(pin)为基础或液体微分配的操纵自动仪器在一个平面上排列生物样本。对于DNA芯片的制作,PCR技术已经成熟建立并在大规模基因组分析中起中心作用。阵列所用的表面随着应用的不同而变化,比如,如果需要分析大量样品与相同配体之间的相互作用,DNA排列到滤膜(比如硝酸纤维素膜、尼龙膜、聚偏二氟乙烯)上或者包被有不同试剂(比如多聚-L-赖氨酸或者聚丙烯酰胺)的玻片上。
芯片的制作
相似的技术已经被用来制作高密度蛋白质芯片和微阵列(Fig.1)。此方法牵涉到使用格栅自动仪器从微滴度平皿转移DNA或者相应表达的蛋白质到尼龙膜(Hybond N+, Amersham, DNA分析用)或者聚偏二氟乙烯膜上(Hybond-PVDF, Amersham, 蛋白质分析用)上的高密度格栅中。点样自动仪器在一个servo控制的3轴线性驱动系统上携带384个点样头,定位可以准确到5μm,产生的密度大约为300点/cm2。吸头的直径取决于点样的应用,但是可以在150μm到450μm之间变化。重组融合蛋白的原位表达以及表达的产物用抗含有His-tag表位的抗体检测。非特异性结合的抗体随之被洗掉,滤膜与合适的标记的二抗以及底物一起孵育。滤膜暴露于紫外线,用CCD(charge coupled)摄像机摄取图像。专门的图像分析软件随之被用来计数阳性克隆。分格有克隆或PCR产物的尼龙膜-DNA滤膜可以反复使用至少20次,而没有显著的信号强度丢失。相比之下,排列到聚偏二氟乙烯(PVDF)膜上的蛋白质常规只能使用一次。用来制作高密度蛋白质芯片的文库(单基因系列,Unigene set)现在可以得到[资源中心/原始数据库(PZPD),德国柏林].从液态表达培养物中获得的蛋白质纯化后,用转移印章转到平床点样自动仪器上,进行点样制作蛋白质微阵列。使用这个直径小于150μm的转移印章,4800个样品可以放到一个显微玻片上并可以使用最少量的试剂进行同步筛选。产生的信号是鲜明的、定位好并且可以检测250amol或者10pg的点样的测试蛋白质(GAPDH为例)。一个cDNA蛋白质表达克隆用转移印章技术可以进行可靠的检测,以错误阅读框表达蛋白质的假阳性克隆比率低(11%)。这个改进的排列蛋白质的技术导致了非常敏感的蛋白质表达和高通量筛选的抗体特异性。使用此方法,Unigene set中表达的基因可以在一个DNA和蛋白质水平同步进行研究,并提供重组基因和蛋白质资源制作DNA和蛋白质芯片的资源。
由于这样的文库存在重复,一个改进就是生成非重复、亦称为单克隆(Uniclone)、或单基因-单蛋白质系列(Unigene-Uniprotein set)基因-蛋白质只在阵列中出现一次,结果导致可以在一个显微玻片上进行阵列排列。它需要更小的体积(比如100μl)进行筛选(比如血清),而不是目前大PVDF膜所需的10ml。
目前进行的工作是用人胎脑cDNA文库(hEx1)亚表达系的寡聚核苷酸指纹图,群集具有相似序列的克隆,从每个群集中选择一个克隆,重新排列阵列生成非重复的单基因-单蛋白质系列。
Fig.1.蛋白质组学中微阵列的应用
蛋白质和DNA微阵列可以平行设置进行同步分析文库中的基因和其所表达的蛋白质。抗原/抗体芯片也可以从此基因文库中制作用于诊断。来自蛋白质芯片的重组蛋白[或者来自双向凝胶电泳(2DE)]可以用来制作最小蛋白质鉴别物(MPIs),它们可以用来鉴别2DE凝胶上的同源蛋白质。它们通过使用基质辅助的激光解吸飞行时间质谱(MALDI-TOF-MS)进行分析。蛋白质微阵列也被用于筛选分析(比如抗体、DNA、RNA、代谢物和药物),抗体芯片用于蛋白质组分布图,以及核磁共振(NMR)或X线用于大规模生成的重组蛋白质的结构分析。缩写:PCR,聚合酶链反应;IPTG,异丙基硫代-β-D-半乳糖苷。
直到目前,仍然没有能够用象DNA芯片那样的高密度和自动化的方法分析蛋白质。此问题在应用类似自动化技术到高通量、大规模的蛋白质分析制作cDNA表达文库、高密度蛋白质芯片和微阵列中变得突出。
蛋白质芯片的近期进展
新技术
在此领域有许多其它进展,近来已有综述。这样的进展包括在滤膜上制作低密度蛋白质阵列,诸如通用蛋白质阵列系统(UPA)。它建立在96孔微滴定板基础上。在此系统中,蛋白质微阵列被印到通过憎水Teflon罩所形成的含有96孔的光学平玻璃板上[10]。在每个孔中,使用连接到精确、高速、X-Y-Z自动仪器上的36毛细管为基础的印刷头点样144元素(4×36)的阵列。标准ELISA技术和扫描CCD检测器被用于阵列抗原的成像。
其它蛋白质微阵列的方法被报道使用硅的光刻印刷或者金单层,结合使用微球传感器的微孔或喷墨到聚苯乙烯膜上。这样的模式牵涉到通过定型单个蛋白质(比如BSA、亲和素和单克隆抗体)制作微型免疫分析模式。
抗体芯片
免疫传感芯片已经被研制,从而可以同步检测临床分析物。这里,捕获抗体和分析物被排列到有十字交叉样流室的显微玻片上。检测是通过荧光标记和CCD为基础的光学读数装置。这是以低密度模式(6×6模式)完成的,但是此步骤有高通量潜能,因为涉及到自动化成像分析和微流体力学,它已经成为酶活力和其它分析的一个未来模式(Caliper Technologies, Mountain View, CA, USA; Orchid Biocomputer, Princeton, NJ, USA)。
一个制作抗体阵列的进一步方法已经被描述,它使用微模水凝胶‘印章‘和一个氨基接受表面。此印章将蛋白质存放为亚单层,可以用125I标记或原子能显微镜显示,而抗体活性是保持的。
寡聚核苷酸芯片
一个凝胶光学或过硫酸盐诱导的共聚合技术已经被发展来制作聚丙乙烯凝胶垫上的寡聚核苷酸、DNA和蛋白质微芯片三维阵列(从10×1μm到100×100μm),其为一个憎水玻璃界面所分隔。三维聚丙乙烯凝胶提供了比二维玻璃支持物超过100倍固定的能力,因此显著地增强了测量的敏感性。
组织芯片
组织微阵列已经被研制进行肿瘤标本的高通量分子分布图,它使用自动穿孔柱(0.6mm宽,3-4mm高),采取1000个包埋在石蜡中的个体肿瘤活检组织,将它们排列到45×20mm石蜡块中(可以从Beecher Instruments, Silver Spring, MD, USA购得)。连续切片后,肿瘤标本进行免疫组化、荧光原位杂交(FISH)和RNA/RNA原位杂交的平行分析。此系统能够在不到2小时内显微扫描含有645个标本的免疫组化阵列玻片。它对于许多处于不同疾病阶段的不同患者的同步分析,快速建立新的候选标记基因中有应用。
芯片
捕获和分析特异性标记的蛋白质的配体包被的表面现在已经有了,包括SELDI蛋白质芯片(Ciphergen Biosystems, Palo Alto, CA, USA),XNA on Gold(INTERACTIVA, ulm, Germany)和多种Biacore芯片(Biacore, Uppsala, Sweden)。表面细胞质基因组共振,此项Biacore应用的新进展对芯片模式的相互作用的研究贡献很大。SELDI和BIA-MS技术将亲和捕获和高分辨率质谱分析与新的、有效定性蛋白质和相互作用的配手的手段结合了起来,并有诸如表位作图和受体-配体或蛋白质-药物相互作用研究的应用。
优点和应用
阵列技术相对传统分析仪器的主要优点是广泛的平行分析。因为这样的阵列或芯片比传统测试系统要小,它们因此在标本和试剂的使用上是高度经济的。在制作和应用DNA芯片上已经获得了重大的进展,比如它们应用于差异基因表达(转录分布图)、单核苷酸多态性(SNP)基因定型应用或者多态性分析。比如,Sequenom的MassArray(Sequenom Corp., San Diego, CA, USA)质谱为基础的高通量基因定型涉及到自动化的阵列设计,它测定不同基因型之间的质量差异。
蛋白质芯片同样促进个体克隆的DNA系列信息与蛋白质产物的之间联系,再回到整个基因组水平。这使得翻译的基因产物直接经得起高通量实验的检验,并建立起蛋白质表达和DNA系列数据之间的直接联系。这意味着,例如,差异表达的基因通过cDNA微阵列被识别后,同一克隆可以在不同细胞系统或者通过体外转录和/或翻译进行同步蛋白质表达分析。在相同的蛋白质微阵列上,表达克隆因为与其它蛋白质(比如抗体)和从核酸到小分子配体结合而被筛选出来。蛋白质阵列的可用性应该允许下列功能的进行:(1)蛋白质-蛋白质相互作用;(2)配体-药物相互作用;(3)酶-底物相互作用;(4)阵列上进行更高通量的分析。阳性的相互作用随之能够通过例如一个标记药物或配体的存在,通过将标签相互作用的蛋白质,通过使用一个特异的抗体或者使用质谱测定相互作用配手的存在而被检测出来。这个多能性应该使得蛋白质微阵列成为诊断用途、高通量配体-受体相互作用研究以及抗体特异性定性的多用途工具。
蛋白质芯片的一个进一步应用是体液中DNA、蛋白质、肽和抗体的图谱绘制,它被认为能够促进对健康和疾病的理解。比如,通过筛选血清、脑脊液和其它健康和疾病的体液可能识别与疾病相关的蛋白质。描绘和监测一个疾病的状态,诸如自身免疫性疾病,通过监测特殊治疗的效应或者抗体对疫苗的反应,能够产生诊断或预后抗原的信息。这样的筛选也能够产生新的靶标,它在生物技术和医学有广泛的用途。
大数量的重组蛋白质也能够被用来生成特异的抗这些高通量蛋白质比如噬菌体展示的抗体。这样的抗体本身也将成为有价值的资源,并也能够被用来制作抗体芯片。然而,这种高通量生成的特异性抗体目前是昂贵和需要大量人力的。能够获得大量的重组蛋白质也使得这些蛋白质大量表达,也就能够以高通量形式形成结晶并进行结构分析。这样的一个创意目前正在德国进行,称为蛋白质结构工厂的一个多集团计划。
蛋白质组-基因组链接
使用单蛋白质系统(Uniprotein Set)中蛋白质的蛋白质芯片在蛋白质组学中的应用已经被认为在目前基因组学和蛋白质组学方法之间架立了桥梁。基因组学方法,如前所述,是使用DNA芯片绘制一个细胞中mRNA库的图谱,其作为基因表达的第一层次直接反映了基因活动并被用来研究基因表达和发现新的疾病相关的基因。这通常是在高密度DNA芯片上进行的。蛋白质组学方法涉及使用质谱确定的肽谱、序列标签或者个体蛋白质裂解产物的片段-离子指纹图在序列数据库中识别个体蛋白质。这两个方法可以通过使用单克隆系列中的蛋白质进行链接。这涉及到具体描述质谱提供的最少系列的每个蛋白质信息,我们命名为"最少蛋白质识别物"(MinimalProtein Identifiers, MPIs)。MPIs含有准确的酶解产物的分子质量,连同片段-离子数据。它们可以从双向凝胶电泳(2DE)上切下来的点和诸如单蛋白质系列中的重组蛋白质生成并能够被用来识别2DE凝胶上的同源蛋白质,反过来也是一样。通过使用高通量的基质辅助的激光解吸电离飞行时间质谱(MALDI-TOF)在数据库中记录结果。一旦记录下来,可以认为MPIs将使我们能够快速识别已知和未知基因产物,以及在序列数据库中识别蛋白质。具备有这些特点后,MPIs使得我们能够牢靠地比较不同生物样本的2DE凝胶,而不必计较它们的形式、溶解度和所使用的分离技术。此方法导致了更加可靠的蛋白质识别,因为它是从2DE凝胶点所测的MPIs与从表达蛋白质所测的MPIs进行比较,而不是与从DNA序列预测的MPIs进行比较。获得的结果和识别的阳性结果可以被测序或者与从单基因微阵列获得的表达图谱结果进行比较,因此将2DE凝胶获的结果与任何被研究中的系统表达图谱进行了链接。
未来展望
这样一个蛋白质组学方法的缺点是它需要不仅应用已建立的技术诸如高性能的微阵列、大规模的表达和高分辨率的2DE,也需要新发展的自动化技术。这些包括自动化2DE、凝胶成像、点识别、蛋白质裂解后的点切除、样品纯化和质谱分析以及闭环数据获取和处理的软件。一个高通量MALDI-TOF-MS技术近来已经被发展进行有力的、快速和高精度的蛋白质控制。高通量技术的发展对于这样的蛋白质分析是需要的,因为大数量的蛋白质参与机体的自稳态,即使是最简单的有机体也是一样的。
总之,蛋白质芯片的进步依赖于改进的蛋白质表达系统,因为尽管E.Coli产生大量的异源蛋白质,此系统有一些缺点。它们包括在蛋白质在包涵体中的聚集和累积,以及细菌宿主不能进行翻译后修饰,磷酸化或糖基化。未来克服这个问题,我们近来研制了一个在Pichi pastoris和E.coli中双蛋白质表达系统,它结合了两个系统的优点,诸如可溶性蛋白质表达的改善(A.Lueking等,未发表),但不需亚克隆。这样表达的可溶性蛋白质对于许多应用是需要的,比如应用于治疗、体外相互作用研究、生成抗体识别结构表位以及结晶和核磁共振(NMR)研究。具有网上检测的高通量自动化芯片杂交设备,加上整合的图像和数据分析工具的改进将加快DNA和蛋白质芯片输出的速度和质量。
DNA和蛋白质芯片似乎是功能基因组学和蛋白质组学的新的和多功能工具。人们认为蛋白质芯片将使高通量筛选广泛种类的分子间相互作用成为可能。因为这是一个进步非常快的领域,蛋白质芯片对诊断、药物筛选、发育分析和蛋白质组学的真正贡献还有待我们眼见为实。