生物谷报道:各种质谱仪能够用于以质谱为基础的蛋白质组研究。每种类型的仪器都具有独特的设计、数据系统和运行规范,因此使其在不同类型的实验中各有优势。但不幸的是,每种质谱产生的二进制数据格式也不同,而且通常都是排它的。
数据结构的这种不一致和不透明的特性使得将新仪器整合到先前已经有的基础部件上变得很复杂,并影响了来自不同实验和实验室的结果的分析、交流、对比和公布。而且,这种特性还使生物信息学研究人员无法获得软件发展要求的数据。
在最近一期的Nature Biotechnology上,研究人员讨论了质谱数据的表示法以及这些数据在蛋白质组研究中的利用。
在文章中,研究人员介绍了“mzXML”格式,它是MS数据的一种开放的、通用的XML(注:extensible markup language)表示法。研究人员还开发出了一套与之相配合的支持程序。研究人员希望这种格式将会便利蛋白质组研究中数据的处理、解释和发表(http://www.bioon.com/)。