绝大多数经过实验证实的生物大分子相互作用和生物代谢路径的数据都以一种非结构化的方式在生物文献中存储着,这种存储方式是零散的,计算机不可直接处理的。生物大分子相互作用网络数据库(BIND)的目标是以一种机器可读的方式将这些数据整理起来。作者认为大工作量的数据库装填工作可以借助支持矢量机技术(SVM)来完成。SVM将别用来首先在文献中定位那些大分子相互作用的数据信息。作者发展了从定位数据到将数据提交给管理员或公众评价然后入库的一套信息提取系统
研究发现支持矢量机技术的精度和准确率都达到90%以上。当作者把该系统应用到实际工作中去时,证实它减少了大约70%的工作量,节省了176天的时间。应该向大家解释的是SVM是一种机器学习方法,在这一应用中,该方法被证明是有效的。同时应该注意到,SVM只能定位和提交数据,而数据评价工作还需要人工评价之后才能进入BIND。在这只前SVM所形成的数据库被命名为PreBind,该数据库同样向公众开放,使得大家都可以参与到评价工作中去。