OpGen公司今日宣布,通过利用ARGUS? Whole Genome Mapping System技术结合新一代测序技术(NGS),生成了首个家山羊(domestic goat)的高质量参考基因组。这一研究是由深圳华大基因研究院和中科院昆明动物研究所领导,相关成果发表在《自然生物技术》(Nature Biotechnology)杂志上。
这篇题为“Sequencing and automated whole-genome optical mapping of the genome of a domestic goat (Capra hircus)”的研究论文,证实了OpGen公司的Whole Genome Mapping技术在从头组装大型、复杂基因组方面所具有的价值、效力和成本效应。
深圳华大基因研究院副院长徐讯(Xun Xu)说:“这一独特的技术不仅验证了基因组测序,还为我们提供了测序无法检测到的大规模染色体结构信息。这些基因组组装项目的经验表明,全基因组物理图谱应该是未来所有组装的参考基因组的标准。”
山羊是世界各地包括中国和印度在内的许多发展中国家的一种重要经济资源。然而,尽管它们在农业和生物学上极其重要,由于缺乏高质量的参考基因组序列,山羊的育种和遗传研究长期以来受阻。这一山羊基因组是第一个小型反刍动物高质量参考基因组,或可帮助深入了解来自非反刍动物物种的有差别的反刍动物基因组特征。
尽管用新一代测序生成组装草图相对容易,完成某一序列达到染色体水平却仍然困难且成本高昂。研究结果表明,相比于当前可获得的绘图策略,如细菌人工染色体(BACs)或荧光原位杂交(FISH),将单一的NGS平台与Whole Genome Mapping技术相结合能够更快更廉价地生成精致完美的组装。这一方法为大型基因组从头组装设立了黄金标准,消除了对于非常费时的遗传图谱的需求。
“通过纳入Whole Genome Mapping技术,我们能够克服NGS短读支架(short read scaffold)的局限,生成长超级支架,完成装配达到接近染色体水平,”论文的作者、中科院昆明动物研究所副所长王文(Wen Wang)说:“没有OpGen的技术,我们无法完成这一项目。”
在这项研究中,OpGen的ARGUS系统在3个小时内生成了10万个单分子限制图谱。这使得山羊基因组物理覆盖度提高了30倍。该公司的Genome Builder?软件,结合新一代测序及随后组装生成的单分子图谱数据和测序支架,生成了长超级支架。特别是,通过将Whole Genome Mapping与NGS相结合,将组装的度量提高了8倍。
“尽管我们还在继续证实Whole Genome Mapping在组装、质量控制和验证微生物基因组方面的价值,我们非常高兴扩大其应用,使其成为一种关键性的互补技术,让研究人员能够在复杂的新项目中提供完整的、准确的、长期的基因组信息,”论文的作者、OpGen公司的首席科学官Richard Moore博士说:“这篇论文是我们预计发表在明年的众多研究成果中的第一个,它们将证实OpGen公司的Whole Genome Mapping技术可作为一种方法,从头组装从微生物到哺乳动物的基因组谱。”(生物谷Bioon.com)
doi:10.1038/nbt.2478
PMC:
PMID:
Sequencing and automated whole-genome optical mapping of the genome of a domestic goat (Capra hircus)
Yang Dong, Min Xie, Yu Jiang, Nianqing Xiao, Xiaoyong Du, Wenguang Zhang, Gwenola Tosser-Klopp, Jinhuan Wang, Shuang Yang, Jie Liang, Wenbin Chen, Jing Chen, Peng Zeng, Yong Hou, Chao Bian, Shengkai Pan, Yuxiang Li, Xin Liu, Wenliang Wang, Bertrand Servin, Brian Sayre, Bin Zhu, Deacon Sweeney, Rich Moore, Wenhui Nie, Yongyi Shen,Ruoping Zhao, Guojie Zhang, Jinquan Li, Thomas Faraut, James Womack, Yaping Zhang,James Kijas, Noelle Cockett, Xun Xu, Shuhong Zhao, Jun Wang & Wen Wang
We report the ~2.66-Gb genome sequence of a female Yunnan black goat. The sequence was obtained by combining short-read sequencing data and optical mapping data from a high-throughput whole-genome mapping instrument. The whole-genome mapping data facilitated the assembly of super-scaffolds >5× longer by the N50 metric than scaffolds augmented by fosmid end sequencing (scaffold N50 = 3.06 Mb, super-scaffold N50 = 16.3 Mb). Super-scaffolds are anchored on chromosomes based on conserved synteny with cattle, and the assembly is well supported by two radiation hybrid maps of chromosome 1. We annotate 22,175 protein-coding genes, most of which were recovered in the RNA-seq data of ten tissues. Comparative transcriptomic analysis of the primary and secondary follicles of a cashmere goat reveal 51 genes that are differentially expressed between the two types of hair follicles. This study, whose results will facilitate goat genomics, shows that whole-genome mapping technology can be used for the de novo assembly of large genomes.