最近,来自美国加利福尼亚大学圣地亚哥分校、克雷格-文特尔研究院和Illumina公司的科学家对现代基因测序算法进行了改良,只需从一个细菌细胞中提取的DNA(脱氧核糖核酸)就可组装成接近完整的基因组,准确率达到90%,而传统的测序方法至少需要10亿个相同的细胞才能完成。这一突破为那些无法培养的细菌提供了测序方法。研究发表在9月18日的《自然·生物技术》网络版上。
实验室无法培养的细菌范围极广,约占99.9%,从产生抗体和生物燃料的微生物,到人体内的寄生菌。它们的生存条件特殊,比如必须和其他菌种共生,或只能生存在动物皮肤上,因此很难进行人工培养。
论文合著者、文特尔研究院的罗杰·拉斯肯教授10年前曾开发出一种多重置换扩增(MDA)技术,可对实验室无法培养的细菌测序,能恢复70%的基因。其工作原理是对一个细胞的基因片断多次复制,直到其数量相当于10亿个细胞那么多。不过,这种技术却给测序软件带来很多麻烦,它在复制DNA时会出现各种错误,而且并非完全统一放大,有些基因组被复制数千次,有一些却只被复制一两次。但测序算法不能处理这些不一致,而是倾向于舍弃那些只复制了少数次的基因,即使它们对整个基因组来说很关键。
加州大学圣地亚哥分校雅各布工程学院计算机科学教授、现代基因测序技术算法创建人帕维尔·帕夫纳和同事改进了这一方法,保留了那些少量复制的基因片断,并用新方法对一个大肠杆菌测序以检验其精确性,发现它能恢复91%的基因,接近传统的培养细胞水平。这已足够解答许多重要的生物学问题,比如该细菌能产生什么抗体。
人体细菌占体重的约10%,它们有些会造成传染病,但也有的能帮助消化,最近研究还发现,它们能改变人的行为方式,比如引诱人吃更多的东西。新方法也有助于科学家理解细菌行为,研究人体内细菌能产生哪种蛋白质和多肽,这些蛋白质和多肽是细菌之间、细菌和宿主之间互相沟通的工具。
研究小组还用新方法对一种以前未曾测序过的海洋细菌进行了测序,获得了相当完整而且能解释的基因组,掌握了它是如何生存和运动的,该基因组将被存入美国国家卫生研究院的基因银行(GenBank)。研究人员表示还将对更多迄今未知的细菌进行测序。(生物谷 Bioon.com)
doi:10.1038/nbt.1966
PMC:
PMID:
Efficient de novo assembly of single-cell bacterial genomes from short-read data sets
Hamidreza Chitsaz,Joyclyn L Yee-Greenbaum, Glenn Tesler,Mary-Jane Lombardo,Christopher L Dupont,Jonathan H Badger,Mark Novotny,Douglas B Rusch,Louise J Fraser,Niall A Gormley,Ole Schulz-Trieglaff,Geoffrey P Smith,Dirk J Evers,Pavel A Pevzner1 & Roger S Lasken
Whole genome amplification by the multiple displacement amplification (MDA) method allows sequencing of DNA from single cells of bacteria that cannot be cultured. Assembling a genome is challenging, however, because MDA generates highly nonuniform coverage of the genome. Here we describe an algorithm tailored for short-read data from single cells that improves assembly through the use of a progressively increasing coverage cutoff. Assembly of reads from single Escherichia coli and Staphylococcus aureus cells captures >91% of genes within contigs, approaching the 95% captured from an assembly based on many E. coli cells. We apply this method to assemble a genome from a single cell of an uncultivated SAR324 clade of Deltaproteobacteria, a cosmopolitan bacterial lineage in the global ocean. Metabolic reconstruction suggests that SAR324 is aerobic, motile and chemotaxic. Our approach enables acquisition of genome assemblies for individual uncultivated bacteria using only short reads, providing cell-specific genetic information absent from metagenomic studies.