(86 21) 61841318 support@zetabio.com

原核生物基因组计划

 

简介

原核微生物是包括细菌(Bacteria)和古菌(Archaea)。
微生物与人类的生产、生活和生存息息相关。有很多食品(如酱油、醋、味精、酒、酸奶、奶酪、蘑菇)、工业品(如皮革、纺织、石化)、药品(如抗生素、疫苗、维生素、生态农药)是依赖于微生物制造的;微生物在矿产探测与开采、废物处理(如水净化、沼气发酵)等各种领域中也发挥重要作用。

对微生物的研究和利用离不开对微生物基因组序列的测定和解析,获得所关心物种的基因组序列和注释信息是大量相关工作的重要基础。原核微生物大多数只含有一条染色体,细菌基因组中大多含有重复序列,可移动元件(比如质粒,噬菌体等),抗性基因或抗性基因组岛。基因组计划需要对这些复制子的序列完成测定。一般原核生物的基因组全长在0.8Mbp 至 10Mbp,基因组GC含量从25%至72%不等。

原核微生物基因组序列草图(draft)

获得特定微生物基因组序列全长95%以上,单个复制子碎片(contig)限制在50个以下。

使用二代高通量测序技术进行测序
拼装获得50个以下序列片段
基于拼装所得序列可预测得到大部分全长编码基因(>90%)

原核微生物基因组完成图(complete sequence)

  • 获得每个复制子的全长序列。
  • 使用三代高通量测序技术进行测序
  • 拼装获得单条完整复制子序列
  • 基于拼装所得序列可预测得到绝大部分全长编码基因(>99%)
  • 基于拼装所得序列可同其他菌株基因组做全基因比对分析。
  • 获得全基因组范围的碱基修饰状态(DNA甲基化/DNA硫基化修饰)。
  • 可根据序列组成分析推测复制起始位点。

原核微生物基因组注释

对获得的微生物基因组草图或完成图进行结构注释及功能注释。

  • 编码基因预测及其产物功能注释
  • tRNA基因预测
  • rRNA基因预测
  • sRNA基因预测
  • 复制起始位点预测
  • rho因子依赖终止子预测
  • 终止子预测
  • RBS预测
  • 串联重复预测

其他辅助数据服务

公共数据库(NCBI)测序原始数据/基因组序列/注释提交文件制作

使用三代测序技术进行微生物基因组计划的优势

目前的基因组测序拼装策略是WGS,这就要求测序的序列读长能够有效跨过重复序列以及获得高GC含量的基因组区域。

目前我们推荐使用第三代测序技术对微生物基因组进行测定。第三代测序技术所得的序列能有效进行de novo拼装(不借助已知参考基因组,从头进行序列拼装)。这种策略无论是对于已经有同属/种参考基因组的微生物,还是没有确定分类学地位或无参考基因组 的微生物而言都是很有效的测序方法。

相比通过二代测序技术,基于三代测序的微生物基因组计划能提供更快的基因组完成图交付,以及提供二代测序无法测定的DNA碱基修饰信息。

为了获得足够好的数据,我们推荐单个菌株构建单个测序文库的DNA起始量需要达到8.0μg,进行gDNA提取后,我们建议先使用16SrRNA基因通用引物对提取的gDNA进行扩增,并对产物进行毛细管电泳法测序测定,以保证样本的纯度。