课程-宏基因组组装简介

直播时间:2017年11月16日下午16:00

多样性测序、宏基因组测序是现阶段微生物群落研究的核心技术。如果说16S/ITS这些多样性测序是相对简单的入门技术,那宏基因组研究就是更为复杂的“高端”技术。宏基因组的这种高端,主要体现在三大方面:研究成本高、分析过程难、结果内容多。宏基因组组装在实际操作过程中,还会存在各种各样的特有问题,例如物种间重复序列的影响,宿主污染,硬件要求等等。了解这些问题,对宏基因组的技术应用会有很大帮助,我们将会在这一期的在线课堂中深入探讨其中的奥秘。



多样性测序、宏基因组测序是现阶段微生物群落研究的核心技术。如果说16S/ITS这些多样性测序是相对简单的入门技术,那宏基因组研究就是更为复杂的高端技术。宏基因组的这种高端,主要体现在三大方面:研究成本高、分析过程难、结果内容多。这真所谓是高投入高回报。因此同一个课题,利用宏基因组和利用多样性测序去研究,所发表的杂志水平也往往有差异。现阶段,不同类型样本的微生物群落组成被研究得越来越透彻,而且群落功能研究很多只是处在一个初期阶段,因此宏基因组的应用必然是微生物群落研究的下一个重要方向。

数据的分析是宏基因组研究的核心问题,宏基因组的基本分析流程可简单分为:数据质控,序列组装,基因预测,物种注释,功能注释,统计及图表展示几个部分(图1)。可见得,序列组装的质量好坏,影响着后续基因和物种的定性定量,因此序列组装对宏基因组的整体分析有着决定性作用。






1. 宏基因组基本分析流程


宏基因组组装,本质是上基因组的组装。常见的序列组装方法可以是基于序列的overlap关系,如Omega这类型的软件就是采用这种策略,但最为常用的组装方法还是基于de Bruijn图的组装。这是由于现阶段的主流测序方法是二代短片段测序,而de Bruijn策略非常适合用于二代测序,因此这种方法就成了主流方法。常见的基于de Bruijn的软件有SOAP denovoIDBA-DUMegahit等等。

基于de Bruijn的组装方法,无论如何,多少都会受到测序的错误,重复序列的出现等因素所影响。宏基因组当然也受上述因素影响,而且,由于宏基因组的研究对象为群落物种,群落物种的特点是基因组多而且序列相近,因此宏基因组的组装难度相比于普通的单个基因组的组装难度更大。举个简单例子,我们可以通过过滤测序深度较低的k-mer的方法,在单物种基因组组装中有效减少测序错误,提高组装的准确性。但在宏基因组中这种策略却难以实现。为什么?因为在单基因组中,存在测序错误的reads一般深度都较低,通过丰度过滤可以有效保证reads的正确性,但微生物群落中存在大量低丰富物种,这些物种的reads丰度也是相对较低,因此如果只是简单通过过滤低丰度reads来排除测序错误,则很有可能把低丰度的正确物种信息也清除掉,造成数据的极大误差。

上述的低丰度reads问题只是众多宏基因组组装难题中的其中一个而已,在实际操作过程中,还会存在各种各样的特有问题,例如物种间重复序列的影响,宿主污染,硬件要求等等。了解这些问题,对宏基因组的技术应用会有很大帮助,我们将会在这一期的在线课堂中深入探讨其中的奥秘。

本期主要内容:

1. 序列组装原理介绍

2. 组装对整体分析结果影响

3. 宏基因组组装难题及解决方法



直播须知
  • 1、请事先熟悉OmicShare在线交流课堂听课流程,注意开课时间,建议直播前半小时进入课堂,等待课程直播。
  • 2、建议首选联通、电信4M以上独享网络,上课时建议用网线非WIFI连接,避免直播卡顿,无法进入直播等情况。
  • 4、OmicShare直播课程视频仅供OmicSharez注册用户学习使用,未经OmicShare许可以拷贝、录屏、反向工程、技术下载等手段获取直播课程视频的行为构成侵权,OmicShare立即封号处理,并保留追究注册用户法律责任。
  • 5、如有问题可邮件omicshare@genedenovo.com或加入生物信息交流群QQ659344871,与OmicShare客服及时取得联系。

授课老师

基迪奥-小师兄 金牌讲师

已从事多年微生物研究,具有丰富的分子克隆和高通量测序经验,擅长微生物群落和单菌体研究。

公告

暂无公告

最新学员