查看: 3470|回复: 7

[宏基因组] 如何打破瓶颈,提升宏基因组研究level?

[复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
153
注册时间
2019.7.8
在线时间
243 小时

发表于 2019.11.19 10:51:50 | 显示全部楼层 |阅读模式
​微生物是群落聚集型的存在方式,丰富的微生物构成了和谐的动态平衡,相反,微生物的失衡也会带来一系列问题。如果仅停留16S/ITS层面,显然不能获得更深入的突破。

一方面,因为16S/ITS仅仅是物种基因组上的一个小片段,主要反应物种进化关系,基于此的微生物多样性分析聚焦于物种层面,对群落的研究深度受限于数据库中已知物种的信息。

另一方面,物种层面的研究无法获得更深层次的机理机制的解析,只有基于具有生态学实际意义的功能层面,我们才能真正明白微生物内部、微生物与宿主、环境的关联,才能为医学等各领域的突破提供参考。

显然,宏基因组分析可以突破16S与ITS的限制。宏基因组测序分析,即同时获得群落中全部微生物(实验室可培养、不可培养)的全部基因组信息(16S、ITS、功能基因、非编码序列等)。由此也可以看出,宏基因组的“宏”包含了大量信息。

但随着高通量测序的快速发展,宏基因组已经成为非常大众普遍的研究方法。想要借助宏基因组技术获得更深入的研究成果、获得更高质量的文章离不开个性化的高级分析。

如何突破现有宏基因组的大众化思路,提升宏基因组level?

我们通过汇总对比最新宏基因组文章(表1),总结了提升宏基因组研究的3个思路:

1)结合个性专业的数据库,丰富功能分析角度;
2)使用更加专业新颖的可视化方式;
3)补充更高级的分析点,比如binning、CAG(Co-Abundancegene Groups)、MGS等高级分析实现特殊“单菌”基因组的探索。

当然啦,还有万能的多组学(宏基因组+)提升方法。今天我们先基于前3种思路具体介绍。

表1 宏基因组最新研究对比

思路一 个性专业的数据库

常用的,我们会将基因比对Nr、KEGG数据库获得群落的功能注释和代谢通路(pathway)特征。此外,不同领域的专业数据库可以帮助我们进行更精细的功能研究。

1)eggNOG(evolutionary genealogy of genes:Non-supervised Orthologous Groups),基于直系同源(orthology)进行基因、蛋白序列的功能预测,被认为比传统的同源搜索更准确,适用于新基因组、宏基因组等基因集,可获得25个分类的功能分布特征。

2)CAZy (Carbohydrate-Active enZYmes Database),是碳水化合物酶相关的专业数据库,包括催化碳水化合物生物合成、降解以及修饰的相关酶系家族,对生物质转化等工业微生物领域、生境内碳循环相关功能研究有重要参考价值(图1)。

图1 CAZy circos图

3) PHI-base(Pathogen Host Interactions),病原宿主互作数据库,收录了经过实验验证或文献报道的能够感染植物、动物、真菌和昆虫的真菌、卵菌、细菌等病原菌的致病基因、毒力基因、效应蛋白基因,以及抗真菌化合物及其靶基因(图2)。

图2 PHI群落内病原菌表型分类统计

4)CARD(Comprehensive Antibiotic ResistanceDatabase),耐药基因数据库,以Antibiotic Resistance Ontology(ARO)为分类单位(term)构建,用于关联抗生素模块及其目标、抗性机制、基因变异等信息。通过该数据库的注释,可以找到耐药性相关基因的名称,所耐受的抗生素种类等信息。


5)VFDB,Virulence Factors of PathogenicBacteria,毒力因子数据库,由中国医学科学院研发,收集整理了重要医学病原菌中74个属951个菌株的1080个已知毒力因子的组成、结构、功能、致病机理、毒力岛、序列和基因组信息等内容。能够为病原菌的入侵机理研究提供关键证据,可以研究群落中不同病原菌的毒力因子构成等特征,被广泛应用于毒力因子基因鉴定。

思路二 专业新颖的可视化

除了常用的柱形图、盒型图、热图……,我们还可以借助更酷炫高级的图形展示研究成果,吸引审稿人。  

1)circos图(图1),可以在物种、功能分布等多种情境应用,图形结构看似复杂,但其实很清晰地展示了目标集合的分布规律,相比多组组合的柱形图,形象气质更佳哦。

2)三元图(图3),当比较组中有3个分组时,可以用来描述物种/功能在每个分组的富集情况,适用于三组分析。

图3 三元图

3)网络图(图4),可以将物种/功能间的复杂联系呈现出来,可以借助非常多的图形修改参数展示丰富的生物信息,如相关性的强弱、正负、物种分类特征、丰度、核心物种等。


图4 网络图

思路三 深入复杂的高级分析

宏基因组本来是针对群落的,我们介绍的这些高级分析,其巧妙之处就在于发现规律,找到了从群落中提取“单菌基因组”进行分析的方法。受方法、测序深度、样本复杂度等影响,单菌提取程度、效果不一,比较好的可以获得菌株水平较完整的基因组序列,差一点的,可以获得同属或同种的不太完整基因组序列。

单菌的分析意义和方法在之前讲过(链接),这样一来,我们通过宏基因组测序即可进行群落和单菌两个层面的数据挖掘,研究深度大大提高。

3.1 binning
binning(分箱)有多种方法,最成熟受欢迎的是contig binning。简单来讲,就是将宏基因组测序组装获得的contig(reads拼接获得的大片段序列),按照contig的丰度和四核苷酸多态性的特征进行分类。

这套方法基于的生物学理论是相同物种基因组的核酸组成相似。再结合丰度特征,理想条件下,对于同一个物种,不同基因组片段的丰度是一致的。

以contig GC含量为横坐标,contig覆盖度为纵坐标,我们通过二维平面(图5)展示每个contig的位置,那么聚集在一簇的contig即具有相似的核酸组成和丰度,表示一个draft genome(bin)。我们获得bin后既可以绘制基因组草图,也可以提取reads尝试重新组装,最后开展基于draft genome的分析,比如共线性等比较基因组分析。

图5 binning结果示意图

3.2 CAG
和binning的基本原理类似,CAG也是基于聚类获得cluster。不同的是,CAG是基于所有样本中基因的丰度聚类。聚为一类的基因簇即被认为是某一物种的部分或全部基因。

3.3 MGS
和CAG不同的是,MGS是基于鉴定出的差异基因进行层次聚类,聚成丰度一致的基因群(MGS,metagenomic species)。聚为一类的基因簇被认为是同属或同种。

更多宏基因组理论、可视化操作、进阶研究思路等,欢迎小伙伴们报名参加基迪奥2019.11.25-29的微生物培训班,参与培训的学员将获得价值2000元的20例样本数据的动态交互平台Omicsmart分析使用权,用自己的数据实操体验个性化分析!

课程表及报名方式如下:

课程表

报名费
4500元/人(交通和食宿费用自理)
团购有优惠,2人报名95折,3人报名85折!

报名方式
方式一长按图片识别二维码填写信息报名 (二维码见本文底部)
方式二发送“姓名、单位及电话”到邮箱contact@genedenovo.com,主题注明“转录组培训班”
方式三登陆基迪奥线下培训班官网网站进行报名

培训班官方网站www.omicshare.com/train
客服020-39341079

报名二维码

名额有限,欲报从速~


本文作者:基迪奥-小鱼儿

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复

使用道具 举报

迅猛龙

Rank: 8Rank: 8

主题
26
注册时间
2016.1.8
在线时间
431 小时

发表于 2019.11.19 11:06:33 | 显示全部楼层
666 每日一赞
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
0
注册时间
2018.1.22
在线时间
116 小时

发表于 2019.11.19 14:39:48 | 显示全部楼层
lalalala!
回复

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
0
注册时间
2019.3.19
在线时间
11 小时

发表于 2019.11.20 07:57:16 | 显示全部楼层
感谢楼主发现
回复 支持 反对

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
5
注册时间
2017.4.28
在线时间
110 小时

发表于 2019.11.20 19:09:17 | 显示全部楼层
把握好时间来签到
回复

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
2
注册时间
2019.10.25
在线时间
30 小时

发表于 2019.11.21 07:47:14 | 显示全部楼层
感谢楼主分享
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
7
注册时间
2016.4.7
在线时间
189 小时

发表于 2019.11.21 10:09:18 | 显示全部楼层
学习了,谢谢解析 分享
回复 支持 反对

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
0
注册时间
2019.3.19
在线时间
11 小时

发表于 2019.11.28 08:05:41 | 显示全部楼层
这些图都好炫酷
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表