查看: 741|回复: 2

[宏基因组] 如何优雅地展示群落微生物数据

[复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
153
注册时间
2019.7.8
在线时间
243 小时

发表于 2020.6.1 09:37:47 | 显示全部楼层 |阅读模式
一、从一个圆圈讲起

不知道从什么时候起,有一种图形开始频繁出现在各大主流期刊各类型研究文章中,它以一个圆圈为主体,但又不只是一个圆圈那么简单。它既能呈现基因组学中的位点信息,也能够对微生物群落-样本关系进行展示;它可以很简约地出现在文章开头做一些背景信息的基本描述(图1),也可以精巧地组合上各类小图形,用最优雅地方式向读者呈现基因世界的纷繁璀璨(图2)。兼具着实用与美感,circos图可以说是科研工作者对效率与美学结合思考的产物。

图1 文章中的circos图[1]

图2 文章中的circos图[2]

二、Circos图在微生物群落研究中的应用

微生物群落的研究,从16s等扩增子小样本量研究时代逐步过渡至大样本扩增子与宏基因组学齐头并进的新时代。伴随技术升级的还有文章中的展示图形,柱状图、箱型图等已不能完全满足如今的需求,新世代的研究者追求的是更高信息密度、更符合当代审美的展示图形。作为追求发文章毕业的 “后浪”,还是非常有必要追赶一番潮流的。

在16s等扩增子数据展示中,我们常用堆叠图对微生物群落物种的相对丰度进行展示,以样本为一个展示单位,展示每个样本所包含的物种相对丰度数据信息。在大样本量、多分组数据的今天,堆叠图有着明显的不足。堆叠图仅能从样本的角度分析物种的组成特点,而如果我们需要从某个物种的角度出发,分析多组样本在特定物种上的占比信息时,堆叠图并不能一目了然进行比较,需要再次对数据进行处理才能获得最终结果。

Circos图能够同时展示物种与样本间的对应关系,帮助我们完美解决堆叠图展示所面临的问题。除了物种与样本的展示外,circos图还能用于展示宏基因组学中功能与物种间的对应关系,从物种组成的基础层面迈向功能分析的更高层面,让文章的论述更有层次感。

图3 文献中的物种-样本关系circos图形[3]

1.物种关系Circos图

这种circos图常见于16s等扩增子测序分析文章中,样本中包含哪些微生物是我们群落研究的第一个问题,circos图以圆的形式将样本和物种信息列在两侧,通过内部的连线表示对应关系,让样本中的物种组成关系显得一目了然。一个基础的物种关系circos图通常包含内、外两圈,内圈的刻度一般可用来表示数值信息,如相对丰度值、tag数等;外圈一般用于表示百分比信息。

不同分组颜色不同,当我们需要判断某个物种在各样本的占比情况时,只需要观察物种外圈不同颜色条带长度,再结合百分比刻度即可获得。我们的研究往往是有预设目标的前提下开展的,例如土壤微生物我们关注放线菌门(Actinobacteria)、变形菌门(Proteobacteria)等;动物肠道微生物我们关注拟杆菌门(Bacteroidetes)、厚壁菌门(Firmicutes)等;使用circos图直接查看这些关注物种的对照组和处理组的占比情况,能帮助我们快速、准确地做出判断,分析实验处理的效果,省去了数据再三处理过程。

除了上述功能外,circos图内部的连线也是我们判断物种组成的好帮手。Circos内部将物种与样本进行对应连线,线的粗细代表了物种丰度高低,连线粗细可用于判断样本内的优势物种,同一个物种与不同样本间的连线粗细越一致说明物种在样本间分布均匀,反之则说明不同样本间该物种丰度存在差异。

结合以上两种功能,circos图能完整解答微生物群落研究的第一个问题,即样本包含哪些物种,关注的物种在各样本的分布情况,哪些物种丰度可能存在组间/样本间显著差异。

图4 物种-样本circos图形[4]

2.功能关系circos图

除了能够解答扩增子样本与物种的对应关系外,circos图还能够帮助我们解答宏基因组中功能与物种间的关系。在宏基因组学中,我们既关注基因注释到的功能丰度信息,同时我们也关注这些功能由哪类微生物产生。例如我们常用CAZy数据库对得到的基因进行功能注释,获得各类消化酶的丰度信息,之后我们还可以将基因序列进行物种比对,获得物种信息,从而搭建起物种-功能的桥梁。

通过circos图可以将以上两种信息进行整合,直观展现功能与对应物种间的关联。左侧为物种,右侧为功能的集合(如:GH组为糖苷水解酶家族),通过功能与物种连线的粗细就能够判断出哪类微生物是产生这种酶的主体。当然,我们同样可以从物种的角度出发,分析该分组样本内某些关注的物种对应产生哪些酶。

Circos图独特的地方在于其包容性强,可以结合其他类型的图形进行共同展示,如热图,气泡图等。通过结合气泡图,展示次级分类(酶家族的具体成员)与门水平物种的关系,以气泡大小展示物种的对应的酶丰度信息。从气泡的有无就能够判断该分组样品数据中,物种是否产生某种酶,通过气泡颜色就能判断物种产生酶能力强弱。对于研究微生物的群落功能来说,以这样一张功能关系circos图就能够从功能的角度去解释特定环境样本中物种是如何通过产生某些产物,从而发挥特定的功能。

图5 功能-物种circos图[5]

三、小结

1.Circos是一种高信息密度的图形,对于信息量较大的数据展示是一个好选择。
2.Circos图形在微生物群落研究中可用于展示物种-样本关系,也可以用来展示功能-物种关系。
3.Circos不局限于圈形图形,可以将热图、气泡图等图形进行合并展示,从而进一步提升展示的信息密度。
4.Circos图适合用于数据均匀度适中的情况,对于分布较杂的数据(如属水平微生物丰度)建议先进行筛选后再使用circos图进行展示,有利于突出重点。

四、绘图工具

Omicshare平台绘图工具,输入OTU表格即可获得circos图形。地址:www.omicshare.com 云平台-软件中心-搜索circos。

图6 物种关系circos图(Omicshare 绘图工具)

参考文献
[1] Gherman A, Chen PE, Teslovich TM, et al. Population bottlenecks as a potential major shaping force of human genome architecture. PLoS Genet. 2007;3(7):e119.
[2] Wei K, Wang Y, Xie D, et al. Identification and expression profile analysis of the protein kinase gene superfamily in maize development[J]. Molecular Breeding, 2014, 33(1): 155-172.
[3] Li XX, Shi S, Rong L, Feng MQ, Zhong L. The impact of liposomal linolenic acid on gastrointestinal microbiota in mice. Int J Nanomedicine. 2018;13:1399-1409
[4] Yang XR, Li H, Nie SA, et al. Potential contribution of anammox to nitrogen loss from paddy soils in Southern China. Appl Environ Microbiol. 2015;81(3):938‐947. doi:10.1128/AEM.02664-14.
[5] Lin L, Xie F, Sun D, Liu J, Zhu W, Mao S. Ruminal microbiome-host crosstalk stimulates the development of the ruminal epithelium in a lamb model. Microbiome. 2019;7(1):83. Published 2019 Jun 3. doi:10.1186/s40168-019-0701-y



本文作者:基迪奥-阿拉雷

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
新的一天加油!
回复

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
0
注册时间
2017.6.6
在线时间
60 小时

灌水之王


发表于 2020.6.5 09:16:15 | 显示全部楼层
新的一天加油!
回复

使用道具 举报

钵水母

Rank: 3Rank: 3

主题
0
注册时间
2020.5.14
在线时间
3 小时

发表于 2020.6.11 16:11:24 | 显示全部楼层
太棒了,学习
新的一天加油啊
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表