查看: 381|回复: 7

[宏基因组] 如何打破瓶颈,提升宏基因组研究level?

[复制链接]
  • TA的每日心情
    忙~
    4 天前
  • 签到天数: 1 天

    连续签到: 1 天

    [LV.1]初来乍到

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    41
    奥币
    93
    积分
    428
    注册时间
    2019.7.8
    在线时间
    85 小时

    发表于 2019.11.19 10:51:50 | 显示全部楼层 |阅读模式
    ​微生物是群落聚集型的存在方式,丰富的微生物构成了和谐的动态平衡,相反,微生物的失衡也会带来一系列问题。如果仅停留16S/ITS层面,显然不能获得更深入的突破。

    一方面,因为16S/ITS仅仅是物种基因组上的一个小片段,主要反应物种进化关系,基于此的微生物多样性分析聚焦于物种层面,对群落的研究深度受限于数据库中已知物种的信息。

    另一方面,物种层面的研究无法获得更深层次的机理机制的解析,只有基于具有生态学实际意义的功能层面,我们才能真正明白微生物内部、微生物与宿主、环境的关联,才能为医学等各领域的突破提供参考。

    显然,宏基因组分析可以突破16S与ITS的限制。宏基因组测序分析,即同时获得群落中全部微生物(实验室可培养、不可培养)的全部基因组信息(16S、ITS、功能基因、非编码序列等)。由此也可以看出,宏基因组的“宏”包含了大量信息。

    但随着高通量测序的快速发展,宏基因组已经成为非常大众普遍的研究方法。想要借助宏基因组技术获得更深入的研究成果、获得更高质量的文章离不开个性化的高级分析。

    如何突破现有宏基因组的大众化思路,提升宏基因组level?

    我们通过汇总对比最新宏基因组文章(表1),总结了提升宏基因组研究的3个思路:

    1)结合个性专业的数据库,丰富功能分析角度;
    2)使用更加专业新颖的可视化方式;
    3)补充更高级的分析点,比如binning、CAG(Co-Abundancegene Groups)、MGS等高级分析实现特殊“单菌”基因组的探索。

    当然啦,还有万能的多组学(宏基因组+)提升方法。今天我们先基于前3种思路具体介绍。

    表1 宏基因组最新研究对比

    思路一 个性专业的数据库

    常用的,我们会将基因比对Nr、KEGG数据库获得群落的功能注释和代谢通路(pathway)特征。此外,不同领域的专业数据库可以帮助我们进行更精细的功能研究。

    1)eggNOG(evolutionary genealogy of genes:Non-supervised Orthologous Groups),基于直系同源(orthology)进行基因、蛋白序列的功能预测,被认为比传统的同源搜索更准确,适用于新基因组、宏基因组等基因集,可获得25个分类的功能分布特征。

    2)CAZy (Carbohydrate-Active enZYmes Database),是碳水化合物酶相关的专业数据库,包括催化碳水化合物生物合成、降解以及修饰的相关酶系家族,对生物质转化等工业微生物领域、生境内碳循环相关功能研究有重要参考价值(图1)。

    图1 CAZy circos图

    3) PHI-base(Pathogen Host Interactions),病原宿主互作数据库,收录了经过实验验证或文献报道的能够感染植物、动物、真菌和昆虫的真菌、卵菌、细菌等病原菌的致病基因、毒力基因、效应蛋白基因,以及抗真菌化合物及其靶基因(图2)。

    图2 PHI群落内病原菌表型分类统计

    4)CARD(Comprehensive Antibiotic ResistanceDatabase),耐药基因数据库,以Antibiotic Resistance Ontology(ARO)为分类单位(term)构建,用于关联抗生素模块及其目标、抗性机制、基因变异等信息。通过该数据库的注释,可以找到耐药性相关基因的名称,所耐受的抗生素种类等信息。


    5)VFDB,Virulence Factors of PathogenicBacteria,毒力因子数据库,由中国医学科学院研发,收集整理了重要医学病原菌中74个属951个菌株的1080个已知毒力因子的组成、结构、功能、致病机理、毒力岛、序列和基因组信息等内容。能够为病原菌的入侵机理研究提供关键证据,可以研究群落中不同病原菌的毒力因子构成等特征,被广泛应用于毒力因子基因鉴定。

    思路二 专业新颖的可视化

    除了常用的柱形图、盒型图、热图……,我们还可以借助更酷炫高级的图形展示研究成果,吸引审稿人。  

    1)circos图(图1),可以在物种、功能分布等多种情境应用,图形结构看似复杂,但其实很清晰地展示了目标集合的分布规律,相比多组组合的柱形图,形象气质更佳哦。

    2)三元图(图3),当比较组中有3个分组时,可以用来描述物种/功能在每个分组的富集情况,适用于三组分析。

    图3 三元图

    3)网络图(图4),可以将物种/功能间的复杂联系呈现出来,可以借助非常多的图形修改参数展示丰富的生物信息,如相关性的强弱、正负、物种分类特征、丰度、核心物种等。


    图4 网络图

    思路三 深入复杂的高级分析

    宏基因组本来是针对群落的,我们介绍的这些高级分析,其巧妙之处就在于发现规律,找到了从群落中提取“单菌基因组”进行分析的方法。受方法、测序深度、样本复杂度等影响,单菌提取程度、效果不一,比较好的可以获得菌株水平较完整的基因组序列,差一点的,可以获得同属或同种的不太完整基因组序列。

    单菌的分析意义和方法在之前讲过(链接),这样一来,我们通过宏基因组测序即可进行群落和单菌两个层面的数据挖掘,研究深度大大提高。

    3.1 binning
    binning(分箱)有多种方法,最成熟受欢迎的是contig binning。简单来讲,就是将宏基因组测序组装获得的contig(reads拼接获得的大片段序列),按照contig的丰度和四核苷酸多态性的特征进行分类。

    这套方法基于的生物学理论是相同物种基因组的核酸组成相似。再结合丰度特征,理想条件下,对于同一个物种,不同基因组片段的丰度是一致的。

    以contig GC含量为横坐标,contig覆盖度为纵坐标,我们通过二维平面(图5)展示每个contig的位置,那么聚集在一簇的contig即具有相似的核酸组成和丰度,表示一个draft genome(bin)。我们获得bin后既可以绘制基因组草图,也可以提取reads尝试重新组装,最后开展基于draft genome的分析,比如共线性等比较基因组分析。

    图5 binning结果示意图

    3.2 CAG
    和binning的基本原理类似,CAG也是基于聚类获得cluster。不同的是,CAG是基于所有样本中基因的丰度聚类。聚为一类的基因簇即被认为是某一物种的部分或全部基因。

    3.3 MGS
    和CAG不同的是,MGS是基于鉴定出的差异基因进行层次聚类,聚成丰度一致的基因群(MGS,metagenomic species)。聚为一类的基因簇被认为是同属或同种。

    更多宏基因组理论、可视化操作、进阶研究思路等,欢迎小伙伴们报名参加基迪奥2019.11.25-29的微生物培训班,参与培训的学员将获得价值2000元的20例样本数据的动态交互平台Omicsmart分析使用权,用自己的数据实操体验个性化分析!

    课程表及报名方式如下:

    课程表

    报名费
    4500元/人(交通和食宿费用自理)
    团购有优惠,2人报名95折,3人报名85折!

    报名方式
    方式一长按图片识别二维码填写信息报名 (二维码见本文底部)
    方式二发送“姓名、单位及电话”到邮箱contact@genedenovo.com,主题注明“转录组培训班”
    方式三登陆基迪奥线下培训班官网网站进行报名

    培训班官方网站www.omicshare.com/train
    客服020-39341079

    报名二维码

    名额有限,欲报从速~


    本文作者:基迪奥-小鱼儿

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    回复

    使用道具 举报

  • TA的每日心情
    害羞
    10 小时前
  • 签到天数: 675 天

    连续签到: 12 天

    [LV.9]以坛为家II

    迅猛龙

    Rank: 8Rank: 8

    主题
    26
    奥币
    3963
    积分
    1745
    注册时间
    2016.1.8
    在线时间
    415 小时

    发表于 2019.11.19 11:06:33 | 显示全部楼层
    666 每日一赞
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    11 小时前
  • 签到天数: 277 天

    连续签到: 1 天

    [LV.8]以坛为家I

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    748
    积分
    221
    注册时间
    2018.1.22
    在线时间
    106 小时

    发表于 2019.11.19 14:39:48 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    12 小时前
  • 签到天数: 30 天

    连续签到: 22 天

    [LV.5]常住居民I

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    477
    积分
    373
    注册时间
    2019.3.19
    在线时间
    7 小时

    活跃会员最佳新人


    发表于 2019.11.20 07:57:16 | 显示全部楼层
    感谢楼主发现
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    忙~
    5 天前
  • 签到天数: 293 天

    连续签到: 1 天

    [LV.8]以坛为家I

    中华鲟

    Rank: 5Rank: 5

    主题
    5
    奥币
    3722
    积分
    662
    注册时间
    2017.4.28
    在线时间
    103 小时

    发表于 2019.11.20 19:09:17 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    12 小时前
  • 签到天数: 37 天

    连续签到: 21 天

    [LV.5]常住居民I

    中华鲟

    Rank: 5Rank: 5

    主题
    2
    奥币
    447
    积分
    602
    注册时间
    2019.10.25
    在线时间
    22 小时

    发表于 2019.11.21 07:47:14 | 显示全部楼层
    感谢楼主分享
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019.11.18 20:48
  • 签到天数: 12 天

    连续签到: 1 天

    [LV.3]偶尔看看II

    帝王蝶

    Rank: 4

    主题
    7
    奥币
    31
    积分
    462
    注册时间
    2016.4.7
    在线时间
    175 小时

    发表于 2019.11.21 10:09:18 | 显示全部楼层
    学习了,谢谢解析 分享
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    吃饭
    12 小时前
  • 签到天数: 30 天

    连续签到: 22 天

    [LV.5]常住居民I

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    477
    积分
    373
    注册时间
    2019.3.19
    在线时间
    7 小时

    活跃会员最佳新人


    发表于 2019.11.28 08:05:41 | 显示全部楼层
    这些图都好炫酷
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表