查看: 5828|回复: 13

[文献解读] WGCNA分析在高分文章中的应用

  [复制链接]
  • TA的每日心情

    2017.11.10 13:58
  • 签到天数: 353 天

    连续签到: 2 天

    [LV.8]以坛为家I

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    422
    奥币
    7537
    积分
    6612
    注册时间
    2015.11.23
    在线时间
    952 小时

    宣传达人优秀版主


    发表于 2017.10.17 10:57:41 | 显示全部楼层 |阅读模式
    随着测序技术不断进步,测序成本逐渐降低,越来越多的研究者开始设计多样本的RNA-seq研究。多样本可以分析多种条件下(比如多个组织部位,多种处理,多个时间点,多个采样点等)基因的表达变化,使科学研究的数据更充实,更系统,更有说服力。

    多样本自然也带来了大量的分组数据,传统的两两组间差异分析所需的工作量也就非常大,不利于高效的研究。此外,在系统生物学的研究中,一组基因通过表达关系形成了一个模块发挥基本的生物学功能,对这些模块的挖掘能够帮助我们系统地研究生物学过程。一些计算生物学相关算法(WGCNA,Markov Clustering,FUMET,MATISSE等)也因此被开发出来。
    权重基因共表达网络分析(Weighted gene co-expression network analysis,WGCNA)能够将复杂的数据进行归纳和整理,高效研究基因整体表达规律;同时能够系统地反馈样本中的基因间相互作用模式,帮助挖掘关键基因,预测基因功能,达到显著提高基因筛选的目的。因此,WGCNA在分析多样本的RNA-seq数据中发挥着重要的作用。

    具体分析流程如下(图1):

    • 建立基因间相互关系的无尺度网络;
    • 将表达模式相似的基因分为同一个模块(module);
    • 找到感兴趣的目标生物学模块;
    • 研究目标模块内部的基因调控关系;
    • 找到目标模块中的key drivers。


    图1. WGCNA分析流程

    下面我们来举个栗子,看一下WGCNA是如何应用在高分文章中。

    油菜干旱胁迫下mRNA表达模式研究


    文献下载:

    研究材料和样本设计

    • 干旱处理组和对照组油菜(图2)
    • 干旱处理期间12个时间点,两个生物学重复
    • 对48个样本进行RNA-seq,研究相关mRNA表达规律


    图2. 样本设计

    WGCNA分析内容

    • 将对照组和干旱胁迫组基因根据时间表达趋势变化分类成不同的表达模块(wM和dM),缩小筛选范围;
    • 分析和比较干旱胁迫与不同时间对基因表达的影响;
    • 将不同表达模块与植物生理表型关联起来;
    • 具体针对某个生理指标相关的模块内的基因,进行GO功能分析,挖掘关键基因。


    WGCNA结果展示

    1.共表达网络分析对照组和干旱胁迫组基因表达规律

    分别将对照组和干旱胁迫组基因分成17个(wM1−17)和20个(dM1−20)模块同一模块类的基因,在不同时间点表达模式一致,用相同颜色表示。干旱胁迫组多了3个模块,预示着有额外的调控模式存在。

    线性图分别展示对照组和干旱胁迫组中8个最大模块(包含80-85%基因数),以及不同时间点表达趋势变化(图3)。


    图3. WGCNA分析和聚类不同时间点表达一致的基因

    2.分析和比较干旱胁迫与不同时间对基因表达的影响

    热图显示不同时间点转录本表达变化比不同处理组间要大,与前人的报道一致,说明基因表达随时间的影响高于处理压力(图4A)。比较对照组和干旱胁迫组每个模块中相同的基因数,发现两个共表达网络间存在一致性,说明干旱处理对油菜转录本表达的影响小于不同时间点的变化(图4B)。


    图4. 对照组和干旱胁迫组不同时间点和模块间基因表达研究

    3.表达模块与植物生理指标关联

    首先对每个样本的生理学指标(A, gs, NSC和Fv’/Fm’)在不同时间点取平均值,再利用WGCNA将module eigengenes(ME)的显著性值与这些指标关联。能够发现它们之间的正负相关性,例如wM5,wM11,wM16,dM5和dM10中呈现正相关;而wM7,wM10,wM12,dM6和dM8与A, gs, NSC,和Fv’/Fm’呈现显著负相关(图5A-B)。这些指标的相关性显著暗示可以作为早期干旱的监测因子。


    图5. 模块基因与植物生理指标关联

    4.对相关模块基因进行功能富集分析

    作者继续深入研究气孔传导gs正相关的模块进行GO功能富集,分析top 10 富集的GO categories。dM1模块主要生物学功能为primary metabolism和response to abiotic stimulus;dM5与photosynthesis, response to light和abiotic stress stimulus相关;dM10参与 lucosinolate biosynthesis and metabolism(Figure 6B-C)。利用共表达网络可以挖掘一些与干旱相关的hub gene,例如C-repeat-binding factor (CBF)调控基因COR15B,COR47;EARLY LIGHT-INDUCIBLE PROTEIN 1 and 2(ELIP1/2)等。


    图6. 模块基因进行功能富集分析


    总结

    增加取样点,增大样本量能够提高数据的准确性,更真实地反应生物学进程,也是提升文章档次最简单有效的方法,本文作者研究干旱处理对油菜的影响,选取了12个时间点,总共48个样本进行RNA-seq,得到了丰富的基因表达数据。

    WGCNA是基于相关系数的表达网络调控分析,当样本数过低的时候,相关系数的计算是不可靠的,所以推荐的样本数如下:
    • 当独立样本 ≥ 8(非重复样本)时,可以考虑基于Pearson相关系数的WGCNA共表达网络方法;
    • 当总样本数 ≥ 15(可以包含生物学重复)时,WGCNA会得到更好的效果。


    本文中,作者将模块的特征值与植物生理指标相关联,分析得到与A、gs、NSC和Fv’/Fm’等感兴趣的指标显著相关的模块,进而对模块内基因进行GO富集和共表达研究找到了一些hub gene。

    总之,这是一篇利用WGCNA将基因表达与生理表型特征相关联的植物多样本案例。WGCNA的应用是灵活多样的,除了分析mRNA时空、性状相关等表达规律外,还可以对ncRNA(lncRNA,miRNA),ncRNA−mRNA形成的gene pairs进行分析,具体案例请持续关注本公众号。


    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    有问题请发贴提问
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    2019.10.29 14:32
  • 签到天数: 735 天

    连续签到: 1 天

    [LV.9]以坛为家II

    版主

    Rank: 10Rank: 10Rank: 10

    主题
    23
    奥币
    3461
    积分
    1219
    注册时间
    2015.12.29
    在线时间
    216 小时

    突出贡献优秀版主


    发表于 2017.10.19 09:28:01 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    害羞
    6 天前
  • 签到天数: 712 天

    连续签到: 1 天

    [LV.9]以坛为家II

    迅猛龙

    Rank: 8Rank: 8

    主题
    26
    奥币
    4132
    积分
    1760
    注册时间
    2016.1.8
    在线时间
    425 小时

    发表于 2017.10.22 21:30:17 | 显示全部楼层
    哇哦
    回复

    使用道具 举报

  • TA的每日心情
    yes!
    2018.12.28 09:19
  • 签到天数: 28 天

    连续签到: 1 天

    [LV.4]偶尔看看III

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    9
    积分
    69
    注册时间
    2017.8.18
    在线时间
    11 小时

    发表于 2017.10.31 14:58:24 | 显示全部楼层
    谢谢分享~
    回复

    使用道具 举报

  • TA的每日心情

    2019.12.6 13:57
  • 签到天数: 42 天

    连续签到: 1 天

    [LV.5]常住居民I

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    487
    积分
    138
    注册时间
    2017.11.5
    在线时间
    22 小时

    发表于 2017.11.16 12:46:57 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    昨天 09:21
  • 签到天数: 955 天

    连续签到: 1 天

    [LV.10]以坛为家III

    中华鲟

    Rank: 5Rank: 5

    主题
    1
    奥币
    2458
    积分
    520
    注册时间
    2016.5.20
    在线时间
    187 小时

    发表于 2017.12.23 09:33:51 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    吃饭
    2018.4.16 11:44
  • 签到天数: 429 天

    连续签到: 1 天

    [LV.9]以坛为家II

    中华鲟

    Rank: 5Rank: 5

    主题
    14
    奥币
    1423
    积分
    633
    注册时间
    2016.1.4
    在线时间
    209 小时

    发表于 2018.1.6 10:25:23 | 显示全部楼层
    请问老师,当样本数量是“独立样本为 8“这种情况时,在计算基因间表达量相关性时,是在脚本的哪一步将算法改成基于Pearson相关系数的WGCNA分析方法呢?在正常情况是,WGCNA算法是依据spearman相关性做得嘛?谢谢老师
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018.1.16 08:48
  • 签到天数: 5 天

    连续签到: 1 天

    [LV.2]偶尔看看I

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    318
    积分
    87
    注册时间
    2017.6.6
    在线时间
    69 小时

    发表于 2018.1.7 10:40:25 | 显示全部楼层
    简直太棒了,福音啊
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018.10.3 18:34
  • 签到天数: 8 天

    连续签到: 1 天

    [LV.3]偶尔看看II

    草履虫

    Rank: 2

    主题
    0
    奥币
    68
    积分
    34
    注册时间
    2018.1.26
    在线时间
    3 小时

    发表于 2018.1.26 04:44:43 | 显示全部楼层
    额,小白问题,图4图5这种图,都是用啥画的。。。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    忙~
    2018.11.1 10:48
  • 签到天数: 18 天

    连续签到: 3 天

    [LV.4]偶尔看看III

    钵水母

    Rank: 3Rank: 3

    主题
    1
    奥币
    68
    积分
    64
    注册时间
    2017.11.16
    在线时间
    14 小时

    发表于 2018.9.13 20:54:09 | 显示全部楼层
    算上生物学重复就9个样本,是不是没必要做WGCNA的分析?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    忙~
    2020.1.15 09:39
  • 签到天数: 5 天

    连续签到: 2 天

    [LV.2]偶尔看看I

    钵水母

    Rank: 3Rank: 3

    主题
    0
    奥币
    4
    积分
    71
    注册时间
    2019.12.21
    在线时间
    3 小时

    发表于 2020.1.10 15:36:27 | 显示全部楼层
    感谢楼主分享!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    yes!
    2020.1.10 11:08
  • 签到天数: 2 天

    连续签到: 1 天

    [LV.1]初来乍到

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    236
    积分
    314
    注册时间
    2019.11.21
    在线时间
    10 小时

    发表于 2020.2.6 11:19:15 | 显示全部楼层
    学习
    回复

    使用道具 举报

  • TA的每日心情
    no
    昨天 15:16
  • 签到天数: 7 天

    连续签到: 1 天

    [LV.3]偶尔看看II

    钵水母

    Rank: 3Rank: 3

    主题
    1
    奥币
    0
    积分
    22
    注册时间
    2019.5.9
    在线时间
    6 小时

    发表于 2020.2.13 11:07:17 | 显示全部楼层
    厉害了
    回复

    使用道具 举报

  • TA的每日心情

    昨天 10:52
  • 签到天数: 15 天

    连续签到: 2 天

    [LV.4]偶尔看看III

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    225
    积分
    318
    注册时间
    2020.1.16
    在线时间
    7 小时

    发表于 昨天 11:33 | 显示全部楼层
    学习
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表