查看: 4482|回复: 9

求指导Pfam搜库结果查看

[复制链接]

该用户从未签到

钵水母

Rank: 3Rank: 3

主题
3
奥币
415
积分
26
注册时间
2016.2.24
在线时间
10 小时

发表于 2016.2.25 09:22:41 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
Pfam搜库后结果中有hmm name/Type/,其中Type中包含family和domain,请问如果是domain是指这一个结构域不能确定是哪个家族的意思吗?family是指这一个结构域就可以确定是某个家族的吗?具体什么意思求指导,谢谢


回复

使用道具 举报

  • TA的每日心情

    2017.1.13 09:10
  • 签到天数: 23 天

    连续签到: 1 天

    [LV.4]偶尔看看III

    钵水母

    Rank: 3Rank: 3

    主题
    6
    奥币
    775
    积分
    137
    注册时间
    2015.11.24
    在线时间
    13 小时

    发表于 2016.2.25 09:49:31 | 显示全部楼层
    http://pfam.xfam.org/help
    可以看看pfam的说明,domain应该是确定的结构域,family是相同功能的蛋白序列多序列比对得到的结果~
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    钵水母

    Rank: 3Rank: 3

    主题
    3
    奥币
    415
    积分
    26
    注册时间
    2016.2.24
    在线时间
    10 小时

     楼主| 发表于 2016.2.25 10:04:08 | 显示全部楼层
    请问domain和family不都是多序列比对的结果吗?domain是确定的结构域,但是没有确定属于哪个家族?是说这个结构域不确定属于哪个家族吗?
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    帝王蝶

    Rank: 4

    主题
    0
    奥币
    988849
    积分
    287
    注册时间
    2015.12.21
    在线时间
    69 小时

    突出贡献优秀版主论坛元老


    发表于 2016.2.25 15:57:35 | 显示全部楼层
    这里的family和protein family是没有关系的,具有相同domain的蛋白集合当然也可以说是一个蛋白家族,这里的family只是一个分类名称。搜索pfam,主要看注释到什么功能。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    钵水母

    Rank: 3Rank: 3

    主题
    3
    奥币
    415
    积分
    26
    注册时间
    2016.2.24
    在线时间
    10 小时

     楼主| 发表于 2016.2.29 10:52:30 | 显示全部楼层
    hongshm 发表于 2016.2.25 15:57
    这里的family和protein family是没有关系的,具有相同domain的蛋白集合当然也可以说是一个蛋白家族,这里的 ...

    请问我看文献上说domain和family是equivalently,居然没有什么关系,为什么不都用成family一种类型表示呢?谢谢
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    忙~
    2019.12.12 09:00
  • 签到天数: 105 天

    连续签到: 1 天

    [LV.6]常住居民II

    管理员

    Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

    主题
    47
    奥币
    6567
    积分
    4963
    注册时间
    2015.12.5
    在线时间
    515 小时

    活跃会员论坛元老


    发表于 2016.3.1 17:56:06 | 显示全部楼层
    其实从分析结果的使用来看,你不用太纠结于family 和 domain的区别。
    一、首先,我们要理解pfam工作的原理
         pfam 是个数据库,其序列比对使用的是HMMer算法的原理(好像是作者的名字里面带着锤子这个单词,于是就使用了这个简写,寓意是锤子比爆炸(blast)更靠谱)。HMMer工作有三个步骤:
    (1)找到一组相关的蛋白(一般是基因家族)进行多序列比对;
    (2)从序列比对的结果中,找到这组多序列比对的结果中包含哪些保守的区域。所以结构域的定义是来源于这一步。在这一步如果输入大量蛋白家族,可以建立大量蛋白结构域的数据库;注意:某一结构域并不是一条确定的序列,而是可以允许简并性。即一个位点,可以允许存在不同类型的氨基酸。
    (3)如果你想评估某一段新的功能未知的序列潜在有什么功能。那么,就将这段序列与结构域数据库进行比对。最终,从这段序列中包含的结构域种类,推断这段序列的功能。

    二、pfam这种分析的逻辑的优势是什么
      相比blast这样的两两比对,pfam这种分析的逻辑优势在于:
    (1)结果更简洁。因为当参考数据库中存在大量冗余的同源蛋白,那么分析结构域(从基因家族的数据中整理得到)显然比分析比较单一的序列更具有代表性,更加简洁;
    (2)更富有生物学意义。因为蛋白的功能很大程度上由结构域决定的。blast仅仅告诉我们哪个区段相似,但不知道相似区段有什么功能。但pfam的结果,是以结构域为单位,从结构域我们可以更加精确的推导蛋白功能;
    (3)对于一些进化关系较远的同源蛋白,其序列相似度较低。如果使用两两比较的blast,可能无法找到它们间的同源性。Hammer采用先找结构域(允许简并性),再进行同源查找的搜索策略。这种搜索方式对于相似度较低的同源蛋白更加敏感。

    如果你关心以上两点问题,附件的两个文件可以看看(一个PPT,另一个是Pfam 1997年发表的第一篇文章)。

    三、pfam中对结构域的定义。
       如同以上第一点说的,结构域的定义来源Hammer软件第一步和第二步的分析。pfam对结构域的定义,本质上是在说明一个问题:在第一步输入的蛋白序列集合是否靠谱,找到的结构域是否有代表性。从pfam官网的说明来看,结构的定义主要分为以下几种:
    • Family: A collection of related proteins
    • Domain: A structural unit which can be found in multiple protein contexts
    • Repeat: A short unit which is unstable in isolation but forms a stable structure when multiple copies are present
    • Motifs: A short unit found outside globular domains

       我的理解是,Family是来源于确定的蛋白家族分析,得到的功能结构域。Domain是来源多序列比对的保守结构域,但这些输入的序列不一定属于一个基因家族。Repeath 和 Motifs 往往是一些相对比较短的保守区域。
       但是,随着pfam数据库的数据越来越多,其实这些分类也变得不是那么严谨。一些本该是repeat 或 Domain的序列,也被标注为了family。所以我认为不用纠结于一个结构域到底是分类为family、Domain 还是 Repeat。重要的是了解这个结构域的注释,这个结构域有什么生物学功能,以便对蛋白的功能进行预测。
       以上的观点,也来源于以下的这个论坛,如果你感兴趣可以看看。
       http://www.cgl.ucsf.edu/home/meng/grpmt/domains

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    钵水母

    Rank: 3Rank: 3

    主题
    3
    奥币
    415
    积分
    26
    注册时间
    2016.2.24
    在线时间
    10 小时

     楼主| 发表于 2016.3.2 09:43:54 | 显示全部楼层
    基迪奥-周煌凯 发表于 2016.3.1 17:56
    其实从分析结果的使用来看,你不用太纠结于family 和 domain的区别。
    一、首先,我们要理解pfam工作的原理
    ...

    非常感谢周老师,比之前理解的好多了,谢谢
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    吃饭
    昨天 23:58
  • 签到天数: 1272 天

    连续签到: 9 天

    [LV.10]以坛为家III

    功夫熊猫

    Rank: 10Rank: 10Rank: 10

    主题
    1
    奥币
    18831
    积分
    3531
    注册时间
    2016.4.25
    在线时间
    791 小时

    灌水之王


    发表于 2016.5.12 14:08:16 来自手机 | 显示全部楼层
    学习了,
    回复

    使用道具 举报

  • TA的每日心情
    yes!
    2020.1.7 16:33
  • 签到天数: 61 天

    连续签到: 2 天

    [LV.6]常住居民II

    中华鲟

    Rank: 5Rank: 5

    主题
    2
    奥币
    810
    积分
    867
    注册时间
    2019.10.25
    在线时间
    29 小时

    发表于 2019.12.7 07:56:36 | 显示全部楼层
    支持楼主一下子
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    yes!
    2020.1.7 16:33
  • 签到天数: 61 天

    连续签到: 2 天

    [LV.6]常住居民II

    中华鲟

    Rank: 5Rank: 5

    主题
    2
    奥币
    810
    积分
    867
    注册时间
    2019.10.25
    在线时间
    29 小时

    发表于 2019.12.9 07:44:20 | 显示全部楼层
    过来看大神回答的
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表