查看: 4057|回复: 2

如何鉴定sORFs编码多肽?(3)

[复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
392
注册时间
2018.4.19
在线时间
896 小时

推广达人宣传达人


发表于 2019.5.8 09:27:43 | 显示全部楼层 |阅读模式
上两期我们介绍了利用生物信息分析的方法来挖掘潜在可能编码多肽的sORFs(具体请戳这里)、然后利用翻译组ribo-seq的方法寻找sORFs的翻译证据(具体请戳这里)。预测出某条sORF潜在可能翻译,并且有了基因上的翻译证据。那么该sORF真的能翻译为功能多肽吗?这时候,我们就需要利用质谱技术对该sORF的合成蛋白进行检测。检测到蛋白多肽表达,才能确确实实证明该sORF真的可以编码为功能多肽。
利用质谱方法对sORFs编码的多肽(SEPs)进行直接的检测是能证明sORFs可翻译的最直接证据。然而这并没有想象中的简单。


因为对这些小分子多肽进行质谱检测,存在着不少困难:
(1)由于SEPs很小、分子量低,可能没有蛋白酶消化的位点,或者不能消化为能够被质谱仪检测到的肽段;
(2)SEPs一般丰度很低,在常规的蛋白质组质谱检测中会被高丰度的大分子蛋白影响从而检测不到;
(3)一般我们通过比对蛋白数据库来鉴定肽段和蛋白,而常用的蛋白数据库并不含有由sORF这些“非编码”序列编码的SEPs。 因此,我们应该利用针对10kDa以下多肽的“多肽组学”来对这些SEPs进行检测。今天我们就来介绍一下多肽组学,这个从蛋白质组学分支出去的新生组学。

多肽组学(Peptidomics)的研究对象是100个氨基酸(<10kDa)以下的小肽。一般10kDa以上的我们称为蛋白质,利用常规的蛋白质组来检测就可以了。然后多肽组学的检测范围又可以细分为0.5-3kDa和3-10kDa,目前质谱技术无法检测0.5kDa以下的肽段。 那么,回顾上面提到的利用质谱技术检测小分子多肽的困难,多肽组学是怎样解决的呢?
(1)由于SEPs很小、分子量低,可能没有蛋白酶消化的位点,或者不能消化为能够被质谱仪检测到的肽段:
一般来说,3kDa以上的小肽,我们会用胰蛋白酶(trypsin)进行酶解,所以只要该小肽含有合适酶切的赖氨酸或精氨酸酶切位点,做多肽组质谱鉴定是没什么问题的。

大部分情况下,用胰蛋白酶就能切开绝大部分多肽。但是如果关注的特殊蛋白没有合适的胰酶酶解位点,那么可以试着用其他的蛋白酶,如LysC、GluC等来进行酶解的优化。
对于3kDa以下的小肽,一般不需要酶切,直接检测就可以了。

(2)SEPs一般丰度很低,在常规的蛋白质组质谱检测中会被高丰度的大分子蛋白影响从而检测不到:
所以我们需要对100aa以下的多肽进行富集。这个跟做修饰蛋白一个道理,因为发生修饰的蛋白的比例在总蛋白中很少,所以需要将其富集起来再进行检测。
多肽富集的方法一般有超滤管和柱子。如Millipore的超滤管,分了3kDa和10kDa的,老师可以根据研究对象的分子量范围来选择。
将样品加到超滤管中,然后14000 g离心10-30min(根据分子量),收集下层流出液体,接着进行酶解和LC-MS/MS检测就可以了。

(3)一般我们通过比对蛋白数据库来鉴定肽段和蛋白,而常用的蛋白数据库并不含有由sORF这些“非编码”序列编码的SEPs:
蛋白的鉴定依赖于数据库。而目前常用的蛋白数据库如Uniprot、Ensemble等收录的是100aa以上的蛋白质,这是由于一直以来人们认为蛋白编码基因是指编码100个氨基酸以上的基因,所以100aa以下的小肽自然就被过滤掉了。
因此,多肽组学所用的数据库比较特别。上两期我们介绍了目前已经有一些专门的sORF数据库了,如sORFs.org、RPFdb、ARA-PEPs。如果我们研究的是拟南芥,那么可以用ARA-PEPs数据库来鉴定多肽。
但一般情况下,我们建议自己去构建一个虚拟蛋白库。利用所研究物种的基因组中的非编码RNA的sORF翻译而来的蛋白序列作为数据库,来鉴定sORF编码的多肽。具体做法如下:
① 线性非编码区sORF和环状RNA ORF注释:
对于线性转录本,从参考基因组的转录本序列的非编码区中搜索长度在20-150个氨基酸(450nt)的潜在sORF;对于环状RNA,利用脚本对已知circRNA进行ORF注释,输出跨circRNA接口位置的cORF。然后将这些注释到的sORF和cORF翻译成氨基酸序列。
② 与已知蛋白库进行合并,进行搜库鉴定:
将第一步得到的sORF蛋白库与该物种的已知蛋白库进行合并,对多肽组结果进行搜库鉴定。
③ 搜库结果过滤:
搜库得到的结果,可以从下面维恩图展示。包含了从已知蛋白库中鉴定到的,以及从sORF蛋白库中鉴定到的。首先我们去掉鉴定到已知蛋白库的肽段,因为我们的研究对象sPEP是不存在于已知蛋白数据库中的。然后这两个数据库鉴定的结果会有交集,这是因为有一些多肽是由大分子量蛋白质水解而来的,这些并不是我们想要的sPEP,所以需要过滤掉。因此最后我们只保留由sORF蛋白库特异鉴定到的多肽。


上述三步也就是利用基于质谱的多肽组学鉴定sORF编码的多肽的步骤了。为了得到更严谨的实验结果,即既有翻译证据又有蛋白证据,我们最后需要将基于线性非编码RNA编码流程和/或环状RNA编码流程里的结果与多肽组鉴定的结果取个交集,也就是如下面维恩图所示:



维恩图交集部分就是最后得到的可靠性高的sORF编码的多肽。这些多肽是利用了生物信息学预测、ribo-seq测序分析、以及多肽组检测三种方法验证而来的,准确度较高。 整个sORF编码多肽的分析和鉴定流程如下图所示:


这个方法流程结合了ribo-seq和多肽组,一方面我们可以从两个维度去证明sORF可翻译;另一方面也结合了测序技术和质谱技术的优点。
由于测序方法更灵敏,因此ribo-seq可以鉴定出大量的sORFs,包括那些由于翻译的蛋白丰度很低而质谱仪检测不出来的sORFs;而质谱技术由于更倾向于检出丰度高的蛋白,因此检测出的多肽更有可能是有功能的。

基迪奥可为您提供这一整套的sORF编码多肽分析与鉴定服务,所以如果想开拓研究新领域,冲击高分杂志,请联系我们吧!

得到这些目标小肽后,怎样验证这些小肽的真实存在?怎样进行功能和机制研究?请持续关注我们下一期的内容讲解!与您不见不散!

拓展阅读
多肽的种类与生物学功能
sORF编码的功能多肽来自哪里?
如何鉴定sORFs编码多肽?(1)
如何鉴定sORFs编码多肽?(2)

参考文献:
[1] Hsu P Y , Benfey P N . TitSmall butMighty: Functional Peptides Encoded by Small ORFs in Plants[J]. PROTEOMICS,2017:1700038.[2] Slavoff S A , Mitchell A J , Schwaid AG , et al. Peptidomic discovery of short open reading frame-encoded peptides inhuman cells.[J]. Nature Chemical Biology, 2013, 9(1):59.

本文作者:基迪奥小师妹

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

帝王蝶

Rank: 4

主题
3
注册时间
2019.3.2
在线时间
156 小时

发表于 2019.5.8 10:53:19 | 显示全部楼层
支持支持
回复

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
2
注册时间
2019.10.25
在线时间
31 小时

发表于 2019.11.5 09:03:52 | 显示全部楼层
感谢楼主分享
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表