查看: 5163|回复: 4

如何鉴定sORFs编码多肽?

[复制链接]

管理员

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

主题
392
注册时间
2018.4.19
在线时间
896 小时

推广达人宣传达人


发表于 2019.4.29 10:19:30 | 显示全部楼层 |阅读模式
上一期我们提到了鉴定可翻译的sORFs主要从生物信息分析和实验方法两方面着手,并且详细介绍了利用生物信息分析的方法来挖掘潜在可能编码多肽的sORFs(具体请 戳这里查看)。


图1 鉴定可翻译的sORFs的三种方法[1] 目前检测sORFs翻译的多肽SEPs的手段主要包括基于高通量测序的翻译组测序ribo-seq和基于质谱检测的多肽组。今天我们先来介绍一下如何利用翻译组ribo-seq鉴定可翻译的sORFs。

Ribo-seq介绍
核糖体足迹测序(Ribosomefootprints profiling),简称Ribo-seq,是指利用RNA酶消化细胞中的RNA,得到被核糖体保护的正在翻译的RNA片段(ribosome footprints, RFs,长度约为30nt),然后对这些RFs进行富集、测序与分析。具体的实验流程如下图所示:


图2 ribo-seq实验流程图

从实验流程我们可以看出,实验捕获的不仅仅只是mRNA,所有正在翻译的RNA,只要是跟核糖体结合,都有可能被富集下来。这里面就包括了上两期我们所提到的可能潜在编码翻译为sPEPs的pri-miRNA、lncRNA和circRNA。
已有大量的研究报道从翻译组数据得到了未注释ORFs的翻译证据、甚至已知蛋白编码基因的可变翻译起始密码子和非AUG起始密码子。
Ribo-seq数据展示的就是与核糖体结合的正在翻译的RNA片段,我们通过将这些RNA片段比对参考基因组,就能获知除了蛋白编码基因外,还有哪些非编码RNA潜在具有翻译能力。
例如,下图展示了RFs在基因组上的分布,其中的"others"就有可能是比对到如lncRNA等的非编码基因上。


图3 RFs在基因组上的分布

下面我们以线性非编码RNA为例,介绍一下如何利用ribo-seq数据鉴定sORFs编码的多肽。 首先我们要先鉴定出lncRNA上的sORFs,并计算分析sORFs的核糖体印迹丰度。从所研究物种的参考基因组中提取所有已知lncRNA,检索所有潜在的sORFs,即检索所有起始密码子和终止密码子间的潜在开放阅读框。

然后通过软件bowtie2 将RFs reads比对到转录本序列,计算sORFs上的RFs丰度。如果一个sORF内有越高的RFs信号,则代表在这个区域有越多核糖体复合物停留,则其可以翻译为蛋白的可能性就越大。

然而,RNA上有核糖体结合(即有核糖体足迹RFs)并不一定代表可以翻译为稳定的功能蛋白,因为翻译本身可以有其他重要的调控作用,比如上游ORF(uORF)的翻译可以调控下游相应主开放阅读框(mORF)的翻译;核糖体的结合可能是来源于核糖体复合物在一段可翻译的RNA上滑动进行肽链合成而留下的瞬间足迹;另外,一些结构很复杂的RNA、或RNA-蛋白复合物很难被核酸酶切开,这些都可能是ribo-seq数据的背景噪音。

因此我们还需要进一步对sORFs的编码能力进行预测,去鉴别真正的翻译事件。 翻译过程中的RFs信号,会呈现一定的特性,例如:
(1)RFs信号应该符合三碱基节律的特性。即核糖体在RNA上的滑动翻译过程中,以三个碱基构成的密码子为单位进行停顿,信号会集中在一段RNA的ORF序列的主阅读框内(frame 1);
(2)核糖体在遇到ORF终止密码子后会从RNA上释放,因此RFs的信号在终止密码子后的3’UTR区会显著低于上游的CDS区。


图4 RFs的三碱基节律以及在3UTR区信号骤然降低

基于此,我们通过计算两个参数ORFscore和RRS来判断ncRNA序列上结合的RFs信号是否来自核糖体翻译信号。
ORFscore[2]是判断一个ORF内的RFs信号是否符合三碱基节律的方法。其根据RFs落在的主要读码框(frame),计算各个有RFs数据覆盖的ORF的ORFscore。RRS (Ribosome Release Score)是一种计算每个ORF的CDS区和下游UTR区翻译比值的方法[3]。RRS的计算公式为:
然后根据ORFscore和RRS两个参数的阈值来判定sORFs是否潜在可翻译。通常ORFscore超过6、RRS超过8,则判定该sORF潜在可翻译。


图5 ORFscore


图6 mORF与sORF的打分值分布

好了,介绍了那么多,大家都了解了如何利用ribo-seq数据鉴定潜在可翻译为功能多肽的sORFs了吗?基迪奥的线性非编码RNA编码流程,就是基于ribo-seq数据和序列特征的生物信息分析(具体方法请见上一期“如何鉴定sORFs编码多肽?(1)”)来鉴定可编码的线性非编码RNA。
另外,我们也还有针对环状RNA编码能力的分析流程,也是结合了序列特征的生物信息分析和ribo-seq数据,寻找可以比对到环状RNA junction位点的reads,这些reads潜在支持环状RNA翻译(具体请见“如何进行环状RNA编码能力分析?”)。所以,想研究sORFs编码多肽的老师,请毫不犹豫地联系我们的技术人员吧! 有了ribo-seq的翻译证据,还需要实实在在的蛋白合成证据,才能充分说明sORFs确实编码了功能多肽。下期,我们将介绍基于质谱检测的多肽组技术,敬请期待!

参考文献:
[1] Chugunova A , Navalayeu T , Dontsova O, et al. Mining for small translated ORFs[J]. Journal of Proteome Research,2017:acs.jproteome.7b00707.[2] Bazzini A A, Johnstone T G, Christiano R, et al. Identificationof small ORFs in vertebrates using ribosome footprinting and evolutionaryconservation[J]. The EMBO journal, 2014: e201488411.[3] Guttman M, RussellP, Ingolia N T, et al. Ribosome profiling provides evidence that largenoncoding RNAs do not encode proteins[J]. Cell, 2013, 154(1): 240-251.
本文作者:基迪奥小师妹
               

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

帝王蝶

Rank: 4

主题
4
注册时间
2018.8.23
在线时间
105 小时

活跃会员


发表于 2019.4.30 13:50:22 | 显示全部楼层
学习了
回复

使用道具 举报

帝王蝶

Rank: 4

主题
4
注册时间
2018.7.8
在线时间
22 小时

发表于 2019.5.6 20:05:44 | 显示全部楼层
图都看起来好漂亮
回复 支持 反对

使用道具 举报

帝王蝶

Rank: 4

主题
4
注册时间
2018.7.8
在线时间
22 小时

发表于 2019.5.6 20:34:57 | 显示全部楼层
回复

使用道具 举报

中华鲟

Rank: 5Rank: 5

主题
2
注册时间
2019.10.25
在线时间
31 小时

发表于 2019.12.6 08:13:41 | 显示全部楼层
谢谢小师妹分析
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表