课程-混合分组分析(BSA)专题——用好BSA并没那么简单


随着二代测序使用的普及,混合分组分析(BSA)的方法被大量使用。由于BSA只是一大类方法的统称,其实其包含了不同的方法。不同方法的实验设计与适用范围也有所不同(我们近期的微信文章也分享过相关的内容)。如果我们不做区分,也可能导致误用这些方法。主要内容包括:1)BSA分析常见策略的介绍和比较;2)使用BSA这个方法的注意事项。


随着二代测序使用的普及,混合分组分析(BSA)的方法被大量使用。一方面,我们可喜地看到,这个方法正在不断被优化,在基因定位中积极发挥着其作用;但另一方面,这个方法也常常被不当地使用,给用户带来了损失。主要体现在一些测序服务公司过度宣传,没有考虑BSA这个方法的局限,夸大其效果,导致用户难以得到预期的结果。同时,由于BSA只是一大类方法的统称,其实其包含了不同的方法。不同方法的实验设计与适用范围也有所不同(我们近期的微信文章也分享过相关的内容)。如果我们不做区分,也可能导致误用这些方法。



本期的腾讯课堂,我们将主要围绕以上的问题来展开,主要内容包括:

(1)BSA分析常见策略的介绍和比较;
将会围绕Mutmap、Mutmap+、QTL-seq、MMAPPR这几个文献已报道的主流方法进行介绍和比较
(2)使用BSA这个方法的注意事项
主要涉及的问题包括:BAS分析的关键逻辑是什么?实验和分析过程中的误差对结果有什么样的影响,我们应该如何规避。

交流时间:2016年4月27日下午4-5点



 问1:数量性状主效基因的效应有多大,可以用BSA?
答:一般建议主效基因的贡献度要大于30%,才考虑使用BSA。更弱的主效基因,使用BSA可能检测不到信号。


问2:林木,必须测亲本,是吗?
答:林木类的BSA如果使用拟测交策略,因为亲本本身就是杂合的,所以检测亲本也无法协助判断子代的DNA等位基因型分别来自哪个亲本。所以,检测不用测亲本,而是使用类似MMAPPR的策略实现基因定位。


问3:mmappr做林木比较好?
答:是的。因为林木亲本往往是杂合的。


问4:测DNA与RNA样品的区别,及各自的优缺点?
答:RNA 比较便宜,因为只是对编码区进行检测,所以是比较便宜;
但同时RNA也有几个缺点:1)一个是call SNP的可靠性;2)等位基因非等同表达带来误差;3)如果目标区域不在编码区的话,也会对结果带来干扰;4)有可能跟性状相关的基因不表达或者表达量非常低,也会导致检测不到。这是4个RNA的缺点,也正是DNA可以弥补的。


问5:拟测交指?
答:可以查阅相关文献,简单而言是两个杂合亲本杂交得到后代的杂交策略,广泛应用在林木和水产的育种领域。


问6:MutMap 不是滑窗分析法是么?
答:是说MutMap 一般不用固定窗口的滑窗分析方法分析,而是用连续N个SNP的方法滑窗。比如第1个到第10个计算一个均值,第2个到第11个计算一次均值,第3个到第12个,这种按照连续若干SNP来求均值。避免某个区域SNP太稀疏以后找不到SNP的问题。


问7:那固定窗口划窗分析和MutMap哪种比较好, 还有多倍体物种BSA是不是不大会准确?
答:这个具体问题具体分析,MutMap是用于突变体,普通材料应该用固定滑窗比较好,还是需要根据材料。
多倍体做BSA分析肯定效果不会太好,是因为多倍体call SNP会有许多错误。不过目前多倍体有参考基因组的物种太少,要么是小麦,或者是油菜。我们也做过小麦的BSA分析,效果还是可以的,小麦基因组装得虽然质量不太好,但是准确率还OK,所以实现BSA初定位是没有问题的。


问8:在玉米基因定位用BSA的多不多?混池提DNA主要注意什么?
答:目前在玉米物种见的基因定位案例较少,一是因为玉米基因组比较大,所以之前重测序比较贵的时候用这种方法比较少;二是因为玉米的基因组组装质量比较差, 所以效果比不上水稻拟南芥这些小基因物种。但从我们的项目经验来说,玉米做BSA如果材料良好,定位效果还是比较理想。另外混池DNA玉米没有特别要注意的,与其他物种类似。


问9:没有参考基因组的物种能否做BSA形状定位?
答:如果没有参考基因组物种我们不建议做BSA。
逻辑是虽然可以用简化基因组或rad -seq来开发标记来计算基因频率,但是如果没有参考基因组是没有办法做滑窗分析的,如果不做滑窗分析那么效果无法保证。如果没有参考基因组的物种坚持做BSA分析的话,那么研究的目标要设定为:找性状连锁标记,但是很难定位到基因的。


问10:人类遗传病易感基因的定位,怎么做BSA性状定位,怎么取材?
答:不建议做BSA,因为易感基因通常是数量性状,做GWAS更加合理一些,可以利用基因芯片或者其他相关技术来检测每个个体的基因型,来减少检测误差。所以不建议做混池,测单个个体会更稳定些。


问11:请问图中的红线和黑线95%置信区间是怎确定?
答:每一篇论文都有一个不同的模拟方法,基本原理是计算机随机模拟深度的随机分布的范围,找到极端阈值的置信区间。这种模拟并不是标准的统计学方法。但是在BSA分析的时候,可以找到基因频率最极端的1%或0.5%来定位是允许的。


问12:slaf-seq可以无参吗?
答:slaf-seq其实就是GBS方法的一种,GBS可以做无参的SNP检测,所以slaf-seq也可以做。


问13:如果两个基因池的差异性状包含两个,比如一个基因池内单株为红色果肉绿色果皮,另一个基因池内单株为黄色果肉白色果皮,这样的话利用BSA可以同时定位两个性状吗?

答:如果表型鉴定没有问题,那么结果可能会有两种情况。第一种情况,你能找到两个QTL,一个是与果肉相关的,一个是与果皮相关的;另外一种情况是,你可能只找到一个QTL,这个QTL会决定2个性状。所以如果表型没问题,那么这样设计实验室没有问题的。


问14:BSA分析相对于GWAS来说是不是假阳性较多,但是GWAS定位到的标记BSA也可以定位到吧
答:是的。我们可以认为BSA是GWAS或者家系个体的连锁分析的山寨型,或者阉割版的基因定位;所以理论上BSA分析能够找到的GWAS肯定能找到,另一方面GWAS能够找到那种微弱的QTL位点,很有可能BSA找不到。所以用BSA分析误差比较大,如果做BSA分析找到基因后,最理想情况是在目标连锁区域附近再找到一些marker,在这个群体中再个体验证一遍,相当于GWAS,这样更加可靠。所以GWAS应该更准确,找到的东西更多。 


直播须知
  • 1、请事先熟悉OmicShare在线交流课堂听课流程,注意开课时间,建议直播前半小时进入课堂,等待课程直播。
  • 2、建议首选联通、电信4M以上独享网络,上课时建议用网线非WIFI连接,避免直播卡顿,无法进入直播等情况。
  • 4、OmicShare直播课程视频仅供OmicSharez注册用户学习使用,未经OmicShare许可以拷贝、录屏、反向工程、技术下载等手段获取直播课程视频的行为构成侵权,OmicShare立即封号处理,并保留追究注册用户法律责任。
  • 5、如有问题可邮件omicshare@genedenovo.com或加入生物信息交流群QQ659344871,与OmicShare客服及时取得联系。

授课老师

周老师 金牌讲师

OmicShare在线课堂首席讲师,江湖人称“周老师”。有丰富的高通量测序数据挖掘经验,精通统计学、R语言、重测序等领域。

公告

暂无公告

最新学员