基因组选择技术
在畜禽育种中的应用
基因组选择(genomic selection, GS)是对传统遗传评估技术的一次重大革新,利用覆盖全基因组的高密度遗传标记计算个体的基因组估计育种值(genomic estimated breeding value, GEBV)。与传统基于系谱信息的估计育种值(estimated breeding value, EBV)相比,GEBV通常能获得更高的估计准确性。由于GEBV计算可以不依赖系谱记录和表型信息,这就为早期选择提供了可能,可以大幅度缩短世代间隔,提高遗传进展,降低农业动物的育种成本。此外,对于传统育种受限的性状,如低遗传力的性状和难以测量的性状,GS也更加具有优势。
01 基因组选择实施步骤
GS一般包括以下步骤:首先建立参考群体(reference population),参考群体中每个个体都有已知的表型和基因型,通过合适的统计模型可以估计出每个SNP或不同染色体片段的效应值;然后对候选群体(candidate population)每个个体进行基因分型,利用参考群体中估计得到的SNP效应值来计算候选群体中每个个体的GEBV;最后,根据GEBV排名对个体进行选留,待选留个体(selected candi-dates)完成性能测定后,这些个体又可以被放入参考群体,用于重新估计SNP的效应值,如此反复。
02 基因组选择研究热点
随着商业化高密度SNP芯片的普及和二代测序价格的下降,GS越来越多被应用于农业动植物的育种实践中。尽管如此,基因分型成本仍然是GS技术推广和应用的重大障碍,大多数育种企业限于长久的基因分型成本投入而不敢大规模应用。多数已开展GS研究的研究院所或企业也囿于基因分型方面的投入,不得不通过缩小参考群体规模或降低标记密度来降低成本。较小的参考群或较低的标记密度一定程度上影响了GEBV的准确性,从而低估了GS技术在动物育种中的潜力,反而阻碍了这一技术的推广和应用。因此,降低个体分型费用一直是GS的研究热点之一。
GS技术的另一个重要研究方向是如何针对性状本身的遗传特点,合理选择最优的模型和算法来提高GEBV估计准确性。常用的基于单点SNP标记的GEBV估计方法主要分两类:一类是基于估计等位基因效应来计算GEBV,如最小二乘法、随机回归-最佳线性无偏预测(ridge regression best linear unbiased prediction, RR-BLUP)、贝叶斯方法等;第二类是采用SNP标记构建基因组关系矩阵(genomic relationship matrix, GRM或G矩阵),然后采用线性混合模型估计GEBV,如基因组最佳线性无偏预测法(genomic best linear unbiased prediction, GBLUP)、一步法GBLUP。这两类方法均有各自的优缺点,对于不同性状会有不同的效果。随着基因分型个体数极大累积或标记密度极大提高,传统基于单点SNP信息的统计模型无法利用所有个体表型数据或所有标记位点信息,此时基于单倍型的GEBV预测模型可以解决这一问题。通过将已知功能的基因组学信息,包括基因结构、甲基化区域、转录因子调控结合位点、选择信号候选区域等信息,以单倍型信息整合进GEBV预测模型,从而提高GEBV的准确性。
03 基因组选择在奶牛育种中的应用
GS在奶牛育种中的应用领先于其他畜禽。由于奶牛个体育种价值大,群体组织好,数据记录完善,而且传统的奶牛育种完全依赖于后裔测定对种公牛进行遗传评估,使得世代间隔较长(达53~70个月),采用GS可准确地预测青年公牛种用价值,使世代间隔缩短为21个月(如图),因此GS在奶牛育种中具有巨大的应用价值。
从2008年开始,主要几个奶业发达国家,包括新西兰(2008年)、美国(2009年)、加拿大(2009年)、德国(2009年)、澳大利亚(2011年)、意大利和瑞士(2011年),开始将GS应用到遗传评估中。除此之外,这些国家间还不断寻求合作以建立区域化的奶牛GS育种体系,如2008年美国、加拿大、意大利组成的北美奶牛育种体系以及2010年比利时、丹麦、芬兰、法国、德国、荷兰和瑞典联合形成的欧洲奶牛育种体系。区域化的奶牛GS育种体系使得参考群体规模迅速扩大,GS选择准确性逐渐提高,大大促进了GS技术在奶牛育种中的普及。除了常规的产奶量和乳脂率等性状,奶牛GS研究也开始关注一些常被忽视但非常有应用潜力的性状,如肢蹄健康、饲料转化率和甲烷排放量等。我国于2008年开始启动奶牛GS研究,2012年正式将GS技术应用于荷斯坦奶牛的遗传评估中,评估的性状共14个,包括产奶量、体细胞计数、体型评分等,其中产奶性状基因组预测准确性为0.59~0.76,比传统BLUP方法提高了0.13~0.30。
目前,奶牛GS的参考群体一般由经后裔测定和基因型测定的验证公牛组成。除了通过区域合作扩大参考群体外,对母牛进行基因型测定,也是扩大参考群体的一条重要途径。随着高密度SNP芯片和二代测序成本的下降,将来所有母牛可能进行基因型测定。Buch等使用验证公牛与经基因型测定的女儿构建参考群体,结果表明GS的准确性比仅使用验证公牛时要高。
GS作为一种新的畜禽遗传评估方法,比传统BLUP方法有明显的优势。随着基因分型成本的下降,GS技术有望在国内大型育种公司中应用普及。由于已有的SNP芯片在特定群体中多态性差,越来越多的研究和应用开始使用自定制高密度SNP芯片,如猪的PorcineSNP55K芯片,在肉鸡、肉牛和蛋鸡等物种中也有相应报道。随着二代测序价格的下降,基于二代测序技术的GS优势日趋明显,有望在5~10年内替代高密度SNP芯片,成为GS应用的主要分型手段。基于二代测序的GS技术主要面临的是分型准确性和分析时效性的问题,分型准确性可以通过优化测序方案和基因型填充策略来提高;而数据分析的时效性需要借助于自动化/智能化分析流程的建立以及基于“硬件加速”技术的软件开发。随着基因分型个体数极大累积或标记密度极大提高,当前常用的基于单点SNP的GEBV估计模型将具有局限性,基于单倍型信息的统计模型可能会成为未来的研究方向。除此之外,在统计模型中增加显性效应、上位效应和印记效应的应用会越来越多。最后,借助目前智能化农牧设备开发的热潮,应该尽快将GS应用从“育种场→实验室→育种场”的所需样品收集、表型测定、数据分析、个体选留等流程整合进入常规育种生产中,加快GS在动物育种中的应用。
文章来源:
谈成, 边成, 杨达, 等. 2017. 基因组选择技术在农业动物育种中的应用. Hereditas (Beijing), 39(11): 1033―1045