一种多品种基因组联合遗传评估方法、设备及存储介质
- 国知局
- 2024-09-11 14:14:56
本发明涉及基因组预测,尤其涉及一种多品种基因组联合遗传评估方法、设备及存储介质。
背景技术:
1、基因组预测是一种利用整个基因组的遗传标记来获得基因组估计育种值(genomic estimated breeding values,gebvs)的方法,gebvs可以利用基因组信息来量化估计个体在育种方面的潜在价值。在基因组预测中获得预测准确性的关键在于构建一个具有基因型和表型信息的参考群体,基于参考群体的信息,预测只有基因型信息的群体的gebvs。
2、基因组预测在动植物育种中获得了显著成效,然而对于小规模品种,由于种群规模有限,从而难以建立一个足够大的基因组预测参考群体。另外,即便种群规模足够大,亦存在需要选育一些难以测定或者测定成本高昂的性状(如屠宰或饲料效率性状)的情况,同样存在难以建立足够规模的参考群的问题。在这些情况下,由于参考群体规模有限,导致gebvs预测准确性下降。当目标品种的参考群体相对较小时,通常利用多个品种的信息建立足够规模的参考群进行基因组预测(multi-breeding group prediction,mbgp)。
3、现有技术中,mbgp一般将不同的品种视为单个纯种群体,并应用常见的单性状模型,然而,由于品种之间存在连锁不平衡(linkage disequilibrium,ld)相位和等位基因频率的差异,简单地合并不同品种并不一定能获得更高的预测准确性,相反地,还可能会使得联合多品种的基因组预测的准确性与品种内基因组预测相比更低。
4、多性状模型提供了一种更为准确的基因组预测方式,通过将不同品种的相同性状视为同一品种的不同但可能存在遗传相关的性状,可以灵活考虑品种之间性状的遗传相关程度。然而,现有技术中的多性状模型,通常假设基因型标记的效应在整个基因组不同位置上的是相同的,但是这一假设与当前的多品种联合关联分析结果不符,基因在不同品种基因组上的分布差异表明品种之间在不同基因组块上的遗传关联程度存在变化,导致多性状模型的预测准确率不佳。
5、因此,在联合多品种基因进行基因组预测的情况下,如何充分考虑品种的基因效应差异,提高基因组预测的准确性是亟需解决的问题。
技术实现思路
1、本发明提供一种多品种基因组联合遗传评估方法、设备及存储介质,用以解决现有技术中上述缺陷。
2、本发明提供一种多品种基因组联合遗传评估方法,包括:
3、获取先验分布参数,根据所述先验分布参数构建多品种联合评估模型,所述先验分布参数包括品种对应的各个基因组区块中各个基因型标记的先验效应方差;
4、获取多品种参考群信息;
5、根据所述多品种参考群信息以及所述先验分布参数,获取后验分布参数,所述后验分布参数包括全部品种的各个基因组区块中各个基因型标记的后验效应方差;
6、根据所述后验分布参数配置所述多品种联合评估模型;
7、其中,所述多品种联合评估模型用于根据输入的基因型信息获取预测表型信息,所述预测表型信息用于获取基因组估计育种值。
8、根据本发明提供的一种多品种基因组联合遗传评估方法,所述多品种参考群信息包括基因型信息以及表型信息;在所述根据所述多品种参考群信息以及所述先验分布参数,获取后验分布参数之前,还包括:
9、根据所述基因型信息,获取基因型标记之间的连锁不平衡度量值;
10、根据所述标记间的连锁不平衡度量值,计算假定断点连锁值,所述假定断点连锁值表征以所述基因型标记的位置为断点获得的两个基因组片段之间的连锁程度;
11、根据所述假定断点连锁值,获取区块划分实际断点;
12、根据所述区块划分实际断点,对所述基因型信息中的基因组进行划分形成基因组区块。
13、根据本发明提供的一种多品种基因组联合遗传评估方法,所述根据所述假定断点连锁值,获取区块划分实际断点,包括:
14、根据各个所述基因型标记的所述基因型标记的位置顺序以及所述假定断点连锁值,形成假定断点连锁向量;
15、利用三次样条函数对所述假定断点连锁向量进行插值处理,形成假定断点连锁平滑向量;
16、根据所述假定断点连锁平滑向量,确定极小值对应的位置作为所述区块划分实际断点。
17、根据本发明提供的一种多品种基因组联合遗传评估方法,所述多品种参考群信息,包括目标品种的第一基因型信息和第二表型信息以及辅助品种的第二基因型信息、第二表型信息和缺失表型信息;所述根据所述多品种参考群信息以及所述先验分布参数,获取后验分布参数,包括:
18、根据所述第一基因型信息、所述第一表型信息、所述第二基因型信息以及所述第二表型信息,生成抽样表型信息,所述抽样表型信息与所述缺失表型信息对应相同性状;
19、根据所述第一基因型信息、所述第一表型信息、所述第二基因型信息、所述第二表型信息以及所述抽样表型信息,结合所述先验分布参数,获取所述后验分布参数。
20、根据本发明提供的一种多品种基因组联合遗传评估方法,所述根据所述先验分布参数构建多品种联合评估模型中,所述多品种联合评估模型如下:
21、
22、其中,l为品种序号,yl为品种l的表型向量,xl为品种l与固定效应的关联矩阵,b为固定效应向量,s为基因组区块的数量,mi为基因组区块i中的基因型标记数量,zijl为品种l的基因组区块i中基因型标记j的关联矩阵,aijl为品种l的基因组区块i中基因型标记j的加性遗传效应值,el为品种l的残差向量。
23、根据本发明提供的一种多品种基因组联合遗传评估方法,所述根据所述先验分布参数构建多品种联合评估模型,包括:
24、根据所述先验分布参数,将所述固定效应向量配置为服从均匀分布;
25、根据所述先验分布参数,将所述基因型标记的所述加性遗传效应值配置为服从正态分布并且正态分布的离散度根据品种数量、各个品种的表型方差以及基因频率确定;
26、根据所述先验分布参数,将所述残差向量配置为服从正态分布并且正态分布的离散度根据品种数量、各个品种的表型方差以及基因频率确定。
27、根据本发明提供的一种多品种基因组联合遗传评估方法,所述根据所述标记间的连锁不平衡度量值,计算假定断点连锁值中,所述假定断点连锁值通过以下表达式计算:
28、
29、其中,wk为第k个基因型标记的假定断点连锁值,mi为基因遗传变异矩阵中第i列,i=min{1,k-n},…,k;mj为基因遗传变异矩阵中第j列,j=i+1,…,min{k+n,n},corr[mi,mj]为mi与mj之间的相关系数,n为预设参数值,mk为i和j取值范围内所有向量的总数量。
30、根据本发明提供的一种多品种基因组联合遗传评估方法,在所述根据所述后验分布参数配置所述多品种联合评估模型之后,还包括:
31、获取待预测基因型信息,所述待预测基因型信息包括至少两个品种的基因型信息;
32、将所述待预测基因型信息输入至所述多品种联合评估模型,获取预测表型信息,所述预测表型信息包括至少两种性状的表型值;
33、根据所述预测表型信息,获取基因组估计育种值。
34、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述一种多品种基因组联合遗传评估方法。
35、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述一种多品种基因组联合遗传评估方法。
36、本发明提供的一种多品种基因组联合遗传评估方法、设备及存储介质,至少具有以下有益效果:根据先验分布参数构建多品种联合评估模型,先验分布参数基于理论和经验设置模型参数,其中利用先验分布参数中的先验效应方差,能够考虑不同品种的不同基因组区块中基因型标记效应的差异,即基因型标记在不同的基因组区块位置的效应可以是不同的,且不同品种间可以通过标记效应分布的协方差进行信息共享。在构建多品种联合评估模型后,根据实际观测获取的多品种参考群信息,结合先验分布参数,获得更加准确反映实际基因型信息与表型信息关系的后验分布参数,基于后验分布参数对多品种联合评估模型进行更新配置,令多品种联合评估模型能够基于输入的基因型信息准确地输出预测表型信息,进而基于预测表型信息获取基因组估计育种值,达到基因组预测的目的。以此,通过基于基因型信息的效应方差与所在基因组区块位置关联的方式,构建的多品种联合评估模型,能够充分考虑不同品种之间的基因效应差异,使得不同品种间可以进行信息共享,有利于提高基因组预测的准确性。
本文地址:https://www.jishuxx.com/zhuanli/20240911/289779.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表