一种基于深度学习的南美白对虾良种扩繁方法与流程
- 国知局
- 2024-12-06 12:12:32
本申请涉及生物信息,尤其涉及一种基于深度学习的南美白对虾良种扩繁方法。
背景技术:
1、南美白对虾是我国养殖量最大的对虾品种,具有非常高的市场价值。
2、我国的高质量种虾依赖进口,即从国外购买种虾进行繁育。而种虾繁育存在性状退化和抗疫病风险弱的问题。种虾性状退化或者死亡就需要再度进口。特别在近年,国外种虾企业只出售虾苗而不出售种虾,导致我国对虾养殖业的利润被进一步剥夺。
3、对虾的个体十分脆弱,养殖厂中的环境聚集容易导致疫病爆发,造成对虾的大面积死亡。也就因此,市场上的对虾价格普遍高于其他肉类。
4、例如,2009年爆发了副溶血弧菌感染事件,导致虾苗因感染早期死亡综合症和急性肝胰腺坏死综合症而成片死亡,造成了巨大的经济损失。
5、选育出具有抗病性强、生长快速等优良性状的对虾品种被认为是解决病害问题的根本途径。
6、在2019年,中国科学院完成了南美白对虾的基因测序工作,公布了首个南美白对虾的参考基因组数据。这也就给对虾的精准分子选育奠定了基础。
7、在对虾的分子选育工作中,需要评估特定基因和特定性状之间的关联程度,确定优良性状相关的基因型进行选育。
8、南美白对虾需要选育的性状一般基于生长速率、抗病性、出肉量以及饲料消耗量、上述性状大多都是由多基因控制的数量性状。即,对虾的性状表达都是由多个基因座共同作用。并且,对虾的部分性状的遗传力比较低,受到环境因素的影响比较大。
9、根据对虾的参考基因组显示,对虾物种存在大量特异性基因和大量串联重复基因,导致分析对虾个体的基因和性状关联性困难。
10、鉴定与性状紧密相关的基因或基因位点是对虾良种选育之间中的要点。南美白对虾共有24亿个碱基对,其中存在24%左右简单重复的碱基序列(即微卫星)。因此,对选育性状进行基因分型还需要对南美白对虾进行大量的dna测序和分析工作。
11、为了快速地进行南美白对虾的优良性状进行分子选育,本申请提供一种基于深度学习的南美白对虾良种扩繁方法。
技术实现思路
1、为克服相关技术中存在的问题,本申请提供一种基于深度学习的南美白对虾良种扩繁方法,包括:
2、获取初代种群的基因组数据;所述基因组数据包括有带有编号的基因序列;所述初代种群为同一母系、不同父系培育得到的种虾群体;
3、获取初代种群的性状表型数据;
4、根据所述性状表型数据和所述基因组数据之间的关联程度确定基因编号集;所述基因编号集为与选育的性状相关联的基因序列集;根据所述基因编号集确定进行良种扩繁的种虾。
5、在一种实施方式中,所述获取初代种群的基因组数据,具体包括:
6、对初代种群中的各个种虾进行高通量全基因组测序,得到初代种群的全基因序列;
7、获取对虾基因参考图谱;
8、根据所述对虾基因参考图谱对所述全基因序列进行编号,得到所述基因组数据。
9、在一种实施方式中,所述获取初代种群的性状表型数据,具体包括:
10、将所述初代种群在不同养殖环境中进行培育;
11、收集记录所述初代种群的性状表型数据。
12、在一种实施方式中,所述根据所述性状表型数据和所述基因组数据之间的关联程度确定基因编号集,具体包括:
13、训练对虾良种预测模型;
14、将各个标记的对虾的所述性状表型数据和所述基因组数据输入所述对虾良种预测模型,得到所述特异性状相关的基因编号集。
15、在一种实施方式中,所述训练对虾良种预测模型,具体包括:
16、获取样本数据集,所述样本数据集基于对虾的参考基因组数据,以及所述参考基因组数据对应的性状标注数据构建;
17、将所述样本数据集划分为训练集和测试集;
18、构建所述对虾良种预测模型,所述对虾良种预测模型为p-net结构的神经网络模型;
19、利用所述训练集对所述对虾良种预测模型进行迭代训练,得到训练完成的所述对虾良种预测模型。
20、在一种实施方式中,所述基于对虾的参考基因组数据,以及所述参考基因组数据对应的性状标注数据构建,具体包括:
21、获取对虾的参考基因组数据;
22、对所述参考基因组数据进行标注,得到带有真实性状标签的参考基因组数据。
23、在一种实施方式中,所述对虾良种预测模型的网络结构包括输入层、基因层、生物通路层、全连接层以及输出层;
24、所述基因层的每个节点代表一个编号的基因序列;所述基因层的输出连接到所述生物通路层,这里的每个节点代表一个生物学通路;所述生物通路层用于将基因的表达模式与已知的生物学通路联系;所述全连接层用于感知所述性状表型数据和所述基因序列之间的关联程度,并将关联程度高于预设阈值的所述基因序列集发送到输出层。
25、在一种实施方式中,所述根据所述基因编号集确定进行良种扩繁的种虾,具体包括:
26、获取所述基因编号集中的各个基因编号,以及基因编号对应的基因序列;
27、根据所述基因序列制作基因芯片;通过所述基因芯片筛选出下一代用于选育的种虾或者性状表型稳定的种虾。
28、本申请提供的技术方案可以包括以下有益效果:
29、本申请首先对不同家系的对虾群体进行培育,获取不同的家系下的对虾的性状表型数据和基因组数据,根据性状表型数据和基因组数据之间的关联程度确定符合性状表型要求的基因序列,也就是定位出特异性状相关的基因序列,再根据该基因序列集进行下一代的对虾选择,或者直接选育出性状稳定的种虾。
30、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
技术特征:1.一种基于深度学习的南美白对虾良种扩繁方法,其特征在于,包括:
2.根据权利要求1所述的一种基于深度学习的南美白对虾良种扩繁方法,其特征在于,所述获取初代种群的基因组数据,具体包括:
3.根据权利要求1所述的一种基于深度学习的南美白对虾良种扩繁方法,其特征在于,所述获取初代种群的性状表型数据,具体包括:
4.根据权利要求1所述的一种基于深度学习的南美白对虾良种扩繁方法,其特征在于,所述根据所述性状表型数据和所述基因组数据之间的关联程度确定基因编号集,具体包括:
5.根据权利要求1所述的一种基于深度学习的南美白对虾良种扩繁方法,其特征在于,所述训练对虾良种预测模型,具体包括:
6.根据权利要求5所述的一种基于深度学习的南美白对虾良种扩繁方法,其特征在于,
7.根据权利要求6所述的一种基于深度学习的南美白对虾良种扩繁方法,其特征在于,
8.根据权利要求4所述的一种基于深度学习的南美白对虾良种扩繁方法,其特征在于,所述根据所述基因编号集确定进行良种扩繁的种虾,具体包括:
技术总结本申请是一种基于深度学习的南美白对虾良种扩繁方法,包括:获取初代种群的基因组数据;获取经过筛选的初代种群的特异性状数据;根据所述特异性状数据和所述基因组数据定位特异基因序列集;所述基因序列集合为与所述特异性状相关的基因编号集;根据所述基因编号集确定进行良种扩繁的种虾。本申请首先对不同家系的对虾群体进行培育,获取不同的家系下的对虾的性状表型数据和基因组数据,根据性状表型数据和基因组数据之间的关联程度确定符合性状表型要求的基因序列,也就是定位出特异性状相关的基因序列,再根据该基因序列集进行下一代的对虾选择,或者直接选育出性状稳定的种虾。技术研发人员:刘丽燕,郑丽明,李新宇,吴玉刚,胡蝶,王婷婷,王昊,姚春凤受保护的技术使用者:广东粤海饲料集团股份有限公司技术研发日:技术公布日:2024/12/2本文地址:https://www.jishuxx.com/zhuanli/20241204/339963.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表