微生物的偏好温度预测方法、模型训练方法及相关装置与流程
- 国知局
- 2024-07-12 10:22:53
本申请涉及人工智能,尤其是一种微生物的偏好温度预测方法、模型训练方法及相关装置。
背景技术:
1、微生物培养,是指借助人工配制的培养基和人为创造的培养条件(如培养温度等),使某些(种)微生物快速生长繁殖的过程。微生物培养需要根据微生物的不同种类和生活习性来配制特定的培养基,设定有利于微生物生长的温度,有助于提高微生物培养的成功率。
2、相关技术中,对于微生物培养的最佳温度的预测研究主要关注微生物在不同温度条件下的生长反应及其与环境温度的关系,这类研究基于特定采样点收集的微生物样本进行,以探索微生物群体对温度变化的适应性。
3、然而,在复杂环境中,上述方法存在样本量不足和生物多样性覆盖不全的缺陷,此外,上述方法不仅耗时且成本高昂,使得获取的温度数据局限于有限且离散的信息点,难以全面反映微生物对环境温度变化的表现。
技术实现思路
1、本申请的目的是提供一种微生物的偏好温度预测方法、模型训练方法及相关装置,旨在提高在复杂环境中预测微生物最佳生长温度的预测精度和效率。
2、本申请实施例提供一种微生物的偏好温度预测方法,包括:
3、获取目标基因序列;所述目标基因序列为待培养微生物的基因序列;
4、对所述目标基因序列进行切分处理,得到目标频率集;所述目标频率集由多个目标基因片段频率构成,所述目标基因片段频率为按照多种单位长度切分目标基因序列得到的目标基因片段的数量占比;
5、将所述目标频率集输入至预训练的温度预测模型,依据所述目标频率集进行培养温度预测,得到目标预测培养温度;所述预训练的温度预测模型是利用样本频率集训练得到的,所述样本频率集由多个样本基因片段的多个样本基因片段频率构成,所述样本基因片段频率为按照多种单位长度切分样本基因序列得到的样本基因片段的数量占比。
6、在一些实施例中,所述对所述目标基因序列进行切分处理,得到目标频率集,包括:
7、确定多种所要生成的所述目标基因片段的单位长度,依据所述单位长度,对所述目标基因序列进行切分处理,得到多个所述目标基因片段;
8、依据所述目标基因片段的数量,确定所述目标基因片段频率;
9、依据所述目标基因片段频率,构造所述目标频率集。
10、在一些实施例中,在所述将所述目标频率集输入至预训练的温度预测模型,依据所述目标频率集进行培养温度预测,得到目标预测培养温度之前,还包括:
11、将所述目标频率集转换为矩阵表示,使各所述目标基因片段频率按照预设位置进行排布,沿排布方向所述目标基因片段的单位长度递增或递减。
12、在一些实施例中,所述将所述目标频率集输入至预训练的温度预测模型,依据所述目标频率集进行培养温度预测,得到目标预测培养温度,包括:
13、对所述目标频率集进行编码处理,得到第一目标特征矩阵;
14、对所述第一目标特征矩阵进行局部频率特征提取,提取出与培养温度相关的局部频率特征向量,利用所述局部频率特征向量生成第二目标特征矩阵;
15、对所述第二目标特征矩阵进行全连接处理,得到所述目标预测培养温度。
16、在一些实施例中,所述对所述第一目标特征矩阵进行局部频率特征提取,提取出与培养温度相关的局部频率特征向量,利用所述局部频率特征向量生成第二目标特征矩阵,包括:
17、对所述第一目标特征矩阵进行逐层卷积操作,对每次卷积操作的结果进行非线性激活处理和正则化操作,得到目标卷积结果;
18、对所述目标卷积结果进行维度变换操作,得到目标维度变换结果;
19、对所述目标维度变换结果进行全连接操作,得到所述第二目标特征矩阵。
20、在一些实施例中,所述目标基因片段的单位长度为3个至9个碱基。
21、本申请实施例还提供一种模型训练方法,包括:
22、构造样本频率集;所述样本频率集由多个样本基因片段的多个样本基因片段频率构成,所述样本基因片段频率为按照多种单位长度切分样本基因序列得到的样本基因片段的数量占比;
23、将所述样本频率集输入至待训练的温度预测模型,依据所述样本频率集进行培养温度预测,得到样本预测培养温度;
24、确定所述样本频率集所对应样本微生物的最佳培养温度;
25、依据所述样本预测培养温度与所述最佳培养温度,确定模型损失信息;所述模型损失信息表征所述样本预测培养温度与所述最佳培养温度之间的偏差;
26、依据所述模型损失信息调整所述待训练的温度预测模型的权重参数,在所述模型损失信息符合结束条件时,得到预训练的温度预测模型。
27、在一些实施例中,所述依据所述模型损失信息调整所述待训练的温度预测模型的权重参数,在所述模型损失信息符合结束条件时,得到预训练的温度预测模型,包括:
28、采用梯度下降法,依据所述模型损失信息的历史梯度和更新情况,在预设学习率区间内迭代调整所述权重参数的学习率,以得到所述模型损失信息的最小值或迭代次数到达预设阈值迭代次数,得到所述预训练的温度预测模型。
29、本申请实施例还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
30、本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
31、本申请的有益效果:通过将目标基因序列切分为多个目标基因片段,利用目标基因片段的目标基因片段频率构成目标频率集,将目标频率集输入至预训练的温度预测模型,依据目标频率集进行培养温度预测,得到目标预测培养温度。由于是利用目标基因片段的目标基因片段频率构成的目标频率集作为预测待培养微生物的最佳培养温度的基础,使目标频率集同时包含多种目标基因序列的短结构信息和长结构信息,可以深度感知待培养微生物的基因序列的结构信息,提高在复杂环境中预测微生物最佳生长温度的预测精度和效率。
技术特征:1.一种微生物的偏好温度预测方法,其特征在于,包括:
2.根据权利要求1所述的微生物的偏好温度预测方法,其特征在于,所述对所述目标基因序列进行切分处理,得到目标频率集,包括:
3.根据权利要求1所述的微生物的偏好温度预测方法,其特征在于,在所述将所述目标频率集输入至预训练的温度预测模型,依据所述目标频率集进行培养温度预测,得到目标预测培养温度之前,还包括:
4.根据权利要求1所述的微生物的偏好温度预测方法,其特征在于,所述将所述目标频率集输入至预训练的温度预测模型,依据所述目标频率集进行培养温度预测,得到目标预测培养温度,包括:
5.根据权利要求4所述的微生物的偏好温度预测方法,其特征在于,所述对所述第一目标特征矩阵进行局部频率特征提取,提取出与培养温度相关的局部频率特征向量,利用所述局部频率特征向量生成第二目标特征矩阵,包括:
6.根据权利要求1至5任一项所述的微生物的偏好温度预测方法,其特征在于,所述目标基因片段的单位长度为3个至9个碱基。
7.一种模型训练方法,其特征在于,包括:
8.根据权利要求7所述的模型训练方法,其特征在于,所述依据所述模型损失信息调整所述待训练的温度预测模型的权重参数,在所述模型损失信息符合结束条件时,得到预训练的温度预测模型,包括:
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法。
技术总结本申请涉及人工智能技术领域,公开一种微生物的偏好温度预测方法、模型训练方法及相关装置。微生物的偏好温度预测方法包括:获取目标基因序列;对目标基因序列进行切分处理,得到目标频率集;将目标频率集输入至预训练的温度预测模型,依据目标频率集进行培养温度预测,得到目标预测培养温度。本申请实施例可以提高在复杂环境中预测微生物最佳生长温度的预测精度和效率。技术研发人员:王文昭,龙俊儒,廖家龙,黄强,袁越,邱艳飞,余珂受保护的技术使用者:福瑞莱环保科技(深圳)股份有限公司技术研发日:技术公布日:2024/6/11本文地址:https://www.jishuxx.com/zhuanli/20240614/86573.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表