一种模型部署方法、装置、存储介质及电子设备与流程
- 国知局
- 2024-08-19 14:22:21
本说明书涉及计算机,尤其涉及一种模型部署方法、装置、存储介质及电子设备。
背景技术:
1、目前,在很多实际业务中,都部署了大量的深度学习模型来处理各种各样的需求。然而,随着业务的不断开展,会源源不断的产生新的需求,为了满足新产生的需求,很多开发人员会选择部署新的模型来处理新的需求,这就导致了业务过程中部署的模型的数量变的越来越多,极大地增加了模型维护的成本和难度。
2、在实际业务中,可以利用多个原始模型的高质量原始训练样本数据来训练一个新模型,以使得新模型能够拥有多个原始模型的功能,从而代替原始模型进行部署,实现模型合并的作用,这样一来,就可以大幅降低业务过程中部署的模型的数量,降低模型维护的成本和难度。
3、然而,传统的模型合并方式对于原始训练样本存在交集的原始模型有比较好的合并效果,但对于原始训练样本不存在交集的原始模型的合并则显得不尽如人意。这是因为原始训练样本存在交集的原始模型在训练过程中使用了一部分相同的训练数据,导致这些原始模型的功能在一定程度上具有相通之处,但原始训练样本不存在交集的原始模型则没有这种优势,因此传统的模型合并方式的效果较差。
4、因此,如何对原始训练样本不存在交集的多个原始模型进行合并,降低部署模型的数量,从而降低模型的维护成本和难度,则是一个亟待解决的问题。
技术实现思路
1、本说明书提供一种模型部署方法、装置、存储介质及电子设备。以部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供了一种模型部署的方法,包括:
4、获取训练各原始模型的各原始训练样本集;
5、将所述各原始训练样本集进行合并,得到合并训练样本集;
6、针对所述合并训练样本集中包含的每个训练样本,将该训练样本输入到待训练的合并模型中,以使得所述待训练的合并模型得到针对该训练样本的输出结果,作为该训练样本对应的待验证结果,其中,所述待训练的合并模型是基于所述各原始模型的模型结构构建出的,以及,将该训练样本输入到所述各原始模型中,以使得所述各原始模型分别得到针对该训练样本的原始输出结果;
7、针对所述合并训练样本集中包含的每个训练样本,确定该训练样本对应的标签结果,以最小化该训练样本对应的标签结果与该训练样本对应的待验证结果之间的偏差,以及最小化所述各原始模型分别针对该训练样本所输出的原始输出结果与该训练样本对应的待验证结果之间的偏差为优化目标,对所述合并模型进行训练,并将训练后的合并模型替换所述各原始模型进行部署。
8、可选地,将所述各原始训练样本集进行合并,得到合并训练样本集,具体包括:
9、分别确定每个原始训练样本集中包含的训练样本的数量;
10、根据所述各原始训练样本集中包含的训练样本的数量,确定出任意两个原始训练样本集中包含的训练样本的数量的差值;
11、若确定出的任意两个原始训练样本集中包含的训练样本的数量的差值均在预设范围内,则将所述各原始训练样本集进行合并,获得合并训练样本集。
12、可选地,所述方法还包括:
13、若确定出存在训练样本的数量的差值不在预设范围内的两个原始训练样本集,则对所述至少部分原始训练样本集中包含的训练样本的数量进行调整,以使得在调整后的各原始训练样本集中确定出的任意两个原始训练样本集中包含的训练样本的数量的差值均在预设范围内,以将所述调整后的各原始训练样本集进行合并,获得合并训练样本集。
14、可选地,针对所述合并训练样本集中包含的每个训练样本,确定该训练样本对应的标签结果,具体包括:
15、针对所述合并训练样本集中包含的每个训练样本,确定出该训练样本所属的原始训练样本集;
16、将该训练样本在所属的原始训练样本集下所对应的标签结果,作为该训练样本对应的标签结果。
17、可选地,针对所述合并训练样本集中包含的每个训练样本,确定该训练样本对应的标签结果,以最小化该训练样本对应的标签结果与该训练样本对应的待验证结果之间的偏差,以及最小化所述各原始模型分别针对该训练样本所输出的原始输出结果与该训练样本对应的待验证结果之间的偏差为优化目标,对所述合并模型进行训练,具体包括:
18、针对所述合并训练样本集中包含的每个训练样本,以最小化该训练样本对应的标签结果与该训练样本对应的待验证结果之间的偏差,对所述合并模型进行预设轮次的训练,获得预训练合并模型;
19、针对所述合并训练样本集中包含的每个训练样本,将该训练样本输入到预训练合并模型中,以使得所述预训练合并模型得到针对该训练样本的输出结果,作为所述预训练合并模型针对该训练样本所得出的待验证结果;
20、针对所述合并训练样本集中包含的每个训练样本,以最小化该训练样本对应的标签结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差,以及最小化所述各原始模型分别针对该训练样本所输出的原始输出结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差为优化目标,对所述预训练合并模型进行训练。
21、可选地,针对所述合并训练样本集中包含的每个训练样本,以最小化该训练样本对应的标签结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差,以及最小化所述各原始模型分别针对该训练样本所输出的原始输出结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差为优化目标,对所述预训练合并模型进行训练,具体包括:
22、从所述各原始模型中选择原始模型,作为目标模型;
23、针对所述合并训练样本集中包含的每个训练样本,以最小化该训练样本对应的标签结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差,以及最小化所述目标模型针对该训练样本所输出的原始输出结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差为优化目标,对所述预训练合并模型进行预设轮次的训练;
24、当所述预训练合并模型完成预设轮次的训练后,将完成预设轮次训练的预训练合并模型作为过渡模型,并从所述各原始模型除选取出的目标模型以外的其他模型中选择原始模型,作为重新选择出的目标模型;
25、针对所述合并训练样本集中包含的每个训练样本,将该训练样本输入到所述过渡模型中,以使得所述过渡模型得到针对该训练样本的输出结果,作为所述过渡模型针对该训练样本所得到的待验证结果;
26、以最小化该训练样本对应的标签结果与所述过渡模型针对该训练样本所得到的待验证结果之间的偏差,以及最小化选择出的所有目标模型针对该训练样本所输出的原始输出结果与所述过渡模型针对该训练样本所得到的待验证结果之间的偏差为优化目标,对所述过渡模型进行预设轮次的训练,直至将所述各原始模型全部作为目标模型加入到所述预训练合并模型的训练任务中,以得到训练后的合并模型。
27、本说明书提供了一种模型部署的装置,包括:
28、获取模块,用于获取训练各原始模型的各原始训练样本集;
29、合并模块,用于将所述各原始训练样本集进行合并,得到合并训练样本集;
30、处理模块,用于针对所述合并训练样本集中包含的每个训练样本,将该训练样本输入到待训练的合并模型中,以使得所述待训练的合并模型得到针对该训练样本的输出结果,作为该训练样本对应的待验证结果,其中,所述待训练的合并模型是基于所述各原始模型的模型结构构建出的,以及,将该训练样本输入到所述各原始模型中,以使得所述各原始模型分别得到针对该训练样本的原始输出结果;
31、训练模块,用于针对所述合并训练样本集中包含的每个训练样本,确定该训练样本对应的标签结果,以最小化该训练样本对应的标签结果与该训练样本对应的待验证结果之间的偏差,以及最小化所述各原始模型分别针对该训练样本所输出的原始输出结果与该训练样本对应的待验证结果之间的偏差为优化目标,对所述合并模型进行训练,并将训练后的合并模型替换所述各原始模型进行部署。
32、可选地,所述合并模块具体用于,分别确定每个原始训练样本集中包含的训练样本的数量;根据所述各原始训练样本集中包含的训练样本的数量,确定出任意两个原始训练样本集中包含的训练样本的数量的差值;若确定出的任意两个原始训练样本集中包含的训练样本的数量的差值均在预设范围内,则将所述各原始训练样本集进行合并,获得合并训练样本集。
33、可选地,所述合并模块还用于,若确定出存在训练样本的数量的差值不在预设范围内的两个原始训练样本集,则对所述至少部分原始训练样本集中包含的训练样本的数量进行调整,以使得在调整后的各原始训练样本集中确定出的任意两个原始训练样本集中包含的训练样本的数量的差值均在预设范围内,以将所述调整后的各原始训练样本集进行合并,获得合并训练样本集。
34、可选地,所述训练模块具体用于,针对所述合并训练样本集中包含的每个训练样本,确定出该训练样本所属的原始训练样本集;将该训练样本在所属的原始训练样本集下所对应的标签结果,作为该训练样本对应的标签结果。
35、可选地,所述训练模块具体用于,针对所述合并训练样本集中包含的每个训练样本,以最小化该训练样本对应的标签结果与该训练样本对应的待验证结果之间的偏差,对所述合并模型进行预设轮次的训练,获得预训练合并模型;
36、针对所述合并训练样本集中包含的每个训练样本,将该训练样本输入到预训练合并模型中,以使得所述预训练合并模型得到针对该训练样本的输出结果,作为所述预训练合并模型针对该训练样本所得出的待验证结果;
37、针对所述合并训练样本集中包含的每个训练样本,以最小化该训练样本对应的标签结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差,以及最小化所述各原始模型分别针对该训练样本所输出的原始输出结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差为优化目标,对所述预训练合并模型进行训练。
38、可选地,所述训练模块具体用于,从所述各原始模型中选择原始模型,作为目标模型;
39、针对所述合并训练样本集中包含的每个训练样本,以最小化该训练样本对应的标签结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差,以及最小化所述目标模型针对该训练样本所输出的原始输出结果与所述预训练合并模型针对该训练样本所得出的待验证结果之间的偏差为优化目标,对所述预训练合并模型进行预设轮次的训练;
40、当所述预训练合并模型完成预设轮次的训练后,将完成预设轮次训练的预训练合并模型作为过渡模型,并从所述各原始模型除选取出的目标模型以外的其他模型中选择原始模型,作为重新选择出的目标模型;
41、针对所述合并训练样本集中包含的每个训练样本,将该训练样本输入到所述过渡模型中,以使得所述过渡模型得到针对该训练样本的输出结果,作为所述过渡模型针对该训练样本所得到的待验证结果;
42、以最小化该训练样本对应的标签结果与所述过渡模型针对该训练样本所得到的待验证结果之间的偏差,以及最小化选择出的所有目标模型针对该训练样本所输出的原始输出结果与所述过渡模型针对该训练样本所得到的待验证结果之间的偏差为优化目标,对所述过渡模型进行预设轮次的训练,直至将所述各原始模型全部作为目标模型加入到所述预训练合并模型的训练任务中,以得到训练后的合并模型。
43、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型部署的方法。
44、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型部署的方法。
45、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
46、在本说明书提供的模型部署的方法中,首先获取训练各原始模型的各原始训练样本集,并将各原始训练样本集进行合并,得到合并训练样本集;针对合并训练样本集中包含的每个训练样本,将该训练样本输入到待训练的合并模型中,以使得待训练的合并模型得到针对该训练样本的输出结果,作为该训练样本对应的待验证结果,以及,将该训练样本输入到各原始模型中,以使得各原始模型分别得到针对该训练样本的原始输出结果;进一步,针对合并训练样本集中包含的每个训练样本,确定该训练样本对应的标签结果,以最小化该训练样本对应的标签结果与该训练样本对应的待验证结果之间的偏差,以及最小化各原始模型分别针对该训练样本所输出的原始输出结果与该训练样本对应的待验证结果之间的偏差为优化目标,对合并模型进行训练,并将训练后的合并模型替换各原始模型进行部署。
47、从上述方法可以看出,本说明书能够将训练各原始模型的各原始训练样本集进行合并,获得合并训练样本集,进而利用合并训练样本集,对待训练的合并模型进行训练,从而使得训练后的合并模型能够获得各原始模型的能力;并且本说明书在训练过程中不但考虑了合并模型的输出结果与真实结果之间的偏差,还考虑了合并模型的输出结果与各原始模型的输出结果之间的偏差,如此一来,即使各原始训练样本集不存在交集,训练后的合并模型依然能够支持各原始模型所部署的业务线的业务需求,最终,训练后的合并模型能够代替各原始模型进行部署,大幅降低系统中部署模型的数量,从而降低了模型的维护成本和难度。
本文地址:https://www.jishuxx.com/zhuanli/20240819/274935.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表