用于神经网络的数据量化方法、装置、计算机设备及介质与流程
- 国知局
- 2024-07-31 22:58:17
本发明涉及人工智能,尤其涉及一种用于神经网络的数据量化方法、装置、计算机设备及介质。
背景技术:
1、随着人工智能技术的兴起,基于神经网络的人工智能模型已广泛应用于数字医疗平台中,数字医疗平台可以支持疾病辅助诊断、健康管理、远程会诊等功能,从而提高医疗机构的效率,方便居民就医。
2、由于神经网络的计算量较大,因此出现了专用于加速神经网络计算的芯片,通常称之为神经网络加速器,但是,在数字医疗平台内,随着医疗数据量的逐渐增大,神经网络的规模也越来越大,导致神经网络消耗的内存过大而无法部署到加速器上。
3、因此,现有方法通常是采用数据量化的方式来降低神经网络的内存消耗,但是,数据量化会导致神经网络精度的下降,这一缺点在神经网络层数较深时表现得尤为明显,而且,现有将数据量化为固定数据类型的方式,例如16位浮点数、8位整型等,所带来的内存消耗降低较为有限,难以满足日益增长的内存需求。因此,如何在尽量减少神经网络精度下降的前提下,提高数据量化的细粒度成为亟待解决的问题。
技术实现思路
1、有鉴于此,本发明实施例提供了一种用于神经网络的数据量化方法、装置、计算机设备及介质,以解决数据量化导致神经网络精度大幅下降,且数据量化细粒度过粗的问题。
2、第一方面,本发明实施例提供一种用于神经网络的数据量化方法,所述数据量化方法包括:
3、针对所述神经网络的任一目标网络层,将获取的所述目标网络层的网络参数向量和初始区间系数拼接,得到拼接结果,确定所述拼接结果为当前状态向量;
4、以所述当前状态向量为条件,使用区间系数预测模型对量化区间系数的取值进行预测,得到预测区间系数;
5、根据所述预测区间系数、预设的区间最大边界值和区间最小边界值,计算得到更新最大边界值和更新最小边界值,根据所述更新最大边界值和所述更新最小边界值,确定当前量化区间;
6、以所述当前状态向量和所述当前量化区间为条件,使用粒度系数预测模型,对所述当前量化区间的量化粒度系数进行预测,得到预测粒度系数,根据所述预测粒度系数和所述当前量化区间,计算得到当前量化粒度;
7、根据所述当前量化粒度和预设的量化损失函数,计算得到量化损失,根据所述量化损失对所述区间系数预测模型和所述粒度系数预测模型的参数进行更新,将所述预测区间系数作为初始区间系数,返回执行所述将获取的所述目标模型层的网络参数向量和所述初始区间系数拼接的步骤,直至所述量化损失收敛,得到所述量化损失收敛时对应的当前量化区间和当前量化粒度;
8、根据所述量化损失收敛时对应的当前量化区间和当前量化粒度,对所述目标网络层的输入数据进行量化处理。
9、第二方面,本发明实施例提供一种用于神经网络的数据量化装置,所述数据量化装置包括:
10、向量拼接模块,用于针对所述神经网络的任一目标网络层,将获取的所述目标网络层的网络参数向量和初始区间系数拼接,得到拼接结果,确定所述拼接结果为当前状态向量;
11、第一预测模块,用于以所述当前状态向量为条件,使用区间系数预测模型对量化区间系数的取值进行预测,得到预测区间系数;
12、区间确定模块,用于根据所述预测区间系数、预设的区间最大边界值和区间最小边界值,计算得到更新最大边界值和更新最小边界值,根据所述更新最大边界值和所述更新最小边界值,确定当前量化区间;
13、第二预测模块,用于以所述当前状态向量和所述当前量化区间为条件,使用粒度系数预测模型,对所述当前量化区间的量化粒度系数进行预测,得到预测粒度系数,根据所述预测粒度系数和所述当前量化区间,计算得到当前量化粒度;
14、参数更新模块,用于根据所述当前量化粒度和预设的量化损失函数,计算得到量化损失,根据所述量化损失对所述区间系数预测模型和所述粒度系数预测模型的参数进行更新,将所述预测区间系数作为初始区间系数,返回执行所述将获取的所述目标模型层的网络参数向量和所述初始区间系数拼接的步骤,直至所述量化损失收敛,得到所述量化损失收敛时对应的当前量化区间和当前量化粒度;
15、量化处理模块,用于根据所述量化损失收敛时对应的当前量化区间和当前量化粒度,对所述目标网络层的输入数据进行量化处理。
16、第三方面,本发明实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的数据量化方法。
17、第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的数据量化方法。
18、本发明实施例与现有技术相比存在的有益效果是:
19、针对神经网络的任一目标网络层,将获取的目标网络层的网络参数向量和初始区间系数拼接,得到拼接结果,确定拼接结果为当前状态向量,以当前状态向量为条件,使用区间系数预测模型对量化区间系数的取值进行预测,得到预测区间系数,根据预测区间系数、预设的区间最大边界值和区间最小边界值,计算得到更新最大边界值和更新最小边界值,根据更新最大边界值和更新最小边界值,确定当前量化区间,以当前状态向量和当前量化区间为条件,使用粒度系数预测模型,对当前量化区间的量化粒度系数进行预测,得到预测粒度系数,根据预测粒度系数和当前量化区间,计算得到当前量化粒度,根据当前量化粒度和预设的量化损失函数,计算得到量化损失,根据量化损失对区间系数预测模型和粒度系数预测模型的参数进行更新,将预测区间系数作为初始区间系数,返回执行将获取的目标模型层的网络参数向量和初始区间系数拼接的步骤,直至量化损失收敛,得到量化损失收敛时对应的当前量化区间和当前量化粒度,根据量化损失收敛时对应的当前量化区间和当前量化粒度,对目标网络层的输入数据进行量化处理,使用自适应的量化区间和量化粒度,仅对属于量化区间内的数据进行量化,符合数据属于正态分布的特点,避免绝对值较大的数据因被量化而导致的神经网络精度损失,在尽量减少神经网络精度下降的前提下,提高数据量化的细粒度,进而提高了数字医疗平台的服务智能化、高效化。
技术特征:1.一种用于神经网络的数据量化方法,其特征在于,所述数据量化方法包括:
2.根据权利要求1所述的数据量化方法,其特征在于,所述将获取的所述目标网络层的网络参数向量和所述初始区间系数拼接,得到拼接结果,包括:
3.根据权利要求1所述的数据量化方法,其特征在于,所述将获取的目标网络层的网络参数向量和初始区间系数拼接,得到拼接结果,包括:
4.根据权利要求1所述的数据量化方法,其特征在于,所述以所述当前状态向量为条件,使用区间系数预测模型对量化区间系数的取值进行预测,得到预测区间系数,包括:
5.根据权利要求1所述的数据量化方法,其特征在于,所述根据所述预测区间系数、预设的区间最大边界值和区间最小边界值,计算得到更新最大边界值和更新最小边界值,包括:
6.根据权利要求1所述的数据量化方法,其特征在于,所述根据所述预测粒度系数和所述当前量化区间,计算得到当前量化粒度,包括:
7.根据权利要求1至6任一项所述的数据量化方法,其特征在于,所述根据所述当前量化粒度和预设的量化损失函数,计算得到量化损失,包括:
8.一种用于神经网络的数据量化装置,其特征在于,所述数据量化装置包括:
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的数据量化方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的数据量化方法。
技术总结本发明涉及人工智能技术领域,尤其涉及一种用于神经网络的数据量化方法、装置、计算机设备及介质。该方法将网络参数向量和初始区间系数拼接为当前状态向量,以当前状态向量为条件,预测量化区间系数的取值,根据得到的预测区间系数,确定当前量化区间,以当前状态向量和当前量化区间为条件,预测当前量化区间的量化粒度系数,根据得到的预测粒度系数和当前量化区间,计算出当前量化粒度,根据当前量化粒度更新模型参数,将预测区间系数作为初始区间系数,迭代直至收敛,根据收敛时对应的当前量化区间和当前量化粒度,对输入数据进行量化处理,在尽量减少神经网络精度下降的前提下,提高数据量化的细粒度,进而提高了数字医疗平台的服务高效化。技术研发人员:李佳琳,瞿晓阳,陶伟,王健宗受保护的技术使用者:平安科技(深圳)有限公司技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/195539.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。