技术新讯 > 计算推算,计数设备的制造及其应用技术 > 矢量非线性函数定点处理的方法、装置及矢量处理器与流程  >  正文

矢量非线性函数定点处理的方法、装置及矢量处理器与流程

  • 国知局
  • 2024-11-21 12:02:52

本申请属于指令集架构,尤其涉及一种矢量非线性函数定点处理的方法、装置、矢量处理器、设备及计算机存储介质、程序产品。背景技术:::1、非线性函数在计算时大多通过查表的方式实现,通过把函数输入划分为多段区间,每段中间通过线性内插得到近似函数值,使用查找表(lookup table,lut)存储每个分段的起始位置及对应的斜率计算内插值。2、现有技术在对非线性函数进行拟合时,采用混合高精度lut的方法查询,但由于非线性函数在不同分段的变化率不同,采用分段较少的表格覆盖整个输入范围,分段较多的表格只覆盖斜率变化高的区间。但在需要覆盖的输入范围较大时分段仍然较多,使用lut方法会占用大量的硬件资源。技术实现思路1、本申请实施例提供一种矢量非线性函数定点处理的方法、装置、矢量处理器、设备及计算机存储介质、程序产品,以解决现有技术中非线性函数输入范围较大时,使用lut方法占用大量硬件资源的问题。2、第一方面,本申请实施例提供一种矢量非线性函数定点处理的方法,方法包括:3、响应于矢量非线性指数计算指令,读取源矢量寄存器中的元素;4、对所述元素中的矢量非线性函数进行归一化处理,得到输出指数;5、响应于矢量非线性尾数计算指令,基于所述矢量非线性尾数计算指令中的立即数确定所述矢量非线性函数的段组,以及所述矢量非线性函数的所述段组内分段对应的分段斜率、截距和起始位置;6、根据所述分段对应的分段斜率、截距和起始位置以及归一化结果对段组内分段进行线性拟合,得到线性拟合结果,所述归一化结果是响应于所述矢量非线性指数计算指令或所述矢量非线性尾数计算指令对所述元素中的矢量非线性函数归一化得到;7、对线性拟合结果进行归一化,得到输出结果;8、将所述输出指数和输出结果输出到目标矢量寄存器。9、第二方面,本申请实施例提供了一种矢量非线性函数定点处理的装置,装置包括:10、读取模块,用于响应于矢量非线性指数计算指令,读取源矢量寄存器中的元素;11、处理模块,用于对所述元素中的矢量非线性函数进行归一化处理,得到输出指数;12、响应模块,用于响应于矢量非线性尾数计算指令,基于所述矢量非线性尾数计算指令中的立即数确定所述矢量非线性函数的段组,以及所述矢量非线性函数的所述段组内分段对应的分段斜率、截距和起始位置;13、拟合模块,用于根据所述分段对应的分段斜率、截距和起始位置以及归一化结果对段组内分段进行线性拟合,得到线性拟合结果,所述归一化结果是响应于所述矢量非线性指数计算指令或所述矢量非线性尾数计算指令对所述元素中的矢量非线性函数归一化得到;14、移位模块,用于对线性拟合结果进行归一化,得到输出结果;15、输出模块,用于将所述输出指数和输出结果输出到目标矢量寄存器。16、第三方面,本申请实施例提供了一种矢量处理器,包括第二方面的装置,以及源矢量寄存器和目标矢量寄存器。17、第四方面,本申请实施例提供了一种终端设备,设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现如第一方面的矢量非线性函数定点处理的方法。18、第五方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面的矢量非线性函数定点处理的方法。19、第六方面,本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如第一方面的矢量非线性函数定点处理的方法。20、本申请实施例提供一种矢量非线性函数定点处理的方法、装置、矢量处理器、设备及计算机存储介质、程序产品,首先响应于矢量非线性指数计算指令,读取源矢量寄存器中的元素;对所述元素中的矢量非线性函数进行归一化处理,得到输出指数,输出指数可以表示归一化处理的放缩关系;响应于矢量非线性尾数计算指令,基于矢量非线性尾数计算指令中的立即数确定矢量非线性函数的段组,以及矢量非线性函数的段组内分段对应的分段斜率、截距和起始位置,可以根据需要动态选取矢量非线性函数对应的段组;根据所述分段对应的分段斜率、截距和起始位置以及归一化结果对段组内分段进行线性拟合,得到线性拟合结果,所述归一化结果是响应于所述矢量非线性指数计算指令或所述矢量非线性尾数计算指令对所述元素中的矢量非线性函数归一化得到,得到线性拟合结果,归一化处理将输入元素映射到目标区间,减小了需要分段拟合的范围,可以简化计算过程,减少计算复杂度;对线性拟合结果进行归一化,得到输出结果;将输出指数和输出结果输出到目标矢量寄存器,通过归一化操作将较大的输入范围映射到一个较小的输入区间,把输入数据分为归一化线性部分和对应的指数部分分别处理,有效减少了分段数目,减少了硬件资源的占用。技术特征:1.一种矢量非线性函数定点处理的方法,其特征在于,包括:2.根据权利要求1所述的矢量非线性函数定点处理的方法,其特征在于,在所述响应于矢量非线性尾数计算指令,基于所述矢量非线性尾数计算指令中的立即数确定所述矢量非线性函数的段组,以及所述矢量非线性函数的所述段组内分段对应的分段斜率、截距和起始位置之前,所述方法包括:3.根据权利要求1所述的矢量非线性函数定点处理的方法,其特征在于,所述对所述元素中的矢量非线性函数进行归一化处理,得到输出指数,包括:4.根据权利要求3所述的矢量非线性函数定点处理的方法,其特征在于,所述定点值归一化到目标区间时的左移位数、定标值和位数阈值与指数位的关系包括:使用位数阈值减去定标值和左移位数,得到指数位,所述左移位数是定点值归一化到目标区间时的左移位数。5.根据权利要求3所述的矢量非线性函数定点处理的方法,其特征在于,在所述矢量非线性函数为幂函数的情况下,所述指数位、矢量非线性函数的指数和输出指数的关系为:指数位乘以矢量非线性函数的指数后加一,得到该元素的输出指数。6.根据权利要求3所述的矢量非线性函数定点处理的方法,其特征在于,在所述矢量非线性函数的值为负数的情况下,在对定点值的位进行左移操作使定点值归一化到目标区间得到归一化结果后,所述方法还包括:7.根据权利要求3所述的矢量非线性函数定点处理的方法,其特征在于,在对定点值的位进行左移操作使定点值归一化到目标区间得到归一化结果后,所述方法还包括:8.根据权利要求3所述的矢量非线性函数定点处理的方法,其特征在于,在非线性函数为对数函数的情况下,所述非线性函数的输出指数为零,所述非线性函数的输出结果为线性拟合结果与指数位的和。9.根据权利要求1所述的矢量非线性函数定点处理的方法,其特征在于,在根据所述分段对应的分段斜率、截距和起始位置以及归一化结果对段组内分段进行线性拟合,得到线性拟合结果之前,所述方法还包括:10.一种矢量非线性函数定点处理的装置,其特征在于,所述装置包括:11.一种矢量处理器,其特征在于,包括权利要求10所述的装置,以及源矢量寄存器和目标矢量寄存器。12.一种终端设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如权利要求1-9任意一项所述的矢量非线性函数定点处理的方法。13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-9任意一项所述的矢量非线性函数定点处理的方法。14.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-9任意一项所述的矢量非线性函数定点处理的方法。技术总结本申请公开了一种矢量非线性函数定点处理的方法、装置及矢量处理器,方法包括:响应矢量非线性指数计算指令读取源矢量寄存器中元素;对元素中的函数进行归一化处理,得到输出指数;响应矢量非线性尾数计算指令,基于指令中的立即数确定段组及段组内分段的分段斜率、截距和起始位置;根据分段斜率、截距和起始位置及归一化结果对分段进行线性拟合得到线性拟合结果,归一化结果响应于矢量非线性指数计算指令或尾数计算指令对函数归一化得到;对线性拟合结果进行归一化得到输出结果;将输出指数和输出结果输出到目标矢量寄存器。本申请实施例通过归一化操作将较大的输入范围映射到一个较小的输入区间,有效减少了分段数目,减少了硬件资源的占用。技术研发人员:李高山受保护的技术使用者:芯昇科技有限公司技术研发日:技术公布日:2024/11/18

本文地址:https://www.jishuxx.com/zhuanli/20241120/334001.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。