基于三端口非易失性器件的Crossbar架构、工作方法及无损压缩方法
- 国知局
- 2024-07-31 19:37:25
本发明涉及存储和向量-矩阵-向量运算领域,尤其涉及一种基于三端口非易失性器件的crossbar架构、工作方法及无损压缩方法。
背景技术:
1、组合优化问题广泛应用于物流、资源分配、通信网络设计、金融、药物发现和交通系统等各个领域。这些问题通常属于非确定性多项式时间难题(np-hard),代表了np领域中一些最具挑战性的计算任务。
2、使用基于冯·诺伊曼体系结构的数字计算机来解决组合优化问题存在困难,因为随着问题规模的增加,所需的资源在计算能力和延迟方面呈指数增长。因此,迫切需要探索新的硬件设计,采用替代架构和算法,以有效地解决组合优化问题。
3、目前,有多种基于ising模型和qubo模型的求解器来求解这些组合优化问题,这两种模型的目标函数都是向量-矩阵-向量的形式。然而,这些求解器的实现有以下不足:1.消耗时间和能源成本随着问题规模呈指数增长。2.可拓展性较差。3.仅限于求解部分类型的组合优化问题。
4、基于上述问题,为了减少求解器的资源成本,提高可拓展性和增加可求解的组合优化问题范围,申请人提出了一种基于三端口非易失性器件的crossbar架构、工作方法及无损压缩方法。
技术实现思路
1、本发明的目的在于针对目前基于ising模型和qubo模型的求解器消耗时间和能源成本随着问题规模呈指数增长、可拓展性较差、仅限于求解部分类型的组合优化问题的问题,提供基于三端口非易失性器件的crossbar架构、工作方法及无损压缩方法。
2、本发明的目的是通过以下技术方案实现的:
3、一种基于三端口非易失性器件的crossbar架构,包括若干个构成n行×m列阵列的三端口非易失性器件,所述三端口非易失性器件结构的栅极与字线wl相连,漏极与输入线sl相连,源极与数据线dl相连,同一行的三端口非易失性器件共用一根字线wl,同一列三端口非易失性器件共用一根输入线sl和一根数据线dl。
4、进一步地,所述三端口非易失性器件为fefet或由1reram-1t构成的单元。
5、1reram-1t为下述文献中图1的1t1r单元。
6、xue c x,chen w h,liu j s,et al.24.1a 1mb multibit reram computing-in-memory macro with 14.6ns parallel mac computing time for cnnbased ai edgeprocessors[c]//2019ieee international solid-state circuits conference-(isscc).ieee,2019:388-390.
7、本发明还提供一种如上所述crossbar架构的工作方法,包括:
8、准备阶段:在所述架构开始工作前,根据所需加速的向量1-矩阵-向量2中矩阵的元素,对crossbar架构中每个三端口非易失性器件进行数据存储;
9、工作阶段:根据向量1中每个元素的值,对每条字线wl置0或1;根据向量2中每个元素的值,对每条输入线sl置0或1;此时,对于任意一个三端口非易失性器件,其导通的条件为:三端口非易失性器件存储的值为1,相应的字线wl、输入线sl均为1,此时该三端口非易失性器件会产生流入sl的电流;根据基尔霍夫电流定律,每列sl的电流都反映了该列满足上述导通条件的crossbar单元个数;所有输入线sl上的总电流之和,即能准确反应向量1-矩阵-向量2的结果。
10、进一步地,所述根据所需加速的向量1-矩阵-向量2中矩阵的元素,对架构中每个三端口非易失性器件进行数据存储具体包括:将信息编码为二进制序列后,通过字线wl、输入线sl和数据线dl对每个三端口非易失性器件进行写入。
11、本发明还提供一种适用于如上所述的crossbar架构的针对列向量-矩阵-行向量乘法(列向量等于行向量的转置)的无损压缩方法,其特征在于,该方法包括:
12、连接度排序阶段:根据向量中每个元素与其他元素产生非零乘积项的数量,按照从低到高的顺序对元素进行排序;
13、行压缩阶段:根据连接度从低到高的顺序,对列向量中的元素依次进行检测;对于第i个元素,检测矩阵的第i行是否包含“不可被置零”的元素,如果包括,则对第i行不作任何操作;如果不包含,则将第i行的所有非零元素加到第i列的对称位置(如第i行第j列的元素非零,则将该值加到第i列的第j行的元素),再将所有被加了值的元素设置为“不可被置零”,再将第i行的所有元素置零;
14、列压缩阶段:根据连接度从低到高的顺序,对行向量中的元素依次进行检测;对于第i个元素,检测矩阵的第i列是否包含“不可被置零”的元素,如果包括,则对第i行不作任何操作;如果不包含,则将第i列的所有非零元素加到第i行的对称位置(如第i列第j行的元素非零,则将该值加到第i行的第j列的元素),再将所有被加了值的元素设置为“不可被置零”,再将第i列的所有元素置零;
15、矩阵压缩阶段:将矩阵中全零的行和列及其对应的列向量、行向量中的元素删除。
16、本发明的有益效果如下:
17、本发明中的基于三端口非易失性器件的crossbar架构能够加速向量1-矩阵-向量2的乘法运算,加速对组合优化问题所对应的目标函数的运算。该架构充分利用了三个端口的特性,通过对除了输出端口外的另外两个端口进行操作,使得非易失性器件的状态同时受到两个信号的控制,进而实现该乘法运算。同时提出的一种针对向量-矩阵-向量乘法的无损压缩方法能减小所需crossbar的硬件规模,进一步提高目标函数的运算效率。
技术特征:1.一种基于三端口非易失性器件的crossbar架构,其特征在于,包括若干个构成n行×m列阵列的三端口非易失性器件,所述三端口非易失性器件结构的栅极与字线wl相连,漏极与输入线sl相连,源极与数据线dl相连,同一行的三端口非易失性器件共用一根字线wl,同一列三端口非易失性器件共用一根输入线sl和一根数据线dl。
2.根据权利要求1所述的一种基于三端口非易失性器件的crossbar架构,其特征在于,所述三端口非易失性器件为fefet或由1reram-1t构成的单元。
3.一种如权利要求1所述crossbar架构的工作方法,其特征在于,包括:
4.根据权利要求3所述的工作方法,其特征在于,所述根据所需加速的向量1-矩阵-向量2中矩阵的元素,对架构中每个三端口非易失性器件进行数据存储具体包括:将信息编码为二进制序列后,通过字线wl、输入线sl和数据线dl对每个三端口非易失性器件进行写入。
5.一种适用于如权利要求1所述的crossbar架构的针对列向量-矩阵-行向量乘法的无损压缩方法,其特征在于,该方法包括:
技术总结本发明公开了一种基于三端口非易失性器件的Crossbar架构、工作方法及无损压缩方法,包括若干个构成N行×M列阵列的三端口非易失性器件,所述三端口非易失性器件结构的栅极与字线WL相连,漏极与输入线SL相连,源极与数据线DL相连,同一行的三端口非易失性器件共用一根字线WL,同一列三端口非易失性器件共用一根输入线SL和一根数据线DL。本发明充分利用了三端口非易失性器件的存储特性和三端口特性实现了全新的Crossbar的设计;对向量‑矩阵‑向量的乘法表达式提出了无损压缩的方法,降低了向量和矩阵的大小,并部署到基于三端口非易失性器件的Crossbar完成了更高效率的加速运算。技术研发人员:尹勋钊,钱煜,卓成受保护的技术使用者:浙江大学技术研发日:技术公布日:2024/2/1本文地址:https://www.jishuxx.com/zhuanli/20240731/183256.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表