一种基于温度计编码内容可寻址存储器实现曼哈顿距离度量的方法
- 国知局
- 2024-07-31 23:12:35
本发明涉及新型存储与计算,具体涉及一种基于温度计编码内容可寻址存储器实现曼哈顿距离度量的方法。
背景技术:
1、随着人工智能、大数据技术的迅速发展,存算分离的传统冯·诺依曼计算架构的瓶颈日益凸显,数据在存储单元和计算单元之间的传输将引起大量的延时和能耗的浪费,计算系统对速度和能效有了更高的要求。研究者们受人脑运算模式启发,提出了存内计算架构,构建出存算一体、高度并行的分布式计算网络,在提高了对复杂数据的处理效率的同时,可以避免传统冯·诺依曼计算架构中因数据搬运引起的延时和能耗问题。内容可寻址存储器(cam)作为一种新的存内计算范式,除了具有常规存储器的读操作和写操作之外,还可以执行独特的搜索操作。cam可以在一个搜索周期内完成输入向量(query)与所有存储向量(entry)的匹配操作,并根据不匹配程度进行基于距离度量的特征检索,在处理基于距离度量的在处理模式匹配、视频与图像处理等边缘端机器学习任务中具有极大的吸引力。
2、cam单元存储并编码1位信息(“0”,“1”),通过位扩展的方式编码多位信息,例如2个cam单元可以编码2位信息(“00”,“01”,“10”,“11”),可以表示4个不同的特征。通过将数据集的特征量化为二值布尔向量并存储在cam阵列中,即可以通过cam的搜索操作完成并行的距离度量。按照上述编码方式,目前cam架构可以实现的距离度量是汉明距离,对于两个特征向量,对应位不同的数量即为汉明距离,可以通过检测cam搜索过程中的不匹配位的数量完成汉明距离的计算。
3、但是在先进的机器学习任务中,例如人脸识别等复杂数据集的分类任务,将数据集量化为二值布尔向量会带来很大的精度损失,需要量化为多值向量提升分类准确率,即特征向量的每一位都要量化为多值信息,可以通过曼哈顿距离度量。此外,曼哈顿距离还在城市道路规划、数据挖掘、数字图像处理、生物信息学和序列分析等具有广泛的应用场景。曼哈顿距离度量的是两个特征向量之间每一位差异的绝对值距离之和。而基于传统编码方式的cam架构是无法完成绝对值距离度量的,例如特征向量的每一位量化为4值(“00”,“01”,“10”,“11”),其中“01”和“10”之间的绝对值距离为1,但是基于传统位扩展方式的cam架构检测“01”和“10”之间的不匹配位的数量是2,也就是汉明距离。因此,目前基于传统位扩展方式编码的cam架构仅支持汉明距离的度量,不支持曼哈顿距离的度量,这限制了其在实际任务中的应用。
技术实现思路
1、针对以上现有技术中存在的问题,本发明提出了一种基于温度计编码内容可寻址存储器实现曼哈顿距离度量的方法,只需根据实际问题中特征的位数调整温度计编码的entry长度,可以实现具有任意位数特征的曼哈顿距离的度量,并且当问题特征的状态数为1位时,可以同时实现汉明距离的度量,不需要改变cam的电路结构,进一步扩展了cam的应用场景。
2、本发明的技术方案如下:
3、一种基于温度计编码cam实现曼哈顿距离度量的方法,其特征在于,包括一nor类型的cam阵列,每一行cam单元表示一个存储entry,存储特征向量,cam阵列的每一行单元共用一条匹配线ml,cam阵列的每一列单元共用一对搜索线sl,sl,根据搜索query在所有搜索线上施加搜索信号,cam阵列的编码方式如下:
4、1)存储entry采用温度计编码,对于状态数为k+1的特征,其状态分别为0~k,采用k个cam单元(e1~ek)存储,将k个cam单元全部编程为“0”代表状态0;将e1到ek-1编程为“0”,将ek编程为“1”代表状态1;逐一增加编程为“1”的cam单元数,代表其他的状态,将e1到ej(1<j<k-1)编程为“0”,ej+1到ek编程为“1”代表状态k-j,k个cam单元全部编程为“1”代表第状态k;
5、2)相应的搜索query也采用同样的温度计编码,将k条sl(sl)全部设置为“0”(“1”)代表搜索状态0;将k-1条sl(sl)设置为“0”(“1”),1条sl(sl)设置为“1”(“0”)代表搜索状态1;逐一增加设置为“1”(“0”)的sl(sl)数量,表示其他的搜索状态,将j条sl(sl)设置为“0”(“1”),k-j条sl(sl)设置为“1”(“0”)代表搜索状态k-j;当k条sl(sl)全部设置为“1”(“0”)代表搜索状态k;
6、当搜索query和存储entry一致时,ml到地为高阻态或者关断的晶体管,ml具有极低的电流;而当搜索query和存储entry不一致时,ml到地为低阻态电阻或者导通的晶体管,ml具有较高的电流,通过检测ml的电流大小得到距离度量的结果,不匹配cam单元的个数实际上等于搜索query和存储entry之间的差的绝对值,最终ml的电流与搜索向量和存储向量之间每一个特征的绝对值距离之和成正比,即实现曼哈顿距离的度量。
7、本发明基于温度计编码的cam实现曼哈顿距离度量方法的原理如下:对于一组通过温度计编码的cam单元,只有当搜索query和存储entry完全一致时,即该组cam单元全部匹配时,ml才具有关态电流,表示距离为0。当搜索query和存储entry不一致时,ml的电流与不匹配cam单元的个数正相关,并且由于采用了温度计编码,不匹配的搜索query和存储entry之间的距离越远,对应的不匹配cam单元个数越多,不匹配cam单元的个数实际上等于搜索query和存储entry之间的差的绝对值,即二值的绝对值距离。对于一个完整的特征向量,其中每一个k位特征采用上述温度计编码的方式表示在一组k-1个cam单元中,多个特征之间通过一行cam的ml连接进行扩展,最终ml的电流与搜索向量和存储向量之间每一个特征的绝对值距离之和成正比,即实现曼哈顿距离的度量。特别地,当k为2时,每个特征可以存储在1个cam单元中,此时温度计编码与传统编码方式一致,可以实现汉明距离的度量。因此,本发明提出的基于温度计编码的cam架构可以根据实际问题中特征的位数调整温度计编码的entry长度,实现具有任意位数特征的曼哈顿距离的度量,并可以向下兼容基于传统编码方式的cam架构,实现汉明距离的度量。
8、综上所述,本发明提出一种基于温度计编码内容可寻址存储器实现曼哈顿距离度量的方法,其中cam单元可以采用基于传统sram的cam单元,基于rram或pcm等各种类型的非易失性二端阻变式存储器的cam单元,也可以采用基于fefet或flash等各种类型的非易失性三端存储器的cam单元,其中的铁电材料可以采用hfo2掺zr(hzo)、hfo2掺al(hfalo)等各类hfo2掺杂型铁电材料的,也可以采用钙钛矿型铁电(如pzt,bfo,sbt等)、铁电聚合物(如p(vdf-trfe)等)等传统铁电材料,器件栅叠层可以基于mfmis、mfis、mfs等多种结构。
9、本发明的技术效果如下:
10、1、本发明提出的基于温度计编码内容可寻址存储器实现曼哈顿距离度量的方法,采用温度计编码的方式实现特征的存储和搜索,可以根据实际问题中特征的位数调整温度计编码的entry长度,实现具有任意位数特征的曼哈顿距离的度量。
11、2、本发明提出的基于温度计编码内容可寻址存储器实现曼哈顿距离度量的方法,当特征的位数为1时,可以实现汉明距离的度量,即可以向下兼容基于传统编码方式的cam架构,不需要改变cam的电路结构,扩展了cam的应用场景。
本文地址:https://www.jishuxx.com/zhuanli/20240730/196422.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表