具有量子注意力机制的神经网络构建和图像分类方法
- 国知局
- 2024-09-11 14:22:42
本发明涉及深度学习、量子计算以及计算机分类问题,尤其是一种具有量子注意力机制的神经网络构建和图像分类方法。
背景技术:
1、通常情况下,模型的参数量越多,其表达能力就越强。但同时也会消耗更多的计算资源进行训练和验证。得益于量子计算中的量子态独一无二的计算特性,基于量子计算的深度学习方法能够确保网络表达性,可使基于此构建的模型在保证精度的同时有效地减少参数量。
2、计算机视觉领域中,注意力机制是不可或缺的一部分,其广泛应用于各种任务如:语义分割,图像分类,目标检测等。注意力机制可以看作一种动态选择的过程,根据目标输入来选择想要“看到”的内容,也就是给目标输入的重要性进行一个加权处理,权重占比越大,代表该部分内容越重要。
3、将量子神经网络作为一种模块用于辅助经典网络,即量子-经典混合神经网络的应用得到关注。如应用于文本分类任务的量子自注意力神经网络(quantum self-attention neural network,qsann),在计算自注意力系数时,不是按照一般自注意力机制的内积运算,而是通过量子线路测量得到控制位与目标位的数值后输入高斯函数直接计算。其优势在于不仅可以显著提升训练效率,且可以获得与经典自注意力网络相当的分类精度。
4、虽然量子-经典混合神经网络具有优越性能,但面临着一个可扩展性问题。针对庞大的、海量的数据信息,可用的量子比特数无法与之对应。与此同时,面对图像的通道信息,目前的方法也无法有效地进行捕获。目前的量子神经网络中,所需的量子位的数量与输入数据的通道尺寸的长度成线性比例。但是,由于当前的硬件限制,将这种方法扩展到涉及更多通道数据的任务中是不允许的。
技术实现思路
1、为了克服上述现有技术中量子位数与输入数据匹配不足的缺陷,本发明提出了一种具有量子注意力机制的神经网络的构建方法。
2、为实现上述目的,本发明采用以下技术方案,包括:
3、(本部分与权利要求书一样,为避免重复修改,定稿后再来填充)。
4、本发明的优点在于:
5、(1)本发明将量子计算引入到经典通道注意力机制中构建了量子-经典混合神经网络。其中,注意力层将输入特征图先进行全局平均池化,将每个通道上的数据进行压缩,再利用量子神经网络表达能力强的优势进行特征抽离,生成每个特征图的量子权重系数;最后将量子权重系数乘以输入特征图得到带有量子通道注意力的权重特征图,输入到后续的卷积层进行分类任务。本发明具有良好的可扩展性,可以作为模块加入主流的经典网络架构中发挥作用,且可以大幅降低所需量子比特数,为量子网络结构的实际实现带来可能。
6、(2)本发明提出了量子通道注意力机制,并给出了实现方案,同时该方法也适用于nisq(noisy intermediate-scale quantum,量子新技术时代)设备,与经典神经网络相配合时,可以有效提升网络性能。
7、(3)本发明提供的图像分类方法,为基于量子-经典混合神经网络的分类方法,引入基测量,在保证分类精度的同时大幅减少了处理时所需要的量子比特数。
技术特征:1.一种具有量子注意力机制的神经网络的构建方法,其特征在于,令选定的神经网络架构中连接相邻两个层的通道记作传输支路,在神经网络架构中选择一个或者多个传输支路作为目标支路,在目标支路上插入量子计算辅助模块,形成具有量子注意力机制的神经网络;量子计算辅助模块的输入数据即为目标支路的输入数据,量子计算辅助模块的输出数据与量子计算辅助模块的输入数据点乘后作为目标支路的输出数据;
2.如权利要求1所述的具有量子注意力机制的神经网络的构建方法,其特征在于,池化层使用全局平均池化将输入的特征图数据的信息压缩到各个通道中,以转换为矩阵
3.如权利要求2所述的具有量子注意力机制的神经网络的构建方法,其特征在于,第一量子注意力网络对矩阵v进行量子幅度编码,获取v的量子态|ψ0>;
4.如权利要求1所述的具有量子注意力机制的神经网络的构建方法,其特征在于,第一量子注意力网络中的量子测量方式采用基测量。
5.如权利要求1所述的具有量子注意力机制的神经网络的构建方法,其特征在于,第二量子注意力网络中的量子测量方式采用基测量。
6.如权利要求1所述的具有量子注意力机制的神经网络的构建方法,其特征在于,第一激活层和第二激活层均采用sigmoid激活函数。
7.一种采用如权利要求1-6任一项所述的具有量子注意力机制的神经网络的构建方法的图像分类方法,其特征在于,包括以下步骤:
8.如权利要求7所述的图像分类方法,其特征在于,选定的神经网络架构为用于分类类别的神经网络模型。
9.如权利要求8所述的图像分类方法,其特征在于,选定的神经网络架构为resnet-34、senet、cbam和yolo系列中的任一网络模型。
10.一种图像分类系统,其特征在于,包括存储器和处理器,存储器中存储有计算机程序,处理器连接存储器,处理器用于执行所述计算机程序,以实现如权利要求7-9任一项所述的图像分类方法。
技术总结本发明涉及深度学习、量子计算以及计算机分类问题技术领域,尤其是一种具有量子注意力机制的神经网络构建和图像分类方法。本发明将量子计算引入到经典通道注意力机制中构建了量子‑经典混合神经网络。其中,注意力层将输入特征图先进行全局平均池化,将每个通道上的数据进行压缩,再利用量子神经网络表达能力强的优势进行特征抽离,生成每个特征图的量子权重系数;最后将量子权重系数乘以特征图得到带有量子通道注意力的权重特征图,输入到后续的卷积层进行分类任务。本发明具有良好的可扩展性,可以作为模块加入主流的经典网络架构中发挥作用,且可以大幅降低所需量子比特数,为量子网络结构的实际实现带来可能。技术研发人员:崔超远,乌云受保护的技术使用者:中国科学院合肥物质科学研究院技术研发日:技术公布日:2024/9/9本文地址:https://www.jishuxx.com/zhuanli/20240911/290464.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。