基于变分量子算法的图像分析方法、系统以及储存介质与流程
- 国知局
- 2024-09-14 15:14:05
本发明涉及量子分析,尤其涉及基于变分量子算法的图像分析方法、系统以及储存介质。
背景技术:
1、图像分析是现代技术中具有广泛的应用,例如自动驾驶汽车中的车牌识别、行人追踪等。图像分析是计算机视觉领域的一个核心任务,旨在能够让计算机能够理解和解释图像中的内容,涉及到从图像中提取有用信息和特征的各种技术。图像分析旨在通过深入解析图像内容,实现从简单物体识别到复杂场景理解。
2、近年来,视觉transformer模型,借助于其强大的自注意力机制,已经在众多图像分析任务中取得了显著的成果。这些模型通过学习图像的全局依赖关系,能够捕捉到复杂的视觉模式和上下文信息,显著提升了处理复杂视觉信息的能力。然而,传统的视觉transformer模型面临着若干局限性,主要包括计算资源消耗巨大、模型训练过程复杂、泛化能力孱弱等问题,这些问题限制了其在资源有限的特定应用下的性能。
技术实现思路
1、基于背景技术存在的技术问题,本发明提出了基于变分量子算法的图像分析方法、系统以及储存介质,通过融合量子计算特性,提高图像分析的效率和精确度。
2、本发明提出的基于变分量子算法的图像分析方法,将待分类的图像输入到量子分类模型中,以输出图像分类结果;
3、所述量子分类模型的训练过程如下:
4、步骤一、基于所获取的图像构建训练数据集,对训练数据集中的图像进行特征提取,得到特征提取后的图像,对特征提取后的图像进行分块,得到由个令牌组成的令牌序列;
5、步骤二、将令牌序列输入到量子视觉transformer,通过数据编码线路将令牌序列中的每个令牌编码到量子态表示的希尔伯特空间中,每个量子态表示分别经过变分量子线路、和处理后,对变分量子线路和只测量一个比特,得到每个令牌对应的查询和键,对变分量子线路测量全部比特,得到每个令牌对应的值,所述变分量子线路、和中的可训练参数线路部分均为门与cz门交替排列构成的量子线路,其中为可训练参数,门与cz门均为量子门;
6、步骤三、计算第个令牌与其他令牌之间的注意力分数,将注意力分数与所有令牌的值加权求和后,应用残差连接,作为量子视觉transformer的输出;
7、步骤四、将量子视觉transformer输出的特征向量经过线性分类层得到图像分类结果,通过图像分类结果构建损失函数,基于反向传播算法及参数移位规则优化量子分类模型中的经典参数和量子参数。
8、进一步地,在步骤一中,对特征提取后的图像进行分块,得到由个令牌组成的令牌序列,具体为:
9、特征提取后的图像尺寸为,将特征提取后的图像按照分块,得到个分块图像,所述分别图像的高度和宽度,表示颜色通道数,分别表示分块图像的高度和宽度,;
10、将每个分块图像内的特征向量展平转化为一个维的向量,以得到由个令牌组成的令牌序列。
11、进一步地,在步骤二中,通过数据编码线路将令牌序列中的每个令牌编码到量子态表示的希尔伯特空间中,具体为:计算,对令牌序列中的第个令牌压缩到之间,通过门将压缩后的令牌编码到量子态表示的希尔伯特空间中,门为量子门。
12、进一步地,在步骤二中,在变分量子线路的测量输出之前设置有cnot门,使得变分量子线路在测量之前进行充分的纠缠,从而实现只测量一个比特即可得到每个令牌对应的查询和键。
13、进一步地,在步骤三中,计算第个令牌与其他令牌之间的注意力分数,将注意力分数与所有令牌的值加权求和后,应用残差连接,作为量子视觉transformer的输出,具体如下:
14、;
15、;
16、;
17、其中,表示第个令牌相对于第个令牌的注意力分数,表示第个令牌的查询,表示第个令牌的键的转置,表示第个令牌基于注意力机制得到的向量,表示第个令牌的值,表示第个令牌经过量子视觉transformer输出的特征向量,表示第个令牌。
18、进一步地,在步骤二中,变分量子线路、和中量子门的参数均是通过训练学习确定,变分量子线路、和所对应量子线路的优化均是计算对应量子线路的输出相对于对应量子线路中每个参数的梯度,量子线路的优化过程具体如下:
19、给定一个参数化的量子线路,通过对每个参数施加一个偏移量,得到参数施加偏移量后的量子线路;
20、计算目标函数在给定的量子线路和参数施加偏移量的量子线路上的期望值误差,以估计对应参数的梯度,所述目标函数为量子线路中量子门训练时所构建的函数;
21、第个参数的梯度估计如下:
22、;
23、其中,为目标函数在参数的量子线路下的值,为第个参数,为第个单位向量,表示目标函数在参数的量子线路下的值,为目标函数在参数的量子线路下的值,为给参数施加偏移量所形成的参数,为给参数施加偏移量所形成的参数。
24、基于变分量子算法的图像分析系统,将待分类的图像输入到量子分类模型中,以输出图像分类结果;
25、所述量子分类模型包括网络特征提取层、图像分块层、量子视觉transformer、网络分类层以及损失构建模块;基于所获取的图像构建训练数据集对量子分类模型进行训练,训练过程如下:
26、网络特征提取层用于对训练数据集中的图像进行特征提取,得到特征提取后的图像;
27、图像分块层用于对特征提取后的图像进行分块,得到由个令牌组成的令牌序列;
28、量子视觉transformer用于通过数据编码线路将令牌序列中的每个令牌编码到量子态表示的希尔伯特空间中,每个量子态表示分别经过变分量子线路、和处理后,对变分量子线路和只测量一个比特,得到每个令牌对应的查询和键,对变分量子线路测量全部比特,得到每个令牌对应的值,所述变分量子线路、和中的可训练参数线路部分均为门与cz门交替排列构成的量子线路,其中为可训练参数;对于第个令牌,计算该令牌与其他令牌之间的注意力分数,将注意力分数与所有令牌的值加权求和后,应用残差连接,作为量子视觉transformer的输出;
29、网络分类层用于将量子视觉transformer输出的特征向量经过线性分类层得到图像分类结果;
30、损失构建模块用于通过图像分类结果构建损失函数,基于反向传播算法及参数移位规则优化分类模型中的经典参数和量子参数。
31、一种计算机可读储存介质,所述计算机可读储存介质上存储有若干分类程序,所述若干分类程序用于被处理器调用并执行如上所述的图像分析方法。
32、本发明提供的基于变分量子算法的图像分析方法、系统以及储存介质的优点在于:提出了基于变分量子线路的经典-量子混合视觉transformer方法,实现了对经典神经网络与量子机器学习在处理图像分析问题上的融合;同时具有广泛的应用场景,可以应用于各种复杂图像分析问题;所提出的量子视觉transformer,提供了一种利用量子计算的并行性和量子态叠加原理来处理复杂问题的新途径,为视觉transformer在更多场景下的应用提供了新的可行方案;解决了传统视觉transformer模型在资源受限环境中的应用局限,通过融合量子计算特性,提高图像分析的效率和精确度。
本文地址:https://www.jishuxx.com/zhuanli/20240914/297466.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。