一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种超分辨率图像成像方法、装置及存储介质

2022-11-28 13:35:23 来源:中国专利 TAG:


1.本发明涉及图像处理领域,尤其是涉及一种基于镜头补偿式光学防抖系统的超分辨率图像成像方法、装置及存储介质。


背景技术:

2.随着科技的不段进步,人们对图像的分辨率要求也越来越高。超分辨率生成是一种基于软件的计算摄影技术,它克服了相机硬件设计的局限性,从单个或多个低分辨率采样图像中获得更高分辨率的图像。超分辨率生成算法分为两种:单幅图片超分辨率生成和多幅图片超分辨率生成。单幅图片超分辨率生成算法使用低分辨率先验中的有限信息来添加高频细节,当场景复杂时得到的高分辨率图像效果较差。多幅图片超分辨率生成算法合并同一场景的多个低分辨率图像,以生成更高分辨率的输出。该过程分为两个阶段:图像配准和图像合并。图像配准的目的是求解图像间的最优坐标变换关系,对待配准图像进行变换,使其与参考图像在空间位置上对齐。图像合并就是将存在差异的多幅低分辨率图像叠加到超分辨率的图像网格上,去除其中的冗余信息,融合为质量较高的图像。但是,现有的超分辨率算法由于图像配准的精确度较低问题的存在使得最后合成的超分辨率图像效果不好。
3.光学防抖系统通常用于智能手机相机,以减少由手抖而产生的模糊效果。光学防抖系统的实现主要有两种方法:镜头移动和传感器移动。在镜头移动方法中,图像传感器固定在相机模块的底部,镜头进行平移运动。在传感器移动方法中,镜头固定,cmos传感器进行平移运动,这种方法相对而言成本更高。因此,大多数智能手机都采用了镜头移动的光学防抖模块。本发明只关注镜头移动的光学防抖模块,其工作流程主要如下:主板上搭载的陀螺仪检测到手机移动,然后光学防抖驱动器根据转换后的位移参数来移动镜头的位置,以补偿不需要的相机抖动。目前未有技术通过控制光学防抖系统来生成超分辨率图像。


技术实现要素:

4.本发明的目的就是为了提供一种基于镜头补偿式光学防抖系统的超分辨率图像成像方法、装置及存储介质,通过控制智能手机的光学防抖系统拍摄得到多幅不同视角的图像,对低分辨率图像进行图像配准和图像合并后生成表现更好的超分辨率图像。
5.本发明的目的可以通过以下技术方案来实现:
6.一种基于镜头补偿式光学防抖系统的超分辨率图像成像方法,包括以下步骤:
7.确定智能手机板载陀螺仪的谐振频率;
8.基于谐振频率确定声信号;
9.获取智能手机在默认参数下拍摄的参考帧;
10.获取智能手机在声信号注入时拍摄的多个偏移帧,同时记录每个偏移帧对应的时间戳和板载陀螺仪读数;
11.基于板载陀螺仪读数计算镜头移动角度;
12.基于镜头移动角度确定镜头位移和像素位移;
13.基于目标优化函数、镜头位移和像素位移求解最优化问题,进行参考帧和偏移帧之间的图像配准,得到配准之后的低分辨率图像,其中,所述目标优化函数包含多个惩罚项;
14.对配准之后的低分辨率图像进行图像合并,得到超分辨率图像。
15.所述基于板载陀螺仪读数计算镜头移动角度的计算方法为:
16.θ(t δt)=θ(t) ω[t]δt
[0017]
其中,θ(t)为t时刻的镜头角度,δt为两次板载陀螺仪读数之间的时间间隔,fs为板载陀螺仪的采样频率,ω[t]是当前时间戳的板载陀螺仪读数;
[0018]
δθ=θ(t δt)-θ(t)
[0019]
其中,δθ为镜头移动角度。
[0020]
所述基于镜头移动角度确定镜头位移和像素位移包括以下步骤:
[0021]
6-1)对镜头位移和像素位移之间的关系建模;
[0022]
6-2)将镜头从位置1移动到位置2,使得光源a的成像从像素b移动到像素b’,其中,镜头位移δh=a*δθ,a为常数,像素位移为δt;
[0023]
6-3)基于相似三角形得到像素位移和镜头位移之间的关系满足:
[0024][0025]
其中,za为光源深度,f为智能手机摄像头的焦距;当在镜头位移的影响下从同一场景中拍摄多帧图像时,所有图像中的光源深度保持不变,即在每一组图像中,每一个光源的是固定的;
[0026]
6-4)基于固定不变,确定镜头移动角度δθ和像素位移δt之间的关系:
[0027]
δt
x
=a
x
δθ
x
,a
x
>0
[0028]
δty=ayδθy,ay>0
[0029]
其中,a
x
和ay是光学防抖系统的常量系数,下标x,y分别代表x轴和y轴分量;
[0030]
6-5)基于翻滚角、俯仰角和6-4)所述镜头移动角度δθ和像素位移δt之间的关系确定t
1-t2时间间隔内像素位移:
[0031][0032][0033]
其中,δθ
x
为翻滚角,δθy为俯仰角。
[0034]
所述目标优化函数为:
[0035]
e(p)=e
visual
(p) αe
motion
(p)
[0036]
其中,e
visual
(p),e
motion
(p)均为惩罚项,e
visual
(p)是视觉项,e
motion
(p)是运动项,α为权重参数,p代表像素。
[0037]
所述视觉项基于lucas-kanade光流方法的三次迭代确定,用于对齐图像中视觉相似的区域,视觉项的确定方法为:
[0038]
7-1-1)以k0表示参考帧,ki(i∈[1,2,...,k])表示偏移帧,k为偏移帧的帧数,偏移帧ki中的每个像素p的视觉项e
visual
(p)i为:
[0039][0040]
其中,ui(p),vi(p)表示从光流方法中得到的粗粒度像素位移信息,表示优化目标;
[0041]
7-1-2)对每个像素p确定视觉项如下:
[0042][0043]
所述运动项的确定方法为:
[0044]
7-2-1)对于每个像素p,基于每一对偏移帧-参考帧得到:
[0045][0046][0047]
其中,δh
x
(i)和δhy(i)分别表示偏移帧ki中x轴和y轴上的平均镜头位移,ω表示图像平面,
[0048]
7-2-2)将两对偏移帧-参考帧之间的运动项定义为(km,k0)和(kn,k0),km和kn代表两个不同的偏移帧,参考帧的拍摄时间为t0,偏移帧ki的拍摄时间为ti,结合6-5)所述公式得到:
[0049][0050]
7-2-3)对每个像素p确定运动项如下:
[0051][0052]
所述对配准之后的低分辨率图像进行图像合并,得到超分辨率图像包括以下步骤:
[0053]
8-1)构建基于参考帧的上采样图像网格;
[0054]
8-2)基于核回归估计每个像素在每个颜色通道的局部贡献:
[0055][0056]
其中,(x,y)是像素在上采样图像网格中的二维坐标,是在所有输入帧上获得的总和,所述输入帧包括1个参考帧和k个偏移帧,∑j是低分辨率图像在预配置大小的局部邻域内样本的总和,c
i,j
表示对应的颜色通道中像素的颜色值,所述颜色通道包括红色、蓝色和绿色,每一个样本j在图像配准前的原始坐标为(xj,yj),图像配准后的亚像素对齐向量为(uj,vj),w
i,j
为局部样本权重,基于二维归一化各向异性高斯rbf确定:
[0057][0058]
其中,dj是样本j到输出图像网格的偏移向量,
[0059]dj
=[2(x
j-uj)-x,2(y
j-vj)-y]
t
[0060]
ψj是核协方差矩阵,
[0061][0062]
其中,和是参考帧在水平和垂直方向的局部梯度;
[0063]
8-3)将每个像素的三个颜色通道的局部贡献映射到上采样图像网格中,得到输出的超分辨率图像。
[0064]
所述默认参数包括自动曝光、自动对焦、自动白平衡。
[0065]
一种基于镜头补偿式光学防抖系统的超分辨率图像成像装置,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现如上述所述的方法。
[0066]
一种存储介质,其上存储有程序,所述程序被执行时实现如上述所述的方法。
[0067]
与现有技术相比,本发明具有以下有益效果:
[0068]
(1)本发明结合镜头位移和粗粒度像素位移来输出高精度的亚像素对齐向量,并利用对齐向量进行图像配准,在合并多个配准帧后可以获得分辨率更高、表现更好的超分辨率图像,提高了超分辨率图像的质量。
[0069]
(2)本发明利用基于声信号注入的方法来改变板载陀螺仪的读数,通过控制智能手机的光学防抖模块拍摄得到同一场景的多幅不同视角的图像,相比较于传统的通过手持相机进行抖动来拍摄多幅不同视角的图像更加简单方便,且可控性强,更易于获得不同视角图像之间的关系。
[0070]
(3)本发明利用智能手机自带的光学防抖系统来对低分辨率对象进行处理,在不添加额外硬件的情况下得到超分辨率图像,使得相机分辨率低的手机能够带来更好的拍照体验,且成本低,适用范围广。
附图说明
[0071]
图1为本发明的方法流程图;
[0072]
图2为本发明的图像处理过程示意图;
[0073]
图3为镜头位移与像素位移的关系图。
具体实施方式
[0074]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0075]
一种基于镜头补偿式光学防抖系统的超分辨率图像成像方法,如图1所示,包括以下步骤:
[0076]
1)确定智能手机板载陀螺仪的谐振频率。
[0077]
现有技术表明主板上搭载的陀螺仪会受到声波信号的影响。陀螺仪中的质量块是一直在做谐振运动的,与此谐振频率一致的声信号可以直接驱动陀螺仪中的质量块振动,从而改变陀螺仪的读数,以达到操纵镜头位置的目的。因此,首先需要确定板载陀螺仪的谐振频率。
[0078]
可以控制陀螺仪读数的正弦信号的频率应该接近传感器质量块的谐振频率,其范围主要在18khz~30khz之间,人耳一般听不到这种高频率音波。
[0079]
通过扫频确定板载陀螺仪的谐振频率:在静止的智能手机旁播放18khz~30khz的声信号,同时记录每个频率下的陀螺仪读数,分别计算出每个频率下的出标准差。正常情况下手机静止时陀螺仪读数在0附近小幅波动,因此当计算出的标准差显著大于0时,可以认为该频率就是板载陀螺仪的谐振频率。
[0080]
2)将谐振频率下的正弦声信号制作为.wav文件,所述正弦声信号将在4)中作为声信号注入的输入,进而影响陀螺仪的读数。
[0081]
大多数支持光学防抖的智能手机摄像头只能补偿翻滚角和俯仰角的干扰,因此只需要通过声信号改变陀螺仪的读数,不需要改变加速度计。
[0082]
3)获取智能手机在默认参数(自动曝光、自动对焦、自动白平衡)下拍摄的参考帧。
[0083]
此时镜头处于零位移位置(即不受声信号注入干扰)。
[0084]
4)利用手机的内置扬声器播放上述.wav文件,镜头会在声信号干扰下发生位移,此时拍摄得到的图片相对于参考帧会发生偏移;
[0085]
获取智能手机在声信号注入时拍摄的多个偏移帧,同时记录每个偏移帧对应的时间戳和板载陀螺仪读数。
[0086]
5)基于板载陀螺仪读数计算镜头移动角度。
[0087]
θ(t δt)=θ(t) ω[t]δt
[0088]
其中,θ(t)为t时刻的镜头角度,δt为两次板载陀螺仪读数之间的时间间隔,fs为板载陀螺仪的采样频率,通常为100hz~200hz,ω[t]是当前时间戳的板载陀螺仪读数;
[0089]
δθ=θ(t δt)-θ(t)
[0090]
其中,δθ为镜头移动角度。
[0091]
6)基于镜头移动角度确定镜头位移和像素位移。
[0092]
6-1)对镜头位移和像素位移之间的关系建模,如图3所示;
[0093]
6-2)将镜头从位置1移动到位置2,使得光源a的成像从像素b移动到像素b’,其中,镜头位移δh=a*δθ,a为常数,可以通过标定得到,像素位移为δt;
[0094]
6-3)基于相似三角形得到像素位移和镜头位移之间的关系满足:
[0095][0096]
其中,za为光源深度,f为智能手机摄像头的焦距;当在镜头位移的影响下从同一场景中拍摄多帧图像时,所有图像中的光源深度保持不变,即在每一组图像中,每一个光源的是固定的;
[0097]
6-4)基于固定不变,确定镜头移动角度δθ和像素位移δt之间的关系:
[0098]
δt
x
=a
x
δθ
x
,a
x
>0
[0099]
δty=ayδθy,ay>0
[0100]
其中,a
x
和ay是光学防抖系统的常量系数,下标x,y分别代表x轴和y轴分量;
[0101]
6-5)基于翻滚角、俯仰角和6-4)所述镜头移动角度δθ和像素位移δt之间的关系确定t
1-t2时间间隔内像素位移:
[0102][0103][0104]
其中,δθ
x
为翻滚角,δθy为俯仰角。
[0105]
基于上述方法可以将镜头移动期间的陀螺仪读数转换为像素位移。
[0106]
7)基于目标优化函数、镜头位移和像素位移求解最优化问题,进行参考帧和偏移帧之间的图像配准,得到配准之后的低分辨率图像。
[0107]
在获取到同一场景的多个不同视角的偏移帧之后,需要将这些偏移帧与参考帧进行配准。图像配准的目的是求解图像间的最优坐标变换关系,对偏移帧进行变换,使其与参考帧在空间位置上对齐。本实施例将图像配准建模为一个最优化问题,优化目标是配准时相同光源的像素的偏移信息。因此,本发明使用镜头位移和目标优化函数中的惩罚项来优化每一对图像之间的的像素对齐。所述最优化问题涉及到视觉项和运动项之间的权衡,它对镜头位移的可信度施加了先验条件。视觉项的目的是促进图像中视觉相似区域的对齐。
[0108]
所述目标优化函数为:
[0109]
e(p)=e
visual
(p) αe
motion
(p)
[0110]
其中,e
visual
(p),e
motion
(p)均为惩罚项,e
visual
(p)是视觉项,e
motion
(p)是运动项,p代表像素,α为权重参数,用来平衡2个惩罚项的相对重要程度。一种实施例中,α被设置为1.5。
[0111]

视觉项
[0112]
视觉项基于lucas-kanade光流方法的三次迭代确定,用于对齐图像中视觉相似的区域,具体确定方法为:
[0113]
7-1-1)以k0表示参考帧,ki(i∈[1,2,...,k])表示偏移帧,k为偏移帧的帧数,偏移帧ki中的每个像素p的视觉项e
visual
(p)i为:
[0114]
[0115]
其中,ui(p),vi(p)表示从光流方法中得到的粗粒度像素位移信息,表示优化目标(即高精度的像素对齐结果);
[0116]
7-1-2)对每个像素p确定视觉项如下:
[0117][0118]

运动项
[0119]
运动项的确定方法为:
[0120]
7-2-1)对于每个像素p,基于每一对偏移帧-参考帧得到:
[0121][0122][0123]
其中,δh
x
(i)和δhy(i)分别表示偏移帧ki中x轴和y轴上的平均镜头位移,ω表示图像平面,
[0124]
7-2-2)将两对偏移帧-参考帧之间的运动项定义为(km,k0)和(kn,k0),km和kn代表两个不同的偏移帧,参考帧的拍摄时间为t0,偏移帧ki的拍摄时间为ti,结合6-5)所述公式得到:
[0125][0126]
7-2-3)对每个像素p确定运动项如下:
[0127][0128]
使用上述公式求解最优化问题之后可以得到高精度的亚像素对齐向量,将对齐向量应用在偏移帧上进行变换,可以实现偏移帧和参考帧在空间位置上的对齐,完成图像配准。
[0129]
8)对配准之后的低分辨率图像进行图像合并,得到超分辨率图像。
[0130]
8-1)构建基于参考帧的上采样图像网格;
[0131]
一种实施例中,图像网格采用2倍上采样得到,那么由此得到的超分辨率图像的分辨率为原始输入图像的2倍;
[0132]
8-2)基于核回归估计每个像素在每个颜色通道的局部贡献:
[0133][0134]
其中,(x,y)是像素在上采样图像网格中的二维坐标,是在所有输入帧上获得的总和,所述输入帧包括1个参考帧和k个偏移帧,∑j是低分辨率图像在预配置大小的局部邻域内样本的总和,一种实施例中,局部邻域的大小为3
×
3,即样本的坐标在范围中;
[0135]ci,j
表示对应的颜色通道中像素的颜色值,所述颜色通道包括红色、蓝色和绿色,每一个样本j在图像配准前的原始坐标为(xj,yj),图像配准后的亚像素对齐向量为(uj,vj),w
i,j
为局部样本权重,基于二维归一化各向异性高斯rbf确定:
[0136][0137]
其中,dj是样本j到输出图像网格的偏移向量,
[0138]dj
=[2(x
j-uj)-x,2(y
j-vj)-y]
t
[0139]
ψj是核协方差矩阵,一种实施例中,在每一帧中应用梯度结构张量分析作为核协方差矩阵:
[0140][0141]
其中,和是参考帧在水平和垂直方向的局部梯度,在一个3
×
3颜色窗口内的亮度通道中使用有限前向差分方法计算得到;
[0142]
8-3)将每个像素的三个颜色通道的局部贡献映射到上采样图像网格中,得到输出的超分辨率图像。
[0143]
基于上述方法的图像处理流程图如图2所示。
[0144]
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0145]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依据本发明的构思在现有技术的基础上通过逻辑分析、推理、或者有限的实验可以得到的技术方案,皆应在权利要求书所确定的保护范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献