基于超像素处理遮挡的单目深度估计方法

2022-11-13 12:02:07 来源：中国专利 TAG：

技术特征：
1.一种基于超像素处理遮挡的单目深度估计方法，其特征在于，包括以下步骤：步骤一，图像预处理：输入一组双目图片，对双目图片进行图像去噪，使用深度图生成遮挡物体掩膜；步骤二，采用相机位姿估计进行位姿估计对图像进行重建：首先进行特征提取，相机位姿估计使用posecnn，之后将输入图像分为三个任务，分别为语义分割、三维旋转回归、三维平移估计；步骤三，采用深度估计网络进行深度估计对图像进行重建；步骤四，计算光度重建损失。2.如权利要求1所述基于超像素处理遮挡的单目深度估计方法，其特征在于，所述步骤一具体为：输入一组双目图片，首先对图片进行滤波，提高图像的质量；使用聚类分割算法对图像进行聚类分割；初始化种子点，按照设定的超像素个数，在图像内均匀的分配种子点；假设图片总共有 n 个像素点，预分割为 k 个相同尺寸的超像素，那么每个超像素的大小为，则相邻种子点的距离即步长近似为；在种子点的邻域内重新选择种子点；在每个种子点周围的邻域内为每个像素点分配类标签；左视图聚类分割的结果记为集合l，右视图聚类分割的结果记为集合r，使用结构性相似指标对左右视图重新配对；结构相似性指标公式为，其中，是输入的图像，为的平均数, 为的平均数，为的方差，为的方差，为和的协方差，和为常数，其中，，是像素值的动态范围；l中的元素为l1,l2,l3...,r中的元素为r1,r2,r3...,l1与r中的所有元素计算结构相似性，若l1和r1结构相似性指标最小，即l1和r1最相似，则l1和r1组成新的双目图像对；生成的双目视觉对用集合表示，计算光度重建损失，光度重建损失如下：，其中为原图像，为重建图像，为超参数，计算光度重建损失的平均值，计算当前的光度重建损失，如果为真，则此双目视觉对存在遮挡，直接丢弃。3.如权利要求1所述基于超像素处理遮挡的单目深度估计方法，其特征在于，所述步骤二包括提取阶段和嵌入阶段，特征提取阶段使用13个卷积层和4个最大池化层，提取高维特
征；嵌入阶段是将第一阶段生成的高维特征映射嵌入到低维、特定于任务的特征中；然后，执行6d姿势估计的三个不同任务：语义分割、三维旋转回归、三维平移估计。4.如权利要求3所述基于超像素处理遮挡的单目深度估计方法，其特征在于，所述步骤二语义分割是将特征提取阶段生成的通道尺寸为512的两个特征映射作为输入；两种特征图的分辨率分别为原始图像大小的1/8和1/16；首先使用两个卷积层将两个特征映射的通道数降低到64；然后用反卷积层将1/16特征图的分辨率提高一倍；在此基础上，对两幅特征图进行求和，再利用反卷积层将分辨率提高8倍，得到具有原始图像大小的特征图；最后，卷积层对特征映射进行操作，并生成像素的语义标记分数；在训练过程中，采用最大交叉熵损失来训练语义标记分支；在测试中，使用softmax函数计算像素的类概率。5.如权利要求4所述基于超像素处理遮挡的单目深度估计方法，其特征在于，所述步骤二三维平移估计即估计目标对象到相机镜头中心的距离，三维平移是相机坐标系中对象原点的坐标；假设t在图像上的投影是，根据假设针孔相机的以下投影方程来恢复和，公式如下：，是相机的焦距，是像素坐标系和相机坐标系的相对位移；之后使用hough投票层，在像素级语义标注结果和中心回归结果中找到二维目标中心。6.如权利要求5所述基于超像素处理遮挡的单目深度估计方法，其特征在于，所述步骤二三维旋转回归使用hough投票层预测的对象边界框，使用两个roi池层裁剪和汇集第一阶段生成的视觉特征；合并的特征映射被添加到一起，并输入到三个完全连接的fc层中；前两个fc层的维数为4096，最后一个fc层的维数为4
×
n，n为对象类的个数；对于每个类，最后一个fc层输出由四元数表示的三维旋转。7.如权利要求1所述基于超像素处理遮挡的单目深度估计方法，其特征在于，所述步骤三深度估计网络使用u-net编码器-解码器模型结构；编码器是经过预训练的resnet模型，深度解码器将输出转换为深度值；输入图像经过归一化处理，尺寸变为572
×
572，使用3
×
3的卷积层以及relu激活函数提取特征，输出尺寸为570
×
570
×
64的特征，再次进行卷积以及relu操作，进一步提取特征，输出568
×
568
×
64的特征，两次卷积、激活操作为一次编码，一共进行四次编码操作；每两次编码之间进行2
×
2的最大池化；解码器的操作主要为反卷积，通过反卷积恢复原来的尺度，把特征解码为深度图。8.如权利要求1所述基于超像素处理遮挡的单目深度估计方法，其特征在于，所述步骤四具体为：原图像和重建图像强制它们彼此一致来获得更好的深度；在已知深度信息和两相机位姿的条件下，图像可在两相机位姿下相互重建；输入两相机的位姿，深度图像可以在两相机的坐标系下相互转换；输入左视图、深度信息、相机位姿，可以反向重构右视图，重构的右视图和真实的右视图做结构相似性损失，以此来约束深度估计的网络；光度重建损失
为，其中为左视图，为重建的右视图，最终的损失为。

技术总结
本发明提供一种基于超像素处理遮挡的单目深度估计方法，属于计算机视觉领域，步骤一，图像预处理：对输入的双目图片进行图像去噪以及生成遮挡物体掩膜；步骤二，采用相机位姿估计进行位姿估计对图像进行重建：首先进行特征提取，相机位姿估计使用PoseCNN，之后将输入图像分为三个任务，分别为语义分割、三维旋转回归、三维平移估计；步骤三，采用深度估计网络进行深度估计对图像进行重建；步骤四，计算光度重建损失。使用光度重建损失来识别遮挡，可以有效去除影响网络训练的遮挡物体；图像输入网络之前，使用聚类分割，然后使用SSIM指标重新匹配双目图像对，网络预测的图像比较单一，提高了网络估计的准确率。高了网络估计的准确率。高了网络估计的准确率。

技术研发人员：程德强张晖敏寇旗旗王晓艺徐飞翔韩成功刘敬敬杨小冬
受保护的技术使用者：中国矿业大学
技术研发日：2022.09.02
技术公布日：2022/11/11

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种适用于铁路机车车辆闸片闸瓦图像识别的融合算法的制作方法

基于超像素处理遮挡的单目深度估计方法

相关文献

最热文献