技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于2D预训练分割模型监督的3D高斯全景分割方法、计算机设备和程序产品  >  正文

基于2D预训练分割模型监督的3D高斯全景分割方法、计算机设备和程序产品

  • 国知局
  • 2025-01-10 13:15:57

本申请涉及计算机视觉和深度学习领域,特别是涉及一种基于2d预训练分割模型监督的3d高斯全景分割方法、计算机设备和程序产品。

背景技术:

1、从2d的图片建立起对整个3d场景的语义等信息的理解是十分有必要的,然而,仅仅使用2d分割模型直接对图片进行分割,会缺少3d信息,从而难以对场景建立起整体的认知。

2、现有的全景分割模型往往存在以下三个问题:1)难以产生具有3d一致性的分割结果,即对于同一个物体在不同视角下的分割结果不同。2)训练速度过慢,目前的方法往往需要长达24小时以及以上的时间用于训练。3)渲染速度慢,一秒只能渲染十多张分割图。

技术实现思路

1、基于此,有必要针对上述技术问题,提供一种基于2d预训练分割模型监督的3d高斯全景分割方法。

2、本申请基于2d预训练分割模型监督的3d高斯全景分割方法,包括:

3、将同一场景不同视角的多张输入图像输入至2d预训练分割模型,获得2d语义分割图和2d实例分割图,根据所述输入图像获得对应所述输入图像的相机参数,根据所述输入图像获得基于3d高斯场景的3d高斯初始表达,所述3d高斯初始表达是由多个高斯椭球随机初始化形成的场景;

4、基于所述相机参数,获得所述3d高斯初始表达在相应视角下投影获得的2d高斯表达,所述2d高斯表达包括颜色信息、语义信息和实例信息;

5、根据所述颜色信息获得第一生成图像,根据所述语义信息获得第二生成图像,根据所述实例信息获得第三生成图像;

6、利用预设损失参数训练优化3d高斯场景表达,获得训练完成的3d高斯分割模型,所述预设损失参数包括:所述第一生成图像与相应输入图像的第一预设损失、所述第二生成图像与相应所述2d语义分割图的第二预设损失、所述第三生成图像与映射实例分割结果的第三预设损失,所述映射实例分割结果经由所述第三生成图像与相应所述2d实例分割图通过匹配映射获得;

7、基于所述3d高斯分割模型,获得3d高斯全景分割结果,所述3d高斯全景分割结果包括3d高斯场景的语义分割信息和实例分割信息。

8、可选的,根据所述输入图像获得基于3d高斯场景的3d高斯初始表达,所述3d高斯初始表达是由多个高斯椭球随机初始化形成的场景,具体包括:

9、根据所述输入图像获得基于3d高斯场景的初始点云,基于所述初始点云获得场景的3d高斯初始表达。

10、可选的,所述映射实例分割结果经由所述第三生成图像与相应所述2d实例分割图通过匹配映射获得,具体包括:

11、将所述2d实例分割图每个像素的实例id匹配映射至所述第三生成图像,得到用于监督的映射实例分割结果。

12、可选的,基于所述初始点云获得场景的3d高斯初始表达,具体包括:将每个初始点云的位置视作一个高斯椭球的中心,对所述高斯椭球的形状随机初始化,获得由多个形状各异的高斯椭球组成的场景,从而获得3d高斯初始表达。

13、可选的,基于所述相机参数,获得所述3d高斯初始表达在相应视角下投影获得的2d高斯表达,所述2d高斯表达包括颜色信息、语义信息和实例信息,具体包括:

14、基于所述相机参数,将所述3d高斯初始表达中的各个高斯椭球投影至与所述相机参数相对应的2d平面,使所述高斯椭球投影为高斯椭圆,各所述高斯椭圆在所述2d平面上形成颜色信息、语义信息和实例信息。

15、可选的,根据所述颜色信息获得第一生成图像,具体包括:将所述高斯椭圆经过高斯可微光栅化,混合各个像素点的颜色信息,从而获得所述第一生成图像;

16、根据所述语义信息获得第二生成图像,具体包括:将所述高斯椭圆经过高斯可微光栅化,混合各个像素点的语义信息,从而获得所述第二生成图像。

17、可选的,各个像素点的语义信息,利用下式进行获得:

18、

19、式中,

20、κp表示像素p对应的语义信息;

21、ls表示神经网络,用于将语义编码映射为对应各种语义的概率分布;

22、ei表示第i个高斯球对应的颜色信息;

23、α′i(p)表示第i个高斯球在像素p对应的不透明度;

24、α′j表示第j个高斯球的不透明度。

25、可选的,根据所述实例信息获得第三生成图像,具体包括:

26、将所述高斯椭圆经过高斯可微光栅化,混合各个像素点的实例信息,获得第三生成图像。

27、可选的,所述第三预设损失利用下式获得:

28、

29、其中,为所述第三预设损失,用于表示实例损失;

30、|i|表示图像的像素个数;

31、wp表示2d预训练分割模型预测的每个像素的置信度;

32、h表示的是第h个实例;

33、πp表示渲染得到的第p个像素对应第p类实例的概率;

34、是2d预训练分割模型预测的p个像素对应第p类实例的概率;

35、是将所述2d实例分割图通过线性匹配映射的方式,获得映射实例分割结果:

36、

37、其中,表示选择的映射;

38、πi表示当前映射;

39、hi表示图像的所有实例;

40、|ih|表示图像对应h实例的像素个数;

41、πi(h)表示第h个实例被映射到的实例编号;

42、wp表示2d预训练分割模型预测的每个像素的置信度;

43、h表示的是第h个实例;

44、πp表示渲染得到的第p个像素对应第p类实例的概率。

45、本申请还提供一种计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现本申请所述的基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

46、本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请所述的基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

47、本申请还提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现本申请所述的基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

48、本申请基于2d预训练分割模型监督的3d高斯全景分割方法至少具有以下效果:

49、本申请训练优化后的3d高斯场景表达能符合图片所对应的现实场景。具体通过第一预设损失优化3d高斯表达,以完成该过程。在此基础上,通过第二预设损失,进一步优化场景的语义表示;通过第三预设损失,进一步优化场景的实例表示。优化完成后的模型具有能拟合现实的场景的语义和实例信息,即可用以获取整个场景的全景表达,即完成整个方法流程。

技术特征:

1.基于2d预训练分割模型监督的3d高斯全景分割方法,其特征在于,包括:

2.如权利要求1所述的3d高斯全景分割方法,其特征在于,根据所述输入图像获得基于3d高斯场景的3d高斯初始表达,所述3d高斯初始表达是由多个高斯椭球随机初始化形成的场景,具体包括:

3.如权利要求2所述的3d高斯全景分割方法,其特征在于,基于所述初始点云获得场景的3d高斯初始表达,具体包括:将每个初始点云的位置视作一个高斯椭球的中心,对所述高斯椭球的形状随机初始化,获得由多个形状各异的高斯椭球组成的场景,从而获得3d高斯初始表达。

4.如权利要求1所述的3d高斯全景分割方法,其特征在于,基于所述相机参数,获得所述3d高斯初始表达在相应视角下投影获得的2d高斯表达,所述2d高斯表达包括颜色信息、语义信息和实例信息,具体包括:

5.如权利要求4所述的3d高斯全景分割方法,其特征在于,

6.如权利要求5所述的3d高斯全景分割方法,其特征在于,根据所述实例信息获得第三生成图像,具体包括:

7.如权利要求1所述的3d高斯全景分割方法,其特征在于,所述映射实例分割结果经由所述第三生成图像与相应所述2d实例分割图通过匹配映射获得,具体包括:

8.如权利要求7所述的3d高斯全景分割方法,其特征在于,所述第三预设损失利用下式获得:

9.计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现如权利要求1~8任一项基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

10.计算机程序产品,包括计算机指令,其特征在于,该计算机指令被处理器执行时实现如权利要求1~8任一项所述的基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

技术总结本申请涉及一种基于2D预训练分割模型监督的3D高斯全景分割方法、计算机设备和程序产品,3D高斯全景分割方法包括:将同一场景不同视角的多张输入图像输入至2D预训练分割模型,获得2D语义分割图和2D实例分割图,获得基于3D高斯场景的3D高斯初始表达,3D高斯初始表达是由多个高斯椭球随机初始化形成的场景;获得3D高斯初始表达在相应视角下投影获得的2D高斯表达;根据颜色信息获得第一生成图像,根据语义信息获得第二生成图像,根据实例信息获得第三生成图像;利用预设损失参数训练优化3D高斯场景表达,获得训练完成的3D高斯分割模型;基于3D高斯分割模型,获得3D高斯场景的语义分割信息和实例分割信息。技术研发人员:赵磊,马骋,莫竣程,林怀忠,张占杰,李光远,孙嘉锴,尹浩霖,蓝泽铧,张权威,王永康,陈嘉芙,褚天易,饶晨,焦涵,贾世安,张玮婧,邢卫受保护的技术使用者:浙江大学技术研发日:技术公布日:2025/1/6

本文地址:https://www.jishuxx.com/zhuanli/20250110/352009.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。