技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于2D预训练分割模型监督的3D高斯全景分割方法、计算机设备和程序产品 > 正文

基于2D预训练分割模型监督的3D高斯全景分割方法、计算机设备和程序产品

国知局
2025-01-10 13:15:57

本申请涉及计算机视觉和深度学习领域，特别是涉及一种基于2d预训练分割模型监督的3d高斯全景分割方法、计算机设备和程序产品。

背景技术：

1、从2d的图片建立起对整个3d场景的语义等信息的理解是十分有必要的，然而，仅仅使用2d分割模型直接对图片进行分割，会缺少3d信息，从而难以对场景建立起整体的认知。

2、现有的全景分割模型往往存在以下三个问题：1)难以产生具有3d一致性的分割结果，即对于同一个物体在不同视角下的分割结果不同。2)训练速度过慢，目前的方法往往需要长达24小时以及以上的时间用于训练。3)渲染速度慢，一秒只能渲染十多张分割图。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种基于2d预训练分割模型监督的3d高斯全景分割方法。

2、本申请基于2d预训练分割模型监督的3d高斯全景分割方法，包括：

3、将同一场景不同视角的多张输入图像输入至2d预训练分割模型，获得2d语义分割图和2d实例分割图，根据所述输入图像获得对应所述输入图像的相机参数，根据所述输入图像获得基于3d高斯场景的3d高斯初始表达，所述3d高斯初始表达是由多个高斯椭球随机初始化形成的场景；

4、基于所述相机参数，获得所述3d高斯初始表达在相应视角下投影获得的2d高斯表达，所述2d高斯表达包括颜色信息、语义信息和实例信息；

5、根据所述颜色信息获得第一生成图像，根据所述语义信息获得第二生成图像，根据所述实例信息获得第三生成图像；

6、利用预设损失参数训练优化3d高斯场景表达，获得训练完成的3d高斯分割模型，所述预设损失参数包括：所述第一生成图像与相应输入图像的第一预设损失、所述第二生成图像与相应所述2d语义分割图的第二预设损失、所述第三生成图像与映射实例分割结果的第三预设损失，所述映射实例分割结果经由所述第三生成图像与相应所述2d实例分割图通过匹配映射获得；

7、基于所述3d高斯分割模型，获得3d高斯全景分割结果，所述3d高斯全景分割结果包括3d高斯场景的语义分割信息和实例分割信息。

8、可选的，根据所述输入图像获得基于3d高斯场景的3d高斯初始表达，所述3d高斯初始表达是由多个高斯椭球随机初始化形成的场景，具体包括：

9、根据所述输入图像获得基于3d高斯场景的初始点云，基于所述初始点云获得场景的3d高斯初始表达。

10、可选的，所述映射实例分割结果经由所述第三生成图像与相应所述2d实例分割图通过匹配映射获得，具体包括：

11、将所述2d实例分割图每个像素的实例id匹配映射至所述第三生成图像，得到用于监督的映射实例分割结果。

12、可选的，基于所述初始点云获得场景的3d高斯初始表达，具体包括：将每个初始点云的位置视作一个高斯椭球的中心，对所述高斯椭球的形状随机初始化，获得由多个形状各异的高斯椭球组成的场景，从而获得3d高斯初始表达。

13、可选的，基于所述相机参数，获得所述3d高斯初始表达在相应视角下投影获得的2d高斯表达，所述2d高斯表达包括颜色信息、语义信息和实例信息，具体包括：

14、基于所述相机参数，将所述3d高斯初始表达中的各个高斯椭球投影至与所述相机参数相对应的2d平面，使所述高斯椭球投影为高斯椭圆，各所述高斯椭圆在所述2d平面上形成颜色信息、语义信息和实例信息。

15、可选的，根据所述颜色信息获得第一生成图像，具体包括：将所述高斯椭圆经过高斯可微光栅化，混合各个像素点的颜色信息，从而获得所述第一生成图像；

16、根据所述语义信息获得第二生成图像，具体包括：将所述高斯椭圆经过高斯可微光栅化，混合各个像素点的语义信息，从而获得所述第二生成图像。

17、可选的，各个像素点的语义信息，利用下式进行获得：

18、

19、式中，

20、κp表示像素p对应的语义信息；

21、ls表示神经网络，用于将语义编码映射为对应各种语义的概率分布；

22、ei表示第i个高斯球对应的颜色信息；

23、α′i(p)表示第i个高斯球在像素p对应的不透明度；

24、α′j表示第j个高斯球的不透明度。

25、可选的，根据所述实例信息获得第三生成图像，具体包括：

26、将所述高斯椭圆经过高斯可微光栅化，混合各个像素点的实例信息，获得第三生成图像。

27、可选的，所述第三预设损失利用下式获得：

28、

29、其中，为所述第三预设损失，用于表示实例损失；

30、|i|表示图像的像素个数；

31、wp表示2d预训练分割模型预测的每个像素的置信度；

32、h表示的是第h个实例；

33、πp表示渲染得到的第p个像素对应第p类实例的概率；

34、是2d预训练分割模型预测的p个像素对应第p类实例的概率；

35、是将所述2d实例分割图通过线性匹配映射的方式，获得映射实例分割结果：

36、

37、其中，表示选择的映射；

38、πi表示当前映射；

39、hi表示图像的所有实例；

40、|ih|表示图像对应h实例的像素个数；

41、πi(h)表示第h个实例被映射到的实例编号；

42、wp表示2d预训练分割模型预测的每个像素的置信度；

43、h表示的是第h个实例；

44、πp表示渲染得到的第p个像素对应第p类实例的概率。

45、本申请还提供一种计算机设备，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器执行所述计算机程序以实现本申请所述的基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

46、本申请还提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现本申请所述的基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

47、本申请还提供一种计算机程序产品，包括计算机指令，该计算机指令被处理器执行时实现本申请所述的基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

48、本申请基于2d预训练分割模型监督的3d高斯全景分割方法至少具有以下效果：

49、本申请训练优化后的3d高斯场景表达能符合图片所对应的现实场景。具体通过第一预设损失优化3d高斯表达，以完成该过程。在此基础上，通过第二预设损失，进一步优化场景的语义表示；通过第三预设损失，进一步优化场景的实例表示。优化完成后的模型具有能拟合现实的场景的语义和实例信息，即可用以获取整个场景的全景表达，即完成整个方法流程。

技术特征：

1.基于2d预训练分割模型监督的3d高斯全景分割方法，其特征在于，包括：

2.如权利要求1所述的3d高斯全景分割方法，其特征在于，根据所述输入图像获得基于3d高斯场景的3d高斯初始表达，所述3d高斯初始表达是由多个高斯椭球随机初始化形成的场景，具体包括：

3.如权利要求2所述的3d高斯全景分割方法，其特征在于，基于所述初始点云获得场景的3d高斯初始表达，具体包括：将每个初始点云的位置视作一个高斯椭球的中心，对所述高斯椭球的形状随机初始化，获得由多个形状各异的高斯椭球组成的场景，从而获得3d高斯初始表达。

4.如权利要求1所述的3d高斯全景分割方法，其特征在于，基于所述相机参数，获得所述3d高斯初始表达在相应视角下投影获得的2d高斯表达，所述2d高斯表达包括颜色信息、语义信息和实例信息，具体包括：

5.如权利要求4所述的3d高斯全景分割方法，其特征在于，

6.如权利要求5所述的3d高斯全景分割方法，其特征在于，根据所述实例信息获得第三生成图像，具体包括：

7.如权利要求1所述的3d高斯全景分割方法，其特征在于，所述映射实例分割结果经由所述第三生成图像与相应所述2d实例分割图通过匹配映射获得，具体包括：

8.如权利要求7所述的3d高斯全景分割方法，其特征在于，所述第三预设损失利用下式获得：

9.计算机设备，包括存储器、处理器及存储在存储器上的计算机程序，其特征在于，所述处理器执行所述计算机程序以实现如权利要求1～8任一项基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

10.计算机程序产品，包括计算机指令，其特征在于，该计算机指令被处理器执行时实现如权利要求1～8任一项所述的基于2d预训练分割模型监督的3d高斯全景分割方法的步骤。

技术总结本申请涉及一种基于2D预训练分割模型监督的3D高斯全景分割方法、计算机设备和程序产品，3D高斯全景分割方法包括：将同一场景不同视角的多张输入图像输入至2D预训练分割模型，获得2D语义分割图和2D实例分割图，获得基于3D高斯场景的3D高斯初始表达，3D高斯初始表达是由多个高斯椭球随机初始化形成的场景；获得3D高斯初始表达在相应视角下投影获得的2D高斯表达；根据颜色信息获得第一生成图像，根据语义信息获得第二生成图像，根据实例信息获得第三生成图像；利用预设损失参数训练优化3D高斯场景表达，获得训练完成的3D高斯分割模型；基于3D高斯分割模型，获得3D高斯场景的语义分割信息和实例分割信息。技术研发人员：赵磊,马骋,莫竣程,林怀忠,张占杰,李光远,孙嘉锴,尹浩霖,蓝泽铧,张权威,王永康,陈嘉芙,褚天易,饶晨,焦涵,贾世安,张玮婧,邢卫受保护的技术使用者：浙江大学技术研发日：技术公布日：2025/1/6

标签：全景高斯模型技术资料下载

本文地址：https://www.jishuxx.com/zhuanli/20250110/352009.html

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 YYfuon@163.com 举报，一经查实，本站将立刻删除。

上一篇
一种自动生成雷达接口控制文件的方法及装置与流程

下一篇
返回列表