技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于双模态交互的开放词汇三维场景理解方法  >  正文

基于双模态交互的开放词汇三维场景理解方法

  • 国知局
  • 2024-09-11 14:34:31

本发明涉及图像处理和计算机视觉,特别涉及一种基于双模态交互的开放词汇三维场景理解方法。

背景技术:

1、三维场景理解是计算机视觉领域中的核心任务之一,主要目标是将三维空间中的点云数据准确划分为不同的实例对象。随着传感器技术的进步和三维数据在自动驾驶、机器人导航、智能监控等领域的广泛应用,有效的三维场景理解技术对于提高这些应用的准确性和可靠性至关重要。

2、近年来,深度学习技术的引入为三维场景理解带来了巨大的进步,通过深度神经网络可以学习到更加复杂和抽象的特征表示,显著提升分割的准确度和鲁棒性。然而,尽管这些方法在特征学习方面取得了进展,但在处理开放词汇和未见类别的能力上仍然存在限制。现有的深度学习模型通常依赖于大量标注数据,并且在训练过程中仅学习到有限的类别信息,这限制了模型在未知环境中的应用灵活性和效果。尽管深度学习在闭环系统内表现出色,但其在处理未见类别或开放词汇方面的能力十分有限。

技术实现思路

1、本发明的目的在于结合点云、图像和语言类的模型,通过开放词汇和未见类别提高对三维场景的理解,提供一种基于双模态交互的开放词汇三维场景理解方法。

2、为了实现上述发明目的,本发明提供了以下技术方案:

3、基于双模态交互的开放词汇三维场景理解方法,包括以下步骤:

4、步骤1,将原始点云数据输入三维场景理解模型,得到三维场景理解特征,所述三维场景理解特征同时具有文本信息描述和点云特征向量;所述三维场景理解模型包括点云特征提取网络、预训练图像语义提案网络、预训练图像生成文本网络、预训练文本编码网络、自适应语言文本编码器;

5、所述步骤1具体包括以下步骤:

6、步骤1-1,使用点云特征提取网络对原始点云数据进行学习,得到第一点云特征;

7、步骤1-2,从原始点云数据中生成二维图像数据,使用预训练图像语义提案网络预测二维图像数据中的图像实例提案,并将二维图像数据携带的深度图像信息与图像实例提案进行三维投影,得到第二点云特征;

8、步骤1-3,将第一点云特征和第二点云特征输入自适应语言文本编码器,得到可匹配文本信息描述特征的点云特征向量;

9、步骤1-4,使用预训练图像生成文本网络提取二维图像数据中的文本信息,并将文本信息输入预训练文本编码网络后得到文本信息描述特征;

10、步骤1-5,将点云特征向量和文本信息描述特征进行匹配,得到三维场景理解特征;

11、步骤2,构建损失函数对所述三维场景理解模型进行训练,所述损失函数包括实例预测损失函数、分类损失函数、图文匹配损失函数、关联损失函数。

12、与现有技术相比,本发明的有益效果:本发明通过预训练图像生成文本网络获取文本信息描述特征,形成开放词汇,再通过无标注的点云特征提取网络获取点云特征向量,将文本信息描述特征和点云特征向量匹配后得到三维场景理解特征,实现双模态交互,由于点云特征提取网络是无标注的,所以三维场景理解模型能够针对未见类别进行学习,提升了三维场景理解模型在未知环境中的应用灵活性和效果。

技术特征:

1.基于双模态交互的开放词汇三维场景理解方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于双模态交互的开放词汇三维场景理解方法,其特征在于:所述步骤1-1具体包括以下步骤:

3.根据权利要求1所述的基于双模态交互的开放词汇三维场景理解方法,其特征在于:所述实例预测损失函数为:

4.根据权利要求1所述的基于双模态交互的开放词汇三维场景理解方法,其特征在于:所述分类损失函数为:

5.根据权利要求1所述的基于双模态交互的开放词汇三维场景理解方法,其特征在于:所述图文匹配损失函数为:

6.根据权利要求1所述的基于双模态交互的开放词汇三维场景理解方法,其特征在于:所述关联损失函数为:

技术总结本发明涉及涉及图像处理和计算机视觉技术领域,公开基于双模态交互的开放词汇三维场景理解方法,包括以下步骤:将原始点云数据输入三维场景理解模型,得到三维场景理解特征,所述三维场景理解特征同时具有文本信息描述和点云特征向量;所述三维场景理解模型包括点云特征提取网络、预训练图像语义提案网络、预训练图像生成文本网络、预训练文本编码网络、自适应语言文本编码器;构建损失函数对所述三维场景理解模型进行训练,所述损失函数包括实例预测损失函数、分类损失函数、图文匹配损失函数、关联损失函数。本发明结合点云、图像和语言类的模型,通过开放词汇和未见类别提高对三维场景的理解。技术研发人员:潘磊,栾五洋,李俊辉,郑远,王艾,傅强,王梦琪,卢志鹏,秦晨晨受保护的技术使用者:中国民用航空飞行学院技术研发日:技术公布日:2024/9/9

本文地址:https://www.jishuxx.com/zhuanli/20240911/291444.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。