对象姿势识别模型的构建方法、对象姿势识别方法及装置与流程
- 国知局
- 2024-09-14 14:49:24
本公开涉及人工智能,尤其涉及一种对象姿势识别模型的构建方法、对象姿势识别方法及装置。
背景技术:
1、在诸如游戏领域、控制领域等较多场景中都需要识别目标对象的姿势,其中,目标对象的姿势诸如可以为手势、人体姿态等。在相关技术中大多需要利用携带标签的样本图像对网络模型进行有监督训练,所需的训练样本的采集成本较高,也即模型训练成本较高;而且由于采集训练样本的成本较高,因此所采用的训练样本的数量通常不足,导致训练后的网络模型的对象姿势识别结果的准确性较差。
技术实现思路
1、为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种对象姿势识别模型的构建方法、对象姿势识别方法及装置。
2、第一方面,本公开实施例提供了一种对象姿势识别模型的构建方法,包括:获取第一对象样本图像;其中,所述第一对象样本图像为包含目标对象的图像;对所述第一对象样本图像进行增强处理,得到样本增强图像;将所述样本增强图像进行分割以得到增强图像块组,并将所述增强图像块组中的部分图像块进行掩码处理以得到掩码图像块组;基于所述掩码图像块组,通过第一网络获取所述目标对象的第一姿势识别信息;以及,基于所述增强图像块组,通过第二网络获取所述目标对象的第二姿势识别信息;根据所述第一姿势识别信息和所述第二姿势识别信息之间的差异,对所述第一网络进行自监督训练;根据自监督训练后的所述第一网络构建对象姿势识别模型。
3、第二方面,本公开实施例提供了一种对象姿势识别方法,包括:获取待识别图像;利用预构建的对象姿势识别模型,识别所述待识别图像中的目标对象的姿势;其中,所述对象姿势识别模型是基于第一方面提供的对象姿势识别模型的构建方法得到的。
4、第三方面,本公开实施例提供了一种对象姿势识别模型的构建装置,包括:样本图像获取模块,用于获取第一对象样本图像;其中,所述第一对象样本图像为包含目标对象的图像;样本图像增强模块,用于对所述第一对象样本图像进行增强处理,得到样本增强图像;图像分割及掩码模块,用于将所述样本增强图像进行分割以得到增强图像块组,并将所述增强图像块组中的部分图像块进行掩码处理以得到掩码图像块组;姿势识别模块,用于基于所述掩码图像块组,通过第一网络获取所述目标对象的第一姿势识别信息;以及,基于所述增强图像块组,通过第二网络获取所述目标对象的第二姿势识别信息;自监督训练模块,用于根据所述第一姿势识别信息和所述第二姿势识别信息之间的差异,对所述第一网络进行自监督训练;模型构建模块,用于根据自监督训练后的所述第一网络构建对象姿势识别模型。
5、第四方面,本公开实施例提供了一种对象姿势识别装置,包括:待识别图像获取模块,用于获取待识别图像;姿势识别模块,用于利用预构建的对象姿势识别模型,识别所述待识别图像中的目标对象的姿势;其中,所述对象姿势识别模型是基于第一方面所述的对象姿势识别模型的构建方法得到的。
6、第五方面,本公开实施例提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现第一方面的对象姿势识别模型的构建方法,或者实现第二方面的对象姿势识别方法。
7、第六方面,本公开实施例提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行第一方面的对象姿势识别模型的构建方法,或者实现第二方面的对象姿势识别方法。
8、本公开实施例提供的上述技术方案,无需对象样本图像携带姿势标签,通过对样本图像进行增强处理,并对样本增强图像进行分割处理得到增强图像块组,以及对增强图像块组中的部分图像块进行掩码处理得到掩码图像块组,利用第一网络基于掩码图像块组进行姿势识别,以及利用第二网络基于增强图像块组进行姿势识别,之后基于第一姿势识别信息和第二姿势识别信息之间的差异,采用自监督方式即可实现网络训练,最后利用训练后的第一网络即可构建对象姿势识别模型。上述方式由于无需样本图像携带姿势标签,因此极大降低了样本图像的采集成本,不仅可有效降低模型训练成本,而且也可以方便地采集大量样本图像进行训练,有助于提升姿势识别结果的准确性;且对象姿势识别模型是基于第一网络构建的,而第一网络在训练期间是针对掩码图像块组进行处理,因此信息处理能力良好,也有助于进一步提升姿势识别结果的准确性。
9、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
技术特征:1.一种对象姿势识别模型的构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述样本增强图像包括第一增强图像和第二增强图像;所述对所述第一对象样本图像进行增强处理,得到样本增强图像,包括:
3.根据权利要求2所述的方法,其特征在于,所述第一姿势识别信息包括:基于所述第一增强图像的掩码图像块组所得的第一识别姿势、以及基于所述第二增强图像的掩码图像块组所得的第二识别姿势;
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一姿势识别信息和所述第二姿势识别信息之间的差异,对所述第一网络进行自监督训练,包括:
5.根据权利要求2所述的方法,其特征在于,所述第一姿势识别信息包括:所述第一增强图像的掩码图像块组中的图像块信息和所述第二增强图像的掩码图像块组中的图像块信息;
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一姿势识别信息和所述第二姿势识别信息之间的差异,对所述第一网络进行自监督训练,包括:
7.根据权利要求1所述的方法,其特征在于,所述根据所述第一姿势识别信息和所述第二姿势识别信息之间的差异,对所述第一网络进行自监督训练,包括:
8.根据权利要求1至7任一项所述的方法,其特征在于,所述第一网络和所述第二网络分别与第三网络相连;
9.根据权利要求1至7任一项所述的方法,其特征在于,所述根据自监督训练后的所述第一网络构建对象姿势识别模型,包括:
10.根据权利要求9所述的方法,其特征在于,
11.一种对象姿势识别方法,其特征在于,包括:
12.一种对象姿势识别模型的构建装置,其特征在于,包括:
13.一种对象姿势识别装置,其特征在于,包括:
14.一种电子设备,其特征在于,所述电子设备包括:
15.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-10中任一所述的对象姿势识别模型的构建方法,或者实现上述权利要求11所述的对象姿势识别方法。
技术总结本公开涉及一种对象姿势识别模型的构建方法、对象姿势识别方法及装置,对象姿势识别模型的构建方法包括:获取第一对象样本图像;对第一对象样本图像进行增强处理,得到样本增强图像;将样本增强图像进行分割以得到增强图像块组,并将增强图像块组中的部分图像块进行掩码处理以得到掩码图像块组;基于掩码图像块组,通过第一网络获取目标对象的第一姿势识别信息;以及,基于增强图像块组,通过第二网络获取目标对象的第二姿势识别信息;根据第一姿势识别信息和第二姿势识别信息之间的差异,对第一网络进行自监督训练;根据自监督训练后的第一网络构建对象姿势识别模型。本公开在降低训练成本的基础上可提升姿势识别结果的准确性。技术研发人员:朱飞达,王从艺,林高杰,文石磊受保护的技术使用者:北京字跳网络技术有限公司技术研发日:技术公布日:2024/9/12本文地址:https://www.jishuxx.com/zhuanli/20240914/296058.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表