技术新讯 > 计算推算,计数设备的制造及其应用技术 > 图像识别方法、装置、电子设备及计算机可读存储介质与流程  >  正文

图像识别方法、装置、电子设备及计算机可读存储介质与流程

  • 国知局
  • 2024-08-08 16:49:57

本技术属于人工智能领域,具体涉及一种图像识别方法、装置、电子设备及计算机可读存储介质。

背景技术:

1、随着信息时代的到来,信息的高度发展为人类带来了更多的便利,相应地,也更容易发生信息泄露的风险。特别是在企业中,大部分企业都存在信息被员工盗摄并向外泄露的事件。目前对于员工盗摄公司信息进行检测方式为人工通过摄像头对该现象进行实时监控,然而,这种依靠人为肉眼进行监控的方法不仅费时费力,并且效率低下。

技术实现思路

1、鉴于此,本技术的目的在于提供一种图像识别方法、装置、电子设备及计算机可读存储介质,以改善依靠人为肉眼对员工盗摄公司信息进行监控导致效率低下的问题。

2、本技术的实施例是这样实现的:

3、第一方面,本技术实施例提供了一种图像识别方法,所述方法包括:利用预设的目标检测模型对待识别图像中的指定目标进行检测,得到每个指定目标对应的检测框;其中,每个所述指定目标包括处于指定视角的人、人手、拍照设备或屏幕;基于每个所述检测框之间的位置关系,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄。

4、本技术实施例中,为了提升对于员工盗摄公司信息进行监控的效率,基于利用预设的目标检测模型检测出的待识别图像上的指定目标对应的检测框,并通过判断每个检测框之间的位置关系,来识别出待识别图像中的人是否在利用拍照设备对屏幕进行拍照,能够无需人工对图像中的内容进行识别,提升了对于监控员工盗摄公司信息的效率。

5、结合第一方面实施例的一种可能的实施方式,基于每个所述检测框之间的位置关系,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄,包括:通过判断各个所述检测框之间的位置关系、以及判断所述拍照设备对应的检测框是否位于所述屏幕对应的检测框的左右范围内、以及判断所述人手对应的检测框是否与所述拍照设备对应的检测框重叠,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄。其中,在各个所述检测框之间的位置关系处于预设位置关系、以及所述拍照设备对应的检测框位于所述屏幕对应的检测框的范围内、以及所述人手对应的检测框与所述拍照设备对应的检测框重叠的情况下,确定所述待识别图像中的人在利用拍照设备对屏幕进行拍摄。

6、本技术实施例中,由于人利用拍照设备对屏幕进行拍摄时使用的动作的特征较为明显,进而各个检测框之间的位置关系也应处于特定的位置关系,因此通过判断各个检测框之间的位置关系是否处于预设的位置关系能够判断出待识别图像中的人是否是在执行利用拍照设备对屏幕进行拍照的动作,进一步的,人在利用拍照设备对屏幕进行拍照的同时,拍照设备对应的检测框通常位于屏幕对应的检测框的左右范围内,并且人在执行拍摄动作时需手持拍照设备,因此拍照设备对应的检测框应与手机对应的检测框重叠,因此,通过判断各个检测框之间的位置关系、判断拍照设备对应的检测框是否位于屏幕对应的检测框的左右范围内,以及判断人手对应的检测框是否与拍照设备对应的检测框重叠来识别待识别图像中的人是否在利用拍照设备对屏幕进行拍摄,能够更加精确的识别出待检测图像中的场景是否为人在利用拍照设备对屏幕进行拍摄,提升对于监控员工盗摄公司信息的效率。

7、结合第一方面实施例的一种可能的实施方式,基于每个所述检测框之间的位置关系,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄,包括:基于每个所述检测框之间的位置关系、所述人手对应的检测框的数量以及所述拍照设备对应的检测框的宽度和高度,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄。

8、本技术实施例中,为了提升对待识别图像中的人是否在利用拍照设备对屏幕进行拍摄的内容识别的准确度,基于利用预设的目标检测模型检测出的待识别图像上的指定目标对应的检测框,并通过判断每个检测框之间的位置关系、人手对应的检测框的数量以及拍照设备对应的检测框的高度,来识别出待识别图像中的人是否在利用拍照设备对屏幕进行拍照,能够更加精确的识别出待检测图像中的场景是否为人在利用拍照设备对屏幕进行拍摄,提升了对于监控员工盗摄公司信息的效率。

9、结合第一方面实施例的一种可能的实施方式,基于每个所述检测框之间的位置关系、所述人手对应的检测框的数量以及所述拍照设备对应的检测框的宽度和高度,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄,包括:在各个所述检测框之间的位置关系处于预设位置关系、以及所述拍照设备对应的检测框位于所述屏幕对应的检测框的范围内、以及所述人手对应的检测框与所述拍照设备对应的检测框重叠的情况下,通过判断与所述拍照设备对应的检测框重叠的所述人手对应的检测框的数量是否大于等于第一预设阈值,以及判断所述拍照设备对应的检测框的宽度和高度的比值是否大于等于第二预设阈值,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄;其中,在与所述拍照设备对应的检测框重叠的所述人手对应的检测框的数量大于等于第一预设阈值,且,所述拍照设备对应的检测框的宽度和高度之间的比值大于等于第二预设阈值的情况下,确定所述待识别图像中的人在利用拍照设备对屏幕进行拍摄。

10、本技术实施例中,由于人在利用拍照设备对屏幕进行拍摄时,一般是双手持拍照设备,因此手对应的检测框的数量应大于第一预设阈值;并且,由于拍照设备在为手机、平板的情况下,通常人在利用拍照设备对屏幕进行拍摄时,是横屏进行拍摄,因此拍照设备对应的检测框的宽度和高度之间的比值大于等于第二预设阈值,因此,在各个检测框之间的位置关系处于预设位置关系、以及拍照设备对应的检测框位于屏幕对应的检测框的范围内、以及人手对应的检测框与拍照设备对应的检测框重叠的情况下,通过判断与拍照设备对应的检测框重叠的人手对应的检测框的数量是否大于等于第一预设阈值,以及判断拍照设备对应的检测框的宽度和高度的比值是否大于等于第二预设阈值,识别出待识别图像中的人是否在利用拍照设备对屏幕进行拍摄,能够更加精确的识别出待检测图像中的场景是否为人在利用拍照设备对屏幕进行拍摄,提升对于监控员工盗摄公司信息的效率。

11、结合第一方面实施例的一种可能的实施方式,所述方法还包括:在所述屏幕对应的检测框的宽度和高度之间的比值小于所述第二预设阈值的情况下,对所述人对应的检测框中的图像内容、所述拍照设备对应的检测框中的图像内容以及所述屏幕对应的检测框中的图像内容进行场景提取,得到提取后的场景图;利用预先设置的万物识别模型对所述提取后的场景图进行分类判定,得到所述提取后的场景图对应的场景描述词条;基于所述场景描述词条,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄;其中,在所述场景描述词条为指定词条的情况下,确定所述待识别图像中的人在利用拍照设备对屏幕进行拍摄。

12、本技术实施例中,在屏幕对应的检测框的宽度和高度之间的比值小于第二预设阈值的情况下,即拍照设备为竖屏状态下,通过提取人对应的检测框、拍照设备对应的检测框以及屏幕对应的检测框中的图像内容进行场景提取,得到场景图,利用预先设置的万物识别模型对提取后的场景图进行分配判定,得到提取后的场景图对应的场景描述词条,并基于场景描述词条,识别出待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄,能够在拍照设备为竖屏状态下,对图像内容进行识别,识别出待检测图像中的场景是否为人在利用拍照设备对屏幕进行拍摄的精确度。

13、结合第一方面实施例的一种可能的实施方式,对所述人对应的检测框、所述拍照设备对应的检测框以及所述屏幕对应的检测框进行场景提取,得到提取后的场景图,包括:获取所述人对应的检测框的左上角坐标以及右下角的坐标、所述拍照设备对应的检测框的左上角的坐标以及右下角的坐标、所述屏幕对应的检测框的左上角的坐标以及右下角的坐标;基于各个左上角坐标得到新的左上角坐标,以及基于各个右下角坐标得到新的右下角坐标;对新的左上角坐标以及新的右下角坐标对应的新检测框中的图像内容进行场景提取,得到提取后的场景图。

14、本技术实施例中,通过利用人、拍照设备、屏幕对应的检测框的左上角及右下角的坐标,基于人、拍照设备、屏幕对应的检测框的左上角及右下角的坐标左边端点坐标、右边端点坐标、下边端点坐标、上方端点坐标,构成一个新的检测框的左上角和右下角的坐标,新检测框所包含范围能够完整呈现人的动作以及周边的场景,因此基于新检测框所提取到的场景能够呈现完整的图像场景,以便预先设置的万物识别模型能够更准确对提取后的场景图进行识别,能够更加精确的识别出待检测图像中的场景是否为人在利用拍照设备对屏幕进行拍摄。

15、结合第一方面实施例的一种可能的实施方式,利用预设的目标检测模型对待识别图像中的指定目标进行检测,得到每个指定目标对应的检测框,包括:获取所述待识别图像中各个所述指定目标的检测距离之间的平均检测距离;其中,各个所述指定目标的检测距离为目标距离采集设备的相对距离;在所述平均检测距离大于预设距离的情况下,采用第一目标检测模型对所述待识别图像进行目标检测,得到每个指定目标对应的检测框;在所述平均检测距离不大于所述预设距离的情况下,采用第二目标检测模型对所述待识别图像进行目标检测,得到每个指定目标对应的检测框;其中,在所述平均检测距离大于预设距离的情况下,所述第一目标检测模型对每个所述指定目标对应的检测框的检出成功率,大于所述第二目标检测模型对每个所述指定目标对应的检测框的检出成功率。

16、本技术实施例中,由于不同的目标检测模型对待识别目标中的指定目标进行检测的成功率会受到待识别图像中的目标距离采集设备的相对距离的影响,通过获取待识别图像中的各个指定目标的检测距离之间的平均检测距离,并判断待识别图像中的各个指定目标的检测距离之间的平均检测距离与预设距离之间的关系,在平均检测距离大于预设距离的情况下,采用第一目标检测模型对待识别图像进行目标检测,得到每个指定目标对应的检测框,在平均检测距离不大于预设距离的,采用第二目标检测模型对待识别图像进行目标检测,得到每个指定目标对应的检测框,通过判断待识别图像中各个指定目标的检测距离之间的平均检测距离与预设距离之间的关系,选取出对指定目标检出成功率更高的目标检测模型,能够提升对待识别图像进行目标检测的准确性。

17、结合第一方面实施例的一种可能的实施方式,在基于每个所述检测框之间的位置关系,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄之前,所述方法还包括:针对每一种指定目标对应的检测框,计算每个检测框与同一指定目标下的其他所有检测框之间的交并比;在存在两个检测框之间的交并比大于预设阈值的情况下,去除其中一个检测框;其中,在所述两个检测框之间的交并比大于预设阈值的情况下,表征两个检测框为重复的检测框。

18、本技术实施例中,针对每一种指定目标对应的检测框,计算每个检测框与同一指定目标下的其他所有检测框之间的交并比,通过计算两个检测框之间的交并比,判断出每种指定目标对应的检测框是否存在重合的检测框,在存在重合的检测框的情况下,去除其中一种检测框,避免每个指定目标对应的检测框有重复,会对后续识别结果的准确性带来影响,能够提升识别结果的准确性。

19、第二方面,本技术实施例提供了一种图像识别方法,所述方法包括:获取多组训练图像数据集;其中,每个图像数据集中包含训练图像以及对所述训练图像中的指定目标进行标注后的检测框;其中,所述指定目标包括人、人手、拍照设备和屏幕;利用所述多组训练图像数据集对无先验知识的初始目标检测模型进行训练,得到训练好的目标检测模型;所述目标检测模型用于对待识别图像中的指定目标进行检测,得到每个指定目标对应的检测框。

20、第三方面,本技术实施例提供了一种图像识别装置,所述装置包括:

21、检测单元,被配置为利用预设的目标检测模型对待识别图像中的指定目标进行检测,得到每个指定目标对应的检测框;其中,每个所述指定目标包括处于指定视角的人、人手、拍照设备或屏幕;识别单元,被配置为基于每个所述检测框之间的位置关系,识别出所述待识别图像中的人是否在利用所述拍照设备对屏幕进行拍摄。本技术的其他特征和优点将在随后的说明书阐述。本技术的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

22、第四方面,本技术实施例提供了一种图像识别装置,所述装置包括:获取单元,被配置为获取多组训练图像数据集;其中,每个图像数据集中包含训练图像以及对所述训练图像中的指定目标进行标注后的检测框;其中,所述指定目标包括人、人手、拍照设备和屏幕;处理单元,被配置为利用所述多组训练图像数据集对无先验知识的初始目标检测模型进行训练,得到训练好的目标检测模型;所述目标检测模型用于对待识别图像中的指定目标进行检测,得到每个指定目标对应的检测框。

23、第五方面,本技术实施例提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器与存储器耦合,所述处理器用于执行所述存储器中存储的计算机程序时实现上述第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法,以及上述第二方面实施例提供的方法。

24、第六方面,本技术实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法,以及上述第二方面实施例提供的方法。

25、应当理解的是,本发明实施例的第二~六方面与本发明实施例的第一方面的技术方案一致,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。

26、本技术的其他特征和优点将在随后的说明书阐述。本技术的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

本文地址:https://www.jishuxx.com/zhuanli/20240808/270644.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。