技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于人工智能的视频图像特征追踪方法及装置与流程 > 正文

一种基于人工智能的视频图像特征追踪方法及装置与流程

国知局
2024-07-31 23:13:40

本技术涉及图像处理领域，尤其涉及一种基于人工智能的视频图像特征追踪方法及装置。

背景技术：

1、随着信息技术的迅猛发展，人工智能（ai）已逐渐渗透到我们生活的方方面面，尤其在视频图像处理领域，其应用日益广泛。视频图像特征追踪技术，作为人工智能在视频处理领域的重要分支，已成为研究热点和前沿技术。

2、视频图像特征追踪技术的核心在于通过计算机视觉和机器学习算法，实现对视频图像中特定目标的自动识别和持续追踪。这一技术涉及多个学科领域的知识，包括图像处理、模式识别、机器学习、人工智能等。通过运用这些技术，我们可以对视频图像中的目标进行准确、高效的定位和跟踪，从而为后续的智能分析、决策和控制提供重要支持。

3、对于一段视频图像中特征的持续追踪，一般通过对视频图像中每一帧画面进行特征提取进行，但是对于帧率较高的视频，对每一帧画面进行进行特征会消耗大量算力，处理速度较慢。

技术实现思路

1、本技术实施例提供一种基于人工智能的视频图像特征追踪方法及装置，以改善上述问题。

2、为达到上述目的，本技术采用如下技术方案：

3、第一方面，本技术实施例提出了一种基于人工智能的视频图像特征追踪方法，方法包括：

4、获取目标视频节，基于目标视频节获取第m帧图像;

5、基于神经网络模型确定第m帧图像中的目标图像并显示，其中，目标图像为被追踪特征的图像；

6、获取第m-n帧图像与第m+n帧图像，基于第m帧图像中的目标图像，分别确定第m-n帧图像与第m+n帧图像中的目标图像,其中，m、n为大于0的自然数，且m-n≥1；

7、基于第m+n帧图像中的目标图像与第m-n帧图像中的目标图像，确定被追踪特征的移动速度与移动方向；

8、基于移动速度与移动方向在第m+n帧图像以及第m-n帧图像中显示预测目标图像。

9、结合第一方面，在一些实施方式中，获取第m-n帧图像与第m+n帧图像，基于第m帧图像中的目标图像，分别确定第m-n帧图像与第m+n帧图像中的目标图像,其中，m、n为大于0的自然数，且m-n≥1，包括：

10、基于第m帧图像中的目标图像确定第一目标轮廓；

11、基于第m-n帧图像确定第m-n帧图像中的目标图像的第二目标轮廓；

12、基于第一目标轮廓形状对第二目标轮廓形状进行修正，得到第三目标轮廓形状；

13、基于第三目标轮廓形状确定第m-n帧图像中的目标图像。

14、结合第一方面，在一些实施方式中，获取第m-n帧图像与第m+n帧图像，基于第m帧图像中的目标图像，分别确定第m-n帧图像与第m+n帧图像中的目标图像,其中，m、n为大于0的自然数，且m-n≥1，包括：

15、基于第m帧图像中的目标图像确定第一目标轮廓；

16、基于第m+n帧图像确定第m+n帧图像中的目标图像的第四目标轮廓；

17、基于第一目标轮廓形状对第四目标轮廓形状进行修正，得到第五目标轮廓形状；

18、基于第五目标轮廓形状确定第m+n帧图像中的目标图像。

19、结合第一方面，在一些实施方式中，基于第m-n帧图像确定第m-n帧图像中的目标图像的第二目标轮廓，包括：

20、分割第m帧图像以形成多个多个第一子图像；

21、确定多个第一子图像中的第一边界子图像，第一边界子图像为形成第m-n帧图像中的目标图像轮廓的第一子图像；

22、连接多个第一边界子图像以形成第二目标轮廓。

23、结合第一方面，在一些实施方式中，确定多个第一子图像中的第一边界子图像，第一边界子图像为形成第m-n帧图像中的目标图像轮廓的第一子图像，包括：

24、确定每一个第一子图像的视觉特征参数，特征参数用于表征第一子图像的视觉特征；

25、将每一个第一子图像的视觉特征参数与相邻的四个第一子图像的视觉特征参数相比对，若一个第一子图像相邻的四个第一子图像中，有且仅有一个第一子图像的视觉特征参数与其余三个第一子图像的视觉特征参数存在差异，则确定第一子图像为第一边界子图像。

26、结合第一方面，在一些实施方式中，确定每一个第一子图像的视觉特征参数，特征参数用于表征第一子图像的视觉特征，包括：

27、确定每一个第一子图像的亮度值、灰度值与色温值；

28、基于每一个第一子图像的亮度值、灰度值与色温值确定每一个第一子图像的视觉特征参数,并满足：

29、其中，为亮度值对应的第一权重，为灰度值对应的第二权重，为色温值对应的第三权重，为亮度值,为灰度值,为色温值。

30、结合第一方面，在一些实施方式中，基于第m+n帧图像中的目标图像与第m-n帧图像中的目标图像，确定被追踪特征的移动速度与移动方向，包括：

31、分割第m-n帧图像中的目标图像，以使其形成多个尺寸相同的第一目标子图像，其中，每一个第一目标子图像具有一个第一定位点，多个第一定位点位于多个第一目标子图像上相同几何位置；

32、分割第m+n帧图像中的目标图像，以使其形成多个尺寸相同的第二目标子图像，其中，每一个第二目标子图像具有一个第二定位点，多个第二定位点位于多个第一目标子图像上相同几何位置，且多个第一目标子图像与多个第二目标子图像一一对应；

33、基于多个第一定位点与多个第二定位点确定多个移动向量，基于多个移动向量确定目标向量；

34、获取第m-n帧图像的与第m+n帧图像的拍摄时间间隔；

35、基于目标向量与时间间隔，确定被追踪特征的移动速度与移动方向。

36、结合第一方面，在一些实施方式中，基于移动速度与移动方向在第m+n帧图像以及第m-n帧图像中显示预测目标图像，包括：

37、分割第m帧图像中的目标图像，以使其形成多个尺寸相同的实际子图像，其中，每一个实际子图像具有一个第三定位点，多个第三定位点位于多个实际子图像上相同几何位置；

38、基于目标向量与多个第三定位点确定多个第四定位点，其中，第四定位点为第三定位点与沿目标向量加载后的点；

39、基于多个第四定位点确定多个预测子图像，基于多个预测子图像确定预测目标图像。

40、本发明实施例第二方面提出一种基于人工智能的视频图像特征追踪装置，该装置被配置为：

41、获取目标视频节，基于目标视频节获取第m帧图像;

42、基于神经网络模型确定第m帧图像中的目标图像并显示，其中，目标图像为被追踪特征的图像；

43、获取第m-n帧图像与第m+n帧图像，基于第m帧图像中的目标图像，分别确定第m-n帧图像与第m+n帧图像中的目标图像,其中，m、n为大于0的自然数，且m-n≥1；

44、基于第m+n帧图像中的目标图像与第m-n帧图像中的目标图像，确定被追踪特征的移动速度与移动方向；

45、基于移动速度与移动方向在第m+n帧图像以及第m-n帧图像中显示预测目标图像。

46、结合第二方面，该装置被配置为：

47、获取第m-n帧图像与第m+n帧图像，基于第m帧图像中的目标图像，分别确定第m-n帧图像与第m+n帧图像中的目标图像,其中，m、n为大于0的自然数，且m-n≥1，包括：

48、基于第m帧图像中的目标图像确定第一目标轮廓；

49、基于第m-n帧图像确定第m-n帧图像中的目标图像的第二目标轮廓；

50、基于第一目标轮廓形状对第二目标轮廓形状进行修正，得到第三目标轮廓形状；

51、基于第三目标轮廓形状确定第m-n帧图像中的目标图像。

52、结合第二方面，该装置被配置为：

53、获取第m-n帧图像与第m+n帧图像，基于第m帧图像中的目标图像，分别确定第m-n帧图像与第m+n帧图像中的目标图像,其中，m、n为大于0的自然数，且m-n≥1，包括：

54、基于第m帧图像中的目标图像确定第一目标轮廓；

55、基于第m+n帧图像确定第m+n帧图像中的目标图像的第四目标轮廓；

56、基于第一目标轮廓形状对第四目标轮廓形状进行修正，得到第五目标轮廓形状；

57、基于第五目标轮廓形状确定第m+n帧图像中的目标图像。

58、结合第二方面，该装置被配置为：

59、基于第m-n帧图像确定第m-n帧图像中的目标图像的第二目标轮廓，包括：

60、分割第m帧图像以形成多个多个第一子图像；

61、确定多个第一子图像中的第一边界子图像，第一边界子图像为形成第m-n帧图像中的目标图像轮廓的第一子图像；

62、连接多个第一边界子图像以形成第二目标轮廓。

63、结合第二方面，该装置被配置为：

64、确定多个第一子图像中的第一边界子图像，第一边界子图像为形成第m-n帧图像中的目标图像轮廓的第一子图像，包括：

65、确定每一个第一子图像的视觉特征参数，特征参数用于表征第一子图像的视觉特征；

66、将每一个第一子图像的视觉特征参数与相邻的四个第一子图像的视觉特征参数相比对，若一个第一子图像相邻的四个第一子图像中，有且仅有一个第一子图像的视觉特征参数与其余三个第一子图像的视觉特征参数存在差异，则确定第一子图像为第一边界子图像。

67、结合第二方面，该装置被配置为：

68、确定每一个第一子图像的视觉特征参数，特征参数用于表征第一子图像的视觉特征，包括：

69、确定每一个第一子图像的亮度值、灰度值与色温值；

70、基于每一个第一子图像的亮度值、灰度值与色温值确定每一个第一子图像的视觉特征参数,并满足：并满足：

71、其中，为亮度值对应的第一权重，为灰度值对应的第二权重，为色温值对应的第三权重，为亮度值,为灰度值,为色温值。

72、结合第二方面，该装置被配置为：

73、基于第m+n帧图像中的目标图像与第m-n帧图像中的目标图像，确定被追踪特征的移动速度与移动方向，包括：

74、分割第m-n帧图像中的目标图像，以使其形成多个尺寸相同的第一目标子图像，其中，每一个第一目标子图像具有一个第一定位点，多个第一定位点位于多个第一目标子图像上相同几何位置；

75、分割第m+n帧图像中的目标图像，以使其形成多个尺寸相同的第二目标子图像，其中，每一个第二目标子图像具有一个第二定位点，多个第二定位点位于多个第一目标子图像上相同几何位置，且多个第一目标子图像与多个第二目标子图像一一对应；

76、基于多个第一定位点与多个第二定位点确定多个移动向量，基于多个移动向量确定目标向量；

77、获取第m-n帧图像的与第m+n帧图像的拍摄时间间隔；

78、基于目标向量与时间间隔，确定被追踪特征的移动速度与移动方向。

79、结合第二方面，该装置被配置为：

80、基于移动速度与移动方向在第m+n帧图像以及第m-n帧图像中显示预测目标图像，包括：

81、分割第m帧图像中的目标图像，以使其形成多个尺寸相同的实际子图像，其中，每一个实际子图像具有一个第三定位点，多个第三定位点位于多个实际子图像上相同几何位置；

82、基于目标向量与多个第三定位点确定多个第四定位点，其中，第四定位点为第三定位点与沿目标向量加载后的点；

83、基于多个第四定位点确定多个预测子图像，基于多个预测子图像确定预测目标图像。

84、本发明实施例第三方面提出一种电子设备，电子设备包括：

85、至少一个处理器；以及，与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本发明实施例第一方面提出方法。

86、本发明实施例第四方面提出一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例第一方面提出方法。

87、综上，上述方法及装置具有如下技术效果：

88、本技术提出的一种基于人工智能的视频图像特征追踪方法，首先获取目标视频节，基于目标视频节获取第m帧图像，然后基于神经网络模型确定第m帧图像中的目标图像并显示，其中，目标图像为被追踪特征的图像，然后获取第m-n帧图像与第m+n帧图像，基于第m帧图像中的目标图像，分别确定第m-n帧图像与第m+n帧图像中的目标图像，然后基于第m+n帧图像中的目标图像与第m-n帧图像中的目标图像，确定被追踪特征的移动速度与移动方向，然后基于移动速度与移动方向在第m+n帧图像以及第m-n帧图像中显示预测目标图像。本技术提出的一种基于人工智能的视频图像特征追踪方法，在一个视频节中，通过对一个第m帧图像利用神经网络模型进行目标识别，即可显示第m-n帧图像、第m帧图像、第m+n帧图像三个帧画面，较对所有视频帧均进行目标识别更为节省算力，使处理的速度更快。