技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种图像特征识别与匹配方法及装置与流程  >  正文

一种图像特征识别与匹配方法及装置与流程

  • 国知局
  • 2024-09-05 14:20:35

本发明涉及爬虫领域,尤其涉及一种图像特征识别与匹配方法及装置。

背景技术:

1、近年来,随着大模型技术的突飞猛进,需要从互联网搜集海量的语料库作为训练素材。但是很多数据源针对爬虫采用了反爬机制。主要包括:设置robots.txt文件限制、限制useragent字段进行访问过滤、基于用户访问行为进行限制、封禁爬虫的ip地址、登陆时采取图片或滑动验证码等动态验证形式等。因此对滑动验证码的反爬机制进行绕过,使爬虫顺利获取数据源的内容显得尤为重要。

技术实现思路

1、本发明所要解决的技术问题在于,提供一种图像特征识别与匹配方法及装置,有利于提高滑动验证码的识别精度,以便通过爬虫技术顺利获取数据源。

2、为了解决上述技术问题,本发明实施例第一方面公开了一种图像特征识别与匹配方法,所述方法包括:

3、s1,获取第一图像信息;

4、s2,对所述第一图像信息进行识别处理,得到图像特征识别类型信息;

5、s3,对所述第一图像信息、所述图像特征识别类型信息进行融合处理,得到第一轨迹信息;

6、s4,对所述第一轨迹信息进行计算处理,得到第一目标轨迹信息。

7、作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述第一图像信息、所述图像特征识别类型信息进行融合处理,得到第一轨迹信息,包括:

8、s31,对所述图像特征识别类型信息进行提取操作,得到第一提取结果信息;

9、当所述第一提取结果信息为第一图像特征识别类型信息时,执行s32;

10、当所述第一提取结果信息为第二图像特征识别类型信息时,执行s33;

11、当所述第一提取结果信息为第三图像特征识别类型信息时,执行s34;

12、s32,对所述第一图像信息进行计算处理,得到第二轨迹信息,并确定所述第二轨迹信息为第一轨迹信息;

13、s33,对所述第一图像信息进行计算处理,得到第三轨迹信息,并确定所述第三轨迹信息为所述第一轨迹信息;

14、s34,对所述第一图像信息进行计算处理,得到第四轨迹信息,并确定所述第四轨迹信息为所述第一轨迹信息。

15、作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述第一图像信息进行计算处理,得到第三轨迹信息,包括:

16、s331,获取第一计算模型和第一起点信息;

17、s332,对所述第一计算模型进行模型训练处理,得到第二计算模型;

18、s333,利用第二计算模型,对所述第一图像信息进行计算处理,得到第一终点信息;

19、s334,对所述第一起点信息和所述第一终点信息进行融合处理,得到第三轨迹信息。

20、作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述第一图像信息进行计算处理,得到第四轨迹信息,包括:

21、s341,对所述第一图像信息进行计算处理,得到第二起点信息、拐点信息和第二终点信息;所述拐点信息包括1个或2个第二拐点信息;

22、当所述拐点信息包含1个所述第二拐点信息时,执行s342;

23、当所述拐点信息包含2个所述第二拐点信息时,执行s343;

24、s342,对所述第二起点信息、所述拐点信息和所述第二终点信息进行计算处理,得到第四轨迹信息;

25、s343,对所述第一图像信息、所述第二起点信息和所述拐点信息进行计算处理,得到第三拐点信息和第四拐点信息;

26、s344,对所述第二起点信息、所述第三拐点信息、所述第四拐点信息和所述第二终点信息进行融合处理,得到所述第四轨迹信息。

27、作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述第一轨迹信息进行计算处理,得到第一目标轨迹信息,包括:

28、s41,对预设的目标轨迹模式信息进行提取操作,得到第二提取结果信息;

29、当所述第二提取结果信息为第一目标轨迹模式信息时,执行s42;

30、当所述第二提取结果信息为第二目标轨迹模式信息时,执行s43;

31、s42,对所述第一轨迹信息进行计算处理,得到第二目标轨迹信息,并确定所述第二目标轨迹信息为第一目标轨迹信息;

32、s43,对所述第一轨迹信息进行计算处理,得到第三目标轨迹信息,并确定所述第三目标轨迹信息为所述第一目标轨迹信息。

33、作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述第一轨迹信息进行计算处理,得到第二目标轨迹信息,包括:

34、s421,预设第一速度信息、第一时间信息和第二时间信息;

35、s422,利用第三计算模型,对所述第一速度信息、所述第一时间信息和所述第二时间信息进行计算处理,得到第一位移信息;

36、其中,所述第三计算模型为:

37、

38、式中,mb(s1)为所述第一位移信息,v1为所述第一速度信息,u0为预设的初始加速度信息,w1为预设的第一位置偏移量,s′和s″为所述第一时间信息和所述第二时间信息,σ1、σ2、σ3、σ4和σ5为第一权重参数、第二权重参数、第三权重参数、第四权重参数和第五权重参数;

39、s423,对所述第一轨迹信息、所述第二时间信息和所述第一位移信息进行计算处理,得到第二目标轨迹信息。

40、作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述第一轨迹信息进行计算处理,得到第三目标轨迹信息,包括:

41、s431,利用第四计算模型,对所述第一轨迹信息进行计算处理,得到第一系数信息;

42、其中,所述第四计算模型为:

43、

44、式中,fd为所述第一系数信息,jl为所述第一轨迹信息中起点到终点的距离,t1为预设的第一系数参数,σ6为第六权重参数,表示向下取整;

45、s432,利用第五计算模型,对所述第一系数信息进行计算处理,得到第二位移信息;

46、其中,所述第五计算模型为:

47、

48、式中,nb(t2)为所述第二位移信息,fd为所述第一系数信息,jl为所述第一轨迹信息中起点到终点的距离,σ7为第七权重参数,表示向下取整;

49、s433,对所述第一轨迹信息和所述第二位移信息进行计算处理,得到第三目标轨迹信息。

50、本发明实施例第二方面公开了一种图像特征识别与匹配装置,其特征在于,所述装置包括:

51、获取模块,用于获取第一图像信息;

52、识别模块,用于对所述第一图像信息进行识别处理,得到图像特征识别类型信息;

53、第一计算模块,用于对所述第一图像信息、所述图像特征识别类型信息进行融合处理,得到第一轨迹信息;

54、第二计算模块,用于对所述第一轨迹信息进行计算处理,得到第一目标轨迹信息。

55、本发明实施例第三方面公开了另一种图像特征识别与匹配装置,其特征在于,所述装置包括:

56、处理器;

57、与所述处理器耦合的存储有可执行程序代码的存储器;

58、所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的图像特征识别与匹配方法部分或全部步骤。

59、本发明实施例第四方面公开了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明实施例第一方面公开的图像特征识别与匹配方法部分或全部步骤。

60、与现有技术相比,本发明实施例具有以下有益效果:

61、本发明实施例中,获取第一图像信息;对所述第一图像信息进行识别处理,得到图像特征识别类型信息;对所述第一图像信息、所述图像特征识别类型信息进行融合处理,得到第一轨迹信息;对所述第一轨迹信息进行计算处理,得到第一目标轨迹信息。可见,本技术有利于提高滑动验证码的识别精度,以便通过爬虫技术顺利获取数据源。

本文地址:https://www.jishuxx.com/zhuanli/20240905/285871.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。