技术新讯 > 计算推算,计数设备的制造及其应用技术 > 更新确定方法、装置及计算机可读存储介质与流程  >  正文

更新确定方法、装置及计算机可读存储介质与流程

  • 国知局
  • 2024-11-21 11:31:31

本技术涉及计算机,尤其涉及更新确定方法、装置及计算机可读存储介质。

背景技术:

1、为确定目标数据(例如应用程序的审核标准数据、软件开发工具包(softwaredevelopment kit,sdk)数据或应用程序数据)是否存在更新,现有的方案通常是通过爬虫技术或钩子技术获取外部网站中目标数据的更新信息,然后基于该更新信息确定目标数据发生更新。

2、然而,由于通过爬虫技术或钩子技术获取数据的行为存在不合规范的问题,且外部网站往往配置有反爬虫技术活或钩子技术,从而导致了更新确定的效率较低。

技术实现思路

1、本技术提供一种更新确定方法、装置及计算机可读存储介质,能够提升更新确定的效率。

2、为达到上述目的,本技术采用如下技术方案:

3、第一方面,提供了一种更新确定方法,方法包括:获取目标网页的网页截图和历史更新时刻;目标网页用于发布目标数据的更新信息,网页截图包括目标更新时刻,目标更新时刻为更新信息的发布时刻,历史更新时刻为目标数据上一次更新的时刻;确定网页截图中的目标更新时刻;在目标更新时刻晚于历史更新时刻的情况下,确定目标数据发生更新。

4、与现有的通过爬虫技术或钩子技术确定目标数据发生更新的方案相比,本技术的方案中由于目标网页用于发布目标数据的更新信息,因而,通过获取目标网页的包括目标更新时刻的网页截图和目标数据上一次更新的历史更新时刻,其后,确定网页截图中的目标更新时刻,其后,在目标更新时刻晚于历史更新时刻的情况下,说明在历史更新时刻后目标数据发生了更新,可以确定目标数据发生更新,无需通过爬虫技术或钩子技术,避免相关规范、反爬虫技术活或钩子技术对确定更新产生影响,从而提升了更新确定的效率。

5、结合第一方面,在第一方面的某些实施方式中,确定网页截图中的目标更新时刻,包括:基于ocr识别网页截图中的文字信息;根据文字信息和目标正则表达式确定目标更新时刻;目标正则表达式用于确定文字信息中的更新时刻。

6、基于该方案,由于目标正则表达式用于确定文字信息中的更新时刻,因而,可以基于ocr识别网页截图中的文字信息,其后,根据文字信息和目标正则表达式确定目标更新时刻,从而实现了识别网页截图中目标更新时刻的方案。

7、结合第一方面,在第一方面的某些实施方式中,根据文字信息和目标正则表达式确定目标更新时刻,包括:将文字信息输入目标正则表达式,得到至少一个更新时刻;将至少一个更新时刻中最晚的更新时刻确定为目标更新时刻。

8、基于该方案,将文字信息输入目标正则表达式,得到至少一个更新时刻,由于网页截图中可能包括多个更新时刻,因而,通过将至少一个更新时刻中最晚的更新时刻确定为目标更新时刻,可以将最新的更新时刻确定为目标更新时刻,从而提升确定的目标更新时刻的准确性。

9、结合第一方面,在第一方面的某些实施方式中,获取目标网页的网页截图,包括:获取目标列表;目标列表包括目标网页的地址;打开目标网页的地址,得到目标网页;基于目标网页得到网页截图。

10、基于该方案,通过获取包括目标网页的地址的目标列表,其后,打开目标网页的地址,得到目标网页,其后,能够基于目标网页得到网页截图,从而实现了获取目标网页的网页截图的方案。

11、结合第一方面,在第一方面的某些实施方式中,目标列表还包括历史更新时刻,在目标更新时刻晚于历史更新时刻的情况下,方法还包括:将目标列表中的历史更新时刻替换为目标更新时刻。

12、基于该方案,在目标列表还包括历史更新时刻的情况下,若目标更新时刻晚于历史更新时刻,通过将目标列表中历史更新时刻替换为目标更新时刻,能够对历史更新时刻进行更新。

13、结合第一方面,在第一方面的某些实施方式中,目标列表还包括目标数据的管理人员的通信标识,在目标更新时刻晚于历史更新时刻的情况下,方法还包括:生成更新指示消息;更新指示消息用于指示目标数据发生更新;向通信标识发送更新指示消息。

14、基于该方案,在目标列表还包括历史更新时刻的情况下,若目标更新时刻晚于历史更新时刻,通过生成用于指示目标数据发生更新的更新指示消息,其后,向通信标识发送更新指示消息,能够使管理人员得知目标数据发生了更新。

15、第二方面,提供了一种更新确定装置用于实现上述第一方面的更新确定方法。该更新确定装置包括实现上述方法相应的模块、单元、或手段(means),该模块、单元、或means可以通过硬件实现,软件实现,或者通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块或单元。

16、结合第二方面,在第二方面的某些实施方式中,装置包括:获取模块和处理模块;获取模块,用于获取目标网页的网页截图和历史更新时刻;目标网页用于发布目标数据的更新信息,网页截图包括目标更新时刻,目标更新时刻为更新信息的发布时刻,历史更新时刻为目标数据上一次更新的时刻;处理模块,用于确定网页截图中的目标更新时刻;处理模块,还用于在目标更新时刻晚于历史更新时刻的情况下,确定目标数据发生更新。

17、结合第二方面,在第二方面的某些实施方式中,处理模块,用于确定网页截图中的目标更新时刻,包括:基于ocr识别网页截图中的文字信息;根据文字信息和目标正则表达式确定目标更新时刻;目标正则表达式用于确定文字信息中的更新时刻。

18、结合第二方面,在第二方面的某些实施方式中,处理模块,用于根据文字信息和目标正则表达式确定目标更新时刻,包括:将文字信息输入目标正则表达式,得到至少一个更新时刻;将至少一个更新时刻中最晚的更新时刻确定为目标更新时刻。

19、结合第二方面,在第二方面的某些实施方式中,获取模块,用于获取目标网页的网页截图,包括:获取目标列表;目标列表包括目标网页的地址;打开目标网页的地址,得到目标网页;基于目标网页得到网页截图。

20、结合第二方面,在第二方面的某些实施方式中,目标列表还包括历史更新时刻,在目标更新时刻晚于历史更新时刻的情况下,处理模块,还用于:将目标列表中的历史更新时刻替换为目标更新时刻。

21、结合第二方面,在第二方面的某些实施方式中,目标列表还包括目标数据的管理人员的通信标识,在目标更新时刻晚于历史更新时刻的情况下,处理模块,还用于:生成更新指示消息;更新指示消息用于指示目标数据发生更新;向通信标识发送更新指示消息。

22、第三方面,提供了一种更新确定装置,包括:至少一个处理器、用于存储处理器可执行的指令的存储器;其中,处理器被配置为执行指令,以实现如第一方面及其任一种可能的实施方式所提供的方法。

23、第四方面,提供了一种计算机可读存储介质,当计算机可读存储介质中的指令由更新确定装置的处理器执行时,使得更新确定装置能够执行如第一方面及其任一种可能的实施方式所提供的方法。

24、第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机可以执行上述第一方面及其任一种可能的实施方式所提供的方法。

25、第六方面,提供了一种芯片系统,包括:处理器和接口电路;接口电路,用于接收计算机程序或指令并传输至处理器;处理器用于执行计算机程序或指令,以使该芯片系统执行如上述第一方面及其任一种可能的实施方式所提供的方法。

26、其中,第二方面至第六方面中任一种实施方式所带来的技术效果可参见上述第一方面不同实施方式所带来的技术效果,在此不再赘述。

本文地址:https://www.jishuxx.com/zhuanli/20241120/331623.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。