一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种互联网广告落地页防篡改方法和系统与流程

2022-03-26 06:16:57 来源:中国专利 TAG:


1.本发明涉及互联网广告技术领域,特别涉及一种互联网广告落地页防篡改方法和系统。


背景技术:

2.目前在移动互联时代,广告主在广告平台进行广告投放,用户点击广告位进入广告主落地页。广告主为了通过审核先是提交一版正常的页面,等待审核通过后再对页面内容进行修改。现有方案是通过人工定时巡查页面,防止出现类似篡改等情况。然而现有的人工定时巡查页面存在如下技术问题:1、广告主会对落地页进行恶意的篡改,导致用户体验较差,并且可能导致流量浪费的问题。2、人工审核的广告主的广告页效率低下,且容易出现审核漏洞的问题。3、人工审核无法记录广告主的违规行为,无法在检测过程中留下违规记录。


技术实现要素:

3.本发明其中一个发明目的在于提供一种互联网广告落地页防篡改方法和系统,所述方法和系统通过计算机程序实现对广告落地页的自动巡查,可实现自动化高效地巡查,降低人工巡查的成本。
4.本发明另一个发明目的在于提供一种互联网广告落地页防篡改方法和系统,所述方法和系统通过在不同时段对同一个落地页进行截图,并将截图上传到云端,在云端对截图进行识别,并判断是否存在内容差异,从而可以判断是否存在恶意篡改等行为。
5.本发明另一个发明目的在于提供一种互联网广告落地页防篡改方法和系统,所述方法和系统通过ocr识别技术识别截图中相关的敏感词和违规词等,命中后进一步执行落地页的下线操作,因此可以实现自动巡查,提高巡查的效率。
6.为了实现至少一个上述发明目的,本发明进一步提供一种互联网广告落地页防篡改方法,所述方法包括如下步骤:
7.建立巡查脚本,将所述巡查脚本插入浏览器定期巡查广告落地页;
8.对当前广告落地页进行截图,并将该截图上传到云端;
9.预设间隔时间,根据所述间隔时间重新巡查所述广告落地页并截图上传到云端;
10.在云端采用图片差异算法计算先后上传的截图差异度,设置差异度阈值,若先后两张截图差异度大于所述差异度阈值,则执行广告落地页的下线操作或进行人工审核。
11.根据本发明其中一个较佳实施例,所述巡查脚本插入到无头浏览器,并通过puppeteer打开广告落地页执行巡查操作。
12.根据本发明另一个较佳实施例,所述先后上传云端的截图包括第一截图和第二截图,其中第一截图先于第二截图上传,所述云端包括ocr文字识别模块,所述第一截图和第二截图在在云端分别识别截图中的文字数据;预设敏感词库,将识别的文字数据和敏感词库对比,若存在敏感词,则执行所述落地页的下线操作。
13.根据本发明另一个较佳实施例,所述巡查脚本执行巡查操作包括:打开无头浏览三个窗口,且所述三个窗口的页面数量均等分,在完成三个窗口页面的加载后完成后执行页面的截图操作。
14.根据本发明另一个较佳实施例,当所述巡查脚本巡查到广告端的落地页时,在所述落地页生成落地页链接,并将所述落地页链接发送给所述puppeteer。
15.根据本发明另一个较佳实施例,所述图片的差异算法包括:云端获取第一截图和第二截图,对比所述第一截图和第二截图的尺寸,若第一截图和第二截图的尺寸不同,则退出并返回错误信息。
16.根据本发明另一个较佳实施例,若所述第一截图和第二截图的尺寸相同,则分别对两个截图建立画布,分别对两个截图进行渲染,并遍历渲染后两个截图的像素信息,若相同,则返回无差异信息。
17.根据本发明另一个较佳实施例,若对所述第一截图和第二截图渲染的图像像素存在差异,在遍历两个图像的像素后计算差异度,将大于所述差异度阈值的第一截图和第二截图传入到人工审核系统中。
18.为了实现至少一个上述发明目的,本发明进一步提供一种互联网广告落地页防篡改系统,所述系统执行上述一种互联网广告落地页防篡改方法。
19.本发明进一步提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序可被处理器执行上述一种互联网广告落地页防篡改方法。
附图说明
20.图1显示的是本发明一种互联网广告落地页防篡改方法的流程示意图。
21.图2显示的是本发明一种互联网广告落地页防篡改方法的时序示意图。
具体实施方式
22.以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。
23.可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。
24.请结合图1-图2,本发明公开了一种互联网广告落地页防篡改方法和系统,其中所述方法包括:建立巡查脚本,其中所述巡查脚本传入到浏览器中,用于巡查检测浏览器中是否存在落地页,需要说明的是,所述巡查脚本插入到无头浏览器中,所述无头浏览器包括puppeteer,通过所述puppeteer执行落地页的巡查操作。
25.具体的,所述巡查脚本每天不定时地对浏览器的广告端进行巡查,当巡查到存广告落地页时,所述巡查脚本在所述广告端生成第一落地页链接,所述第一落地页链接发送给所述puppeteer执行截图操作生成第一截图。所述第一截图记载广告落地页第一次巡查的相关信息,所述puppeteer将所述第一截图向云端发送并保存,所述云端在获取所述第一
截图后,采用ocr文字识别模块识别所述第一截图中的文字信息。其中所述云端预设有敏感词数据库,当所述ocr文字识别模块在获取到所述落地页的文字信息后,通过分词技术提取文字信息的关键词,并将关键词和预设的敏感词数据库对比,若所述关键词中存在敏感词数据库中的敏感词,则返回执行落地页下线指令,因此在本实施例中可以有效地识别广告主在广告落地页上采用敏感词吸引用户的违规行为,保障广告落地页的文字表达的纯净。
26.当所述第一截图在云端保存并执行敏感词识别处理后,相隔一定时间后,所述巡查脚本再次巡查到相同的落地页,并在广告端生成第二落地页链接,所述第二落地页链接发送给所述puppeteer执行截图操作生成第二截图,所述puppeteer将所述第二截图发送给云端,所述云端在接收到所述第二截图后,进一步采用所述ocr文字识别模块识别所述第二截图中的文字信息,进一步采用分词技术将所述第二截图中文字信息进行关键词提取,将提取的关键词和云端保存的敏感词库对比,若存在敏感词,则执行所述落地页的下线操作。
27.当所述第一截图和第二截图均不存在敏感词时,将所述第一截图和第二截图发送给后端,所述后端配置由图片对比服务,所述图片对比服务采用图片差异算法对所述第一截图和第二截图执行判断,其中所述图片对比服务的方法包括:获取第一截图和第二截图,计算所述第一截图和第二截图的尺寸,当所述第一截图和第二截图尺寸不同,则返回错信息。若所述第一截图和第二截图的尺寸大小一致,则分别对所述第一截图和第二截图建立画布,通过画布对所述第一截图和第二截图进行渲染,并遍历渲染后的两张截图,计算两张截图的像素是否相同,若相同则说明所述第一截图和第二截图完全相同,返回截图无差异的消息,表示从第一截图到第二截图的时间段内广告主不存在违规篡改行为。
28.本发明进一步在后端服务器设置图像的差异度阈值,当所述第一截图和第二截图在渲染后发现其存在差异,则需要进一步判断该差异的大小,用于后续判断广告主是否存在违规行为。其中需要说明的是,所述差异度的计算方式为:将所述第一截图中渲染的图像对应的像素和第二截图中渲染的图像对应像素进行对比,其中每一个对应像素不同,则计一个差异度,由于截图在图像差异度算法的预选阶段需要对比尺寸,只有相同的尺寸的截图才能渲染,因此所述第一截图中对应位置的所有像素在所述第二截图中均存在对应的像素,因此在像素对比过程中,需要根据像素在图像中的位置进行对比。也就是说,所述第一截图渲染后的对应位置像素和所述第二截图渲染后的对应位置像素进行对比,若存在像素差异,则说明该像素存在被修改的操作。其中当所述第一截图和第二截图的像素差异度大于所述差异度阈值,则将所述第一截图和第二截图传输到人工审核系统,进一步执行人工审核。在本发明另一较佳实施例中,当所述第一截图和第二截图的图像差异度大于所述差异度阈值,则自动执行所述广告落地页的下线操作。其中所述差异度阈值在本发明中优选为3,所述人工审核系统连接包括但不仅限于钉钉、微信等现有平台,以短信通知等方式在上述平台中告知审核人员、广告主和营销端。从而实现全流程的监控。当所述第一截图和第二截图因差异度大于所述差异度阈值而进入到人工审核系统中,所述人工审核系统中的审核员对两张图像进行人眼分辨,判断广告主是否存在违规行为,若人眼分辨后判断不存在违规行为,则不再处理对应的广告落地页。若人眼辨别判断广告主存在违规篡改行为,则人工下发对应广告落地页的下线操作,并拒绝广告计划。需要说明的是,其中落地页包含弹窗,根据dialogval ue和objectname字段判断,当含有_2标识时,通过关闭和开启弹窗对页面进行截图。
29.特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(cpu)执行时,执行本技术的方法中限定的上述功能。需要说明的是,本技术上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线段、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线段的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线段、电线段、光缆、rf等等,或者上述的任意合适的组合。
30.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
31.本领域的技术人员应理解,上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明,本发明的目的已经完整并有效地实现,本发明的功能及结构原理已在实施例中展示和说明,在没有背离所述原理下,本发明的实施方式可以有任何变形或修改。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献