技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种网页内容提炼方法、系统、设备及存储介质  >  正文

一种网页内容提炼方法、系统、设备及存储介质

  • 国知局
  • 2024-09-11 14:16:19

本发明涉及ai,尤其涉及一种一种网页内容提炼方法、系统、设备及存储介质。

背景技术:

1、现有的ai技术虽在多个领域取得显著成果,但在信息总结和管理方面仍面临挑战。特别是在处理web内容时。

2、现有技术往往缺乏灵活性,并且无法实时更新活自动处理大量信息,这限制了它们在快速获取关键信息方面相关的应用,同时由于ai需要消耗大量算力,现有技术往往采用用户端登录鉴权才能使用户获取ai内容。

3、如何能够使开发者只需在前端接入便可使用户非常容易的获取文章摘要以及总结,同时使用管理系统,使开发者能够管理ai总结内容,及时纠正ai生成内容,现有技术中还尚未提供有效的解决方案。

技术实现思路

1、为此,本发明所要解决的技术问题在于克服现有技术在自动分析、理解总结大量web内容方面的不足。

2、为解决上述技术问题,本发明提供了一种网页内容提炼方法,包括:

3、通过生成式ai技术分析和理解前端传入的网页内容;所述网页内容包括文字和图片;所述图片通过调用第三方ocr-api以转换为文字内容;

4、通过web系统提取关键信息和所述网页内容的主要观点,生成总结内容;

5、在网页中植入实时监测所述网页内容的js,并显示在前端,以使访客实时获取所述总结内容。

6、在本发明的一个实施例中,所述总结内容中设有个性化参数,通过定义不同的所述个性化参数,实现个性化总结。

7、在本发明的一个实施例中,所述个性化参数包括主题、关键词和摘要长度。

8、在本发明的一个实施例中,所述前端采用js以及css植入的方式,所述js以及所述css开源且有多个衍生版本,以使web系统植入后,通过修改部分参数,获得全网站web文章内容,并请求后端,使ai对当前web文章内容进行总结或交互。

9、在本发明的一个实施例中,所述后端与所述web系统采用golang的gin框架,通过相关代码及对应的编译二进制文件部署至服务器,并开放公网访问。

10、在本发明的一个实施例中,当在前端发出目标请求后,通过调用ai生成总结内容,对所述总结内容进行合规检测,并在所述合规检测完成后返回至前端。

11、在本发明的一个实施例中,所述合规检测通过违规关键词词库匹配以及ai语义筛选进行鉴权。

12、本发明还提供了一种网页内容提炼系统,应用于上述实施例中任一项所述网页内容提炼方法,包括:

13、ai总结模块,用于通过生成式ai技术分析和理解前端传入的网页内容;所述网页内容包括文字和图片;所述图片通过调用第三方ocr-api以转换为文字内容;

14、管理系统模块,用于通过web系统提取关键信息和所述网页内容的主要观点,生成总结内容;

15、配置更新模块,用于在网页中植入实时监测所述网页内容的js,并显示在前端,以使访客实时获取所述总结内容。

16、本发明还提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如上述实施例中任一所述网页内容提炼方法的步骤。

17、本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述实施例中任一所述网页内容提炼方法的步骤。

18、本发明的上述技术方案相比现有技术具有以下有益效果:

19、本发明能够大幅提高信息处理的自动化和效率,节省用户时间和精力,便于网站访问者便捷获取文章摘要以及总结,便于网站开发者快捷接入。并且个性化和灵活性的增加使开发者能够根据自己的需求获取定制化的信息总结。实时更新功能确保用户能够及时了解web最新信息和趋势,便于网站开发者和管理员管理ai信息。

技术特征:

1.一种网页内容提炼方法,其特征在于,包括:

2.根据权利要求1所述的网页内容提炼方法,其特征在于,所述总结内容中设有个性化参数,通过定义不同的所述个性化参数,实现个性化总结。

3.根据权利要求2所述的网页内容提炼方法,其特征在于,所述个性化参数包括主题、关键词和摘要长度。

4.根据权利要求1所述的网页内容提炼方法,其特征在于,所述前端采用js以及css植入的方式,所述js以及所述css开源且有多个衍生版本,以使web系统植入后,通过修改部分参数,获得全网站web文章内容,并请求后端,使ai对当前web文章内容进行总结或交互。

5.根据权利要求4所述的网页内容提炼方法,其特征在于,所述后端与所述web系统采用golang的gin框架,通过相关代码及对应的编译二进制文件部署至服务器,并开放公网访问。

6.根据权利要求1所述的网页内容提炼方法,其特征在于,当在前端发出目标请求后,通过调用ai生成总结内容,对所述总结内容进行合规检测,并在所述合规检测完成后返回至前端。

7.根据权利要求6所述的网页内容提炼方法,其特征在于,所述合规检测通过违规关键词词库匹配以及ai语义筛选进行鉴权。

8.一种网页内容提炼系统,应用于权利要求1-7中任一项所述网页内容提炼方法,其特征在于,包括:

9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如权利要求1至7中任一所述网页内容提炼方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一所述网页内容提炼方法的步骤。

技术总结本发明涉及AI技术领域,具体涉及一种网页内容提炼方法、系统、设备及存储介质,方法包括通过生成式AI技术分析和理解前端传入的网页内容;通过Web系统提取关键信息和所述网页内容的主要观点,生成总结内容;在网页中植入实时监测所述网页内容的JS,并显示在前端,以使访客实时获取所述总结内容。本发明能够大幅提高信息处理的自动化和效率,节省用户时间和精力,便于网站访问者便捷获取文章摘要以及总结,便于网站开发者快捷接入。并且个性化和灵活性的增加使开发者能够根据自己的需求获取定制化的信息总结。实时更新功能确保用户能够及时了解此Web最新信息和趋势,便于网站开发者和管理员管理AI信息。技术研发人员:伍天力,许孝芳受保护的技术使用者:苏州城市学院技术研发日:技术公布日:2024/9/9

本文地址:https://www.jishuxx.com/zhuanli/20240911/289920.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。