技术新讯 > 计算推算,计数设备的制造及其应用技术 > 多模态数据下的电力安全文件的溯源问答方法及相关设备与流程  >  正文

多模态数据下的电力安全文件的溯源问答方法及相关设备与流程

  • 国知局
  • 2024-07-31 23:05:47

本申请的实施例涉及电力安全,尤其涉及一种多模态数据下的电力安全文件的溯源问答方法及相关设备。

背景技术:

1、在面向电力领域,尤其是针对电力领域安全规范的文件来源广泛,不便于整理和存储,在从业人员需要查询相关的电力安全文件时,往往难以及时准确获取到所需的电力安全文件。

2、在实际中,存储电力安全文件的数据库中的文件往往为静态数据,只对各个电力安全文件进行存储,没有信息展示等功能,无法用作电力安全文件的管理。

3、基于此,需要一种能够实现通过提问来对安全文件进行快速准确地查询和展示的方案。

技术实现思路

1、有鉴于此,本申请的目的在于提出一种多模态数据下的电力安全文件的溯源问答方法及相关设备。

2、基于上述目的,本申请提供了多模态数据下的电力安全文件的溯源问答方法,包括:

3、将当前获取的预存储文件上传至预设的知识库,判断所述知识库中是否存在与所述预存储文件的文件名相同的其他已存储文件;

4、响应于确定不存在与所述预存储文件同名的其他已存储文件,按照所述预存储文件的章节划分为多个文本块,将每个文本块转化为文本向量,将所述预存储文作为已存储文件,并将对应的文本向量、章节标题和文件名存储至所述知识库;

5、响应于接收到用户提问,将所述用户提问转化为提问向量,按照所述提问向量与所述知识库中文本向量的相似度从高到底的顺序,选取第一数量的文本向量作为回答依据;

6、将选取出的第一数量的文本向量对应的文本块与所述用户提问组成提示语段,将所述提示语段输入至预设的语言模型进行分析,并生成对应所述用户提问的回答。

7、进一步地,将当前获取的预存储文件上传至预设的知识库之前,还包括:

8、从每个网站中获取当前每个安全文件对应的文件链接,将各个文件链接组成当前文件列表,判断所述当前文件列表中是否存在与预构建的预存储文件列表不同的文件链接,所述预存储文件列表包括之前已从该网站获取的文件链接;

9、响应于确定所述当前文件列表中存在不同的文件链接,通过每个不同的文件链接获取对应的安全文件,并作为当前获取的预存储文件,将每个当前获取的预存储文件对应的文件链接加入至预存储文件列表;

10、将当前获取的预存储文件的文件格式转换为预设的目标格式,并为当前获取的预存储文件生成文件名。

11、进一步地,按照所述预存储文件的章节划分为多个文本块之前,还包括:

12、读取所述预存储文件的内容的语义信息,判断所述内容的语义信息中是否存在代替其他已存储文件的语义信息;

13、响应于确定存在,展示和/或删除被代替的已存储文件。

14、进一步地,按照所述预存储文件的章节划分为多个文本块,包括:

15、按照所述预存储文件的章节级别,将每个最末级章节标题下的内容划分为一个文本块,得到多个文本块。

16、进一步地,判断所述知识库中是否存在与所述预存储文件的文件名相同的其他已存储文件之后,还包括:

17、响应于确定存在与所述预存储文件同名的其他已存储文件,不将所述预存储文作为已存储文件;

18、展示和/或删除所述预存储文件。

19、进一步地,按照所述提问向量与所述知识库中文本向量的相似度从高到底的顺序,选取第一数量的文本向量作为回答依据之前,还包括:

20、按照所述提问向量与所述知识库中文本向量的相似度从高到底的顺序,选取出排序靠前的第二数量的文本向量,所述第二数量大于所述第一数量;

21、将所述第一数量的文本向量作为回答所述用户提问的相关文件。

22、进一步地,生成对应所述用户提问的回答,包括:

23、令所述语言模型输出并展示对应所述用户提问的回答,

24、将选取出的第一数量的文本向量各自对应的文本块作为回答依据,输出并展示;

25、将选取出的第二数量的文本向量各自对应的章节标题和文件链接输出并展示。

26、基于同一发明构思,本申请还提供了一种多模态数据下的电力安全文件的溯源问答装置,包括:上传模块、划分模块、相似度对比模块和输出模块;

27、其中,所述上传模块,被配置为,将当前获取的预存储文件上传至预设的知识库,判断所述知识库中是否存在与所述预存储文件的文件名相同的其他已存储文件;

28、所述划分模块,被配置为,响应于确定不存在与所述预存储文件同名的其他已存储文件,按照所述预存储文件的章节划分为多个文本块,将每个文本块转化为文本向量,将所述预存储文作为已存储文件,并将对应的文本向量、章节标题和文件名存储至所述知识库;

29、所述相似度对比模块,被配置为,响应于接收到用户提问,将所述用户提问转化为提问向量,按照所述提问向量与所述知识库中文本向量的相似度从高到底的顺序,选取第一数量的文本向量作为回答依据;

30、所述输出模块,被配置为,将选取出的第一数量的文本向量对应的文本块与所述用户提问组成提示语段,将所述提示语段输入至预设的语言模型进行分析,并生成对应所述用户提问的回答。

31、基于同一发明构思,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一项所述的多模态数据下的电力安全文件的溯源问答方法。

32、基于同一发明构思,本申请还提供了一种非暂态计算机可读存储介质,其中,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上述多模态数据下的电力安全文件的溯源问答方法。

33、基于同一构思,与上述任意实施例方法相对应的,本申请还提供了一种计算机程序产品,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得所述计算机执行如上任一项所述的多模态数据下的电力安全文件的溯源问答方法。

34、从上面所述可以看出,本申请提供的多模态数据下的电力安全文件的溯源问答方法及相关设备,基于获取到的预存储文件,可以通过检查是否已经存储有相同文件名的已存储文件,来判断是否保留该预存储文件,对保留的预存储文件,通过将其按照章节划分为转化为多问文本块,并将各个文本块转化为文本向量,实现了在收到用户提问时,能够将转化的提问向量和各个文本向量进行相似度比较,从而选取出相似度较高的文本向量,在综合考虑了用户提问和第一数量的文本向量对应的文本块,来进行分析预测,从而得到对应的回答。

技术特征:

1.一种多模态数据下的电力安全文件的溯源问答方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将当前获取的预存储文件上传至预设的知识库之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述按照所述预存储文件的章节划分为多个文本块之前,还包括:

4.根据权利要求1所述的方法,其特征在于,所述按照所述预存储文件的章节划分为多个文本块,包括:

5.根据权利要求1所述的方法,其特征在于,所述判断所述知识库中是否存在与所述预存储文件的文件名相同的其他已存储文件之后,还包括:

6.根据权利要求1所述的方法,其特征在于,所述按照所述提问向量与所述知识库中文本向量的相似度从高到底的顺序,选取第一数量的文本向量作为回答依据之前,还包括:

7.根据权利要求6所述的方法,其特征在于,所述生成对应所述用户提问的回答,包括:

8.一种多模态数据下的电力安全文件的溯源问答装置,其特征在于,包括:上传模块、划分模块、相似度对比模块和输出模块;

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的方法。

10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行根据权利要求1至7中任意一项所述的方法。

技术总结本申请提供一种多模态数据下的电力安全文件的溯源问答方法及相关设备;方法包括:将预存储文件上传至知识库,判断知识库中是否存在与预存储文件的文件名相同的其他已存储文件;若不存在与预存储文件同名的其他已存储文件,按照预存储文件的章节划分为多个文本块,将每个文本块转化为文本向量,将预存储文作为已存储文件,并将对应的文本向量、章节标题和文件名存储至知识库;当接收到用户提问,将用户提问转化为提问向量,按照提问向量与知识库中文本向量的相似度从高到底的顺序,选取第一数量的文本向量作为回答依据;将选取出的第一数量的文本向量与提问向量组成提示语段,将提示语段输入至预设的语言模型进行分析,生成对应用户提问的回答。技术研发人员:刘峥,李铂初,姜燕,陈富强,盛志强,宋雪莹,孟子冰,李露,王悦,田佩佩,张旭泽,宋嘉伟,周嘉楠,宋丹丹,卫一宁,王贯瑶,樊兴,贾云杰受保护的技术使用者:北京中电飞华通信有限公司技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240730/195930.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。