技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种问答式论文检索方法与流程  >  正文

一种问答式论文检索方法与流程

  • 国知局
  • 2024-08-30 14:45:23

本发明属于论文检索,具体而言涉及一种问答式论文检索方法。

背景技术:

1、随着大规模模型的兴起,这些庞大的模型展现出了令人惊叹的能力,特别是在自然语言处理领域,大语言模型以其海量的真实世界数据为基础,不仅具备了强大的逻辑推理能力,而且拥有卓越的问答能力,这些模型能够精确地捕捉和理解对话中的语义信息,从而为用户提供准确、高效的回答,此外,大语言模型还能从大量的文本数据中学习到各种语言规律和知识,进一步增强了其在各种应用场景中的表现。

2、现有的论文检索方法通常由用户手动输入关键词,过程较为繁琐,需要用户自行判断关键词及其类型,以及关键词间的逻辑关系,然后进行排序和筛选,这种方式对用户来说可能是一种挑战,因为它要求用户具备一定的检索技巧和对检索系统的深入理解,需要在前端文本框中进行勾选,然后输入指定的关键词;无法以对话或问题的形式得到检索结果,存在检索过程操作复杂,检索效率低的技术问题。

技术实现思路

1、鉴于上述的分析,本发明实施例旨在提供一种问答式论文检索方法、装置、设备和介质,用以解决现有技术中存在的上述问题中的一者或多者。

2、本发明的目的是这样实现的:

3、本发明第一方面实施例提供一种问答式论文检索方法,包括:

4、将待检索问题输入问答模型中,确定与所述待检索问题相匹配的处理函数;

5、根据与所述待检索问题相匹配的处理函数,确定与所述待检索问题的关键词相匹配的函数参数;

6、基于所述处理函数和所述函数参数生成检索结果;

7、所述问答模型采用如下步骤训练得到:

8、构建函数集合,所述函数集合包括论文领域问题的处理函数以及各个处理函数相对应的函数参数;

9、根据各个处理函数中参数间的不同组合,为处理函数构建初始问题集合;

10、将所述函数集合与相应的初始问题集合作为训练集微调预训练模型,得到问答模型。

11、进一步地,所述根据每个处理函数中参数间的不同组合,为每个处理函数构建初始问题集合,包括:

12、从每个处理函数的m个参数{p1,p2,p3,...,pm}中随机选择k个进行组合,k<m,得到种参数组合

13、通过大模型根据参数组合方式为处理函数生成由个初始问题组成初始问题集合

14、进一步地,所述确定与所述待检索问题相匹配的处理函数,包括:

15、计算待检索问题与每个处理函数的第一相关度,将第一相关度最高的处理函数作为与所述待检索问题相匹配的处理函数,表示如下:

16、

17、其中,r1表示第一相关度,fi表示处理函数,qpri表示待检索问题,sim(·,·)表示相关度计算,vfi表示处理函数的向量表示,表示待检索问题的向量表示;fmax表示第一相关度最高的处理函数。

18、进一步地,所述根据与所述待检索问题相匹配的处理函数,确定与所述待检索问题的关键词相匹配的函数参数,包括:

19、计算待检索问题中的关键词与第一相关度最高的处理函数中不同参数组合的第二相关度,并将第二相关度最高的参数组合作为待检索问题的关键词相匹配的函数参数,表示如下:

20、

21、其中,fmax表示第一相关度最高的处理函数,r2表示第二相关度,key表示待检索问题中的关键词,p(fmax)表示第一相关度最高的处理函数的参数组合,vkey表示关键词的向量表示,表示第一相关度最高的处理函数的参数组合的向量表示,pmax表示第二相关度最高的参数组合。

22、进一步地,还包括:

23、根据数据库中与论文相关的信息,通过大模型对所述初始问题集合进行扩充,表示为:

24、qi′=prompt1(qi||databasemess)

25、其中,qi表示初始问题集合,qi′表示扩充后的初始问题集合,prompt1(·)表示大模型扩充初始问题集合的指令,·||·表示拼接操作,databasemess表示数据库中与论文相关的信息。

26、进一步地,还包括:判断是否需要获取用户的历史对话,若需要,则获取待检索问题之前的预设轮次的历史对话,并将历史对话整合到待检索问题中,若不需要,则将待检索问题输入问答模型中。

27、进一步地,所述判断是否需要获取用户的历史对话,包括:

28、通过ac自动机判断待检索问题中是否包括涉及历史信息的关键词,表示为:

29、flag1=trie(qpri)

30、其中,flag1表示第一判断标志,trie(·)表示ac自动机的字典树,qpri表示待检索问题;

31、若所述第一判断标志为真,则需要获取用户的历史对话,若所述第一判断标志为假,则不需要获取用户的历史对话。

32、进一步地,所述判断是否需要获取用户的历史对话,还包括:

33、通过预训练好的大模型判断回答所述待检索问题是否需要结合用户的历史对话,表示为:

34、flag2=prompt2(qpri)

35、其中,flag2表示第二判断标志,prompt2(·)表示大模型判断是否需要获取用户的历史对话的指令,qpri表示待检索问题;

36、若所述第二判断标志为真,则需要获取用户的历史对话,若所述第二判断标志为假,则不需要获取用户的历史对话。

37、本发明第二方面实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现任一实施例所述的问答式论文检索方法。

38、本发明第三方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一实施例所述的问答式论文检索方法。

39、与现有技术相比,本发明至少可实现如下有益效果之一:

40、本发明提供的问答式论文检索方法,通过问答模型调用与待检索问题相匹配的处理函数,并将待检索问题的关键词作为函数参数,生成检索结果,实现了以问答形式为用户提供检索结果,操作简单,提高了检索效率。

技术特征:

1.一种问答式论文检索方法,其特征在于,包括:

2.根据权利要求1所述的问答式论文检索方法,其特征在于,所述根据每个处理函数中参数间的不同组合,为每个处理函数构建初始问题集合,包括:

3.根据权利要求1所述的问答式论文检索方法,其特征在于,所述确定与所述待检索问题相匹配的处理函数,包括:

4.根据权利要求3所述的问答式论文检索方法,其特征在于,所述根据与所述待检索问题相匹配的处理函数,确定与所述待检索问题的关键词相匹配的函数参数,包括:

5.根据权利要求2所述的问答式论文检索方法,其特征在于,还包括:

6.根据权利要求1至5任一项所述的问答式论文检索方法,其特征在于,还包括:

7.根据权利要求6所述的问答式论文检索方法,其特征在于,所述判断是否需要获取用户的历史对话,包括:

8.根据权利要求6所述的问答式论文检索方法,其特征在于,所述判断是否需要获取用户的历史对话,还包括:

9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-8任一项所述的问答式论文检索方法。

10.一种存储介质,其特征在于,其上存储有计算机程序,所述程序被处理器执行时,实现权利要求1-8任一项所述的问答式论文检索方法。

技术总结本发明涉及一种问答式论文检索方法,属于论文检索技术领域。问答式论文检索方法包括:将待检索问题输入问答模型中,确定与所述待检索问题相匹配的处理函数;根据与所述待检索问题相匹配的处理函数,确定与所述待检索问题的关键词相匹配的函数参数;基于所述处理函数和所述函数参数生成检索结果;所述问答模型采用如下步骤训练得到:构建函数集合,所述函数集合包括论文领域问题的处理函数以及各个处理函数相对应的函数参数;根据各个处理函数中参数间的不同组合,为处理函数构建初始问题集合;将所述函数集合与相应的初始问题集合作为训练集微调预训练模型,得到问答模型。本发明实现了以问答形式为用户提供检索结果,操作简单,提高了检索效率。技术研发人员:袁会会,楼航宇,张业勤,仇瑜,刘德兵受保护的技术使用者:北京智谱华章科技有限公司技术研发日:技术公布日:2024/8/27

本文地址:https://www.jishuxx.com/zhuanli/20240830/283704.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。