技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种利用RAG增强LLM多轮对话效果的方法、装置、设备及介质与流程 > 正文

一种利用RAG增强LLM多轮对话效果的方法、装置、设备及介质与流程

国知局
2024-08-05 11:44:13

本发明涉及人工智能-大语言模型系统llm的应用，尤其涉及一种利用rag增强llm多轮对话效果的方法、装置、设备及介质。

背景技术：

1、随着llm在自然语言处理领域的广泛应用，其在特定行业信息领域的定制化需求日益凸显，尤其结合领域agent工具完成具体领域任务的能力极大扩展了llm的应用场景。然而，现有llm在应对复杂地理场景下的多轮对话时，往往面临知识深度不足、上下文记忆受限、领域专有术语理解不精确等问题，导致对话效果不尽人意，复杂任务完成不准确。

2、rag(retrieval-augmented generation)技术可以为llm提供有效信息补充，在llm的各应用场景尤其是知识问答领域开始得到诸多应用，然而在llm agent领域，rag技术的价值还没有得到最大利用。

3、llmagent机制是连接大模型系统与地理行业领域执行接口的重要技术框架，然而，有些复杂任务的执行往往需要先后编排多个不同agent调用，有的专业agent参数提取难度较大，尤其当用户基于地理行业领域自定义agent进行连续多轮对话时，其任务完成的准确率和多轮连续对话的准确率都不够理想。

4、现有llmagent领域复杂任务完成不准确的主要原因有：(1)历史记录太长，对话意图跨度大，记录多；(2)领域复杂任务编排难度大，对llmagent规划能力有很高要求；(3)效果对prompt依赖大，需要做精细控制。

5、为了提升llmagent执行复杂多agent连环任务时的准确率，针对上述问题，本发明提出一种rag技术与llmagent深度结合的新的技术架构，有效改善自定义agent复杂任务完成的效果。

技术实现思路

1、本发明的目的在于提供一种利用rag增强llm多轮对话效果的方法、装置、设备及介质，在用户多轮对话过程中使用rag技术，排除无关上文影响，引入agent编排知识，精确指导llmagent完成复杂任务的理解和执行。

2、本发明实施例提供一种利用rag增强llm多轮对话效果的方法、装置、设备及介质。

3、第一方面：一种利用rag增强llm多轮对话效果的方法，包括：

4、s1、用户对话输入llm模型对话系统；

5、s2、利用rag检索用户对话的对话历史，选取最相关对话历史片段作为用户对话上下文；

6、s3、利用rag对用户对话进行agent检索，选取用户对话最相关的agent编排知识；

7、s4、依据用户对话的最相关上下文和agent编排知识，精细生成prompt，输入给llmagent；

8、s5、获取llm模型对话系统的对话结果输出。

9、可选地，所述s2包括步骤：

10、s21、对用户的对话历史进行分析，提取关键信息形成对话历史记录元数据；

11、s22、基于对话历史记录的元数据设计适合rag检索的对话历史索引结构；

12、s23、基于用户对话，利用llm模型初步理解用户对话意图和话题，生成初步的查询词或短语提供给rag；

13、s24、rag根据查询词或短语从对话历史索引结构中检索相关对话历史片段，依据相关度和时效性进行排序；

14、s25、依据相关度和时效性排序，选取最相关对话历史片段作为当前对话的上下文。

15、可选地，所述s3包括步骤：

16、s31、自定义agent工具集，构建agent编排知识库，将获取的agent编排知识转化为结构化形式；

17、s32、依据单条agent编排知识的关键词、描述和适用场景信息，建立专用的检索数据库；

18、s33、rag根据查询词或短语从检索数据库查找最相关的agent编排知识索引；

19、s34、依据最相关的agent编排知识索引调用agent编排知识库。

20、可选地，所述s4包括步骤：

21、s41、将rag检索的最相关上下文融入llmagent的prompt设计中，明确llm模型关注与用户对话相关的历史信息；

22、s42、再将rag检索的最相关的agent编排知识，融入llmagent的prompt设计中，形成具有明确agent编排知识指导的rag增强prompt；

23、s43、根据llm模型用户多轮对话任务复杂程度和任务基础信息，选用适配的prompt模版，

24、s44、利用rag增强prompt动态更新prompt模版，精细生成用户多轮对话任务prompt请求，输入llm模型。

25、可选地，所述s5中对话结果输出返回到对话历史中。

26、可选地，所述每条agent编排知识，包括request用户请求实例、intent支持意图、agent编排实例、tool执行/观察和response回复结果五部分。

27、可选地，所述agent工具集自定义信息包括：工具名称、工具描述、输入参数及说明、输出参数及说明、必须参数和备注信息。

28、第二方面：一种利用rag增强llm多轮对话效果系统，包括：

29、rag对话历史检索模块，依据用户对话，选取最相关对话历史片段作为用户对话上下文；

30、ragagent检索模块，依据用户对话，选取用户对话最相关的agent编排知识；

31、精细prompt生成模块，依据用户对话的最相关上下文和agent编排知识，精细生成prompt，输入给llmagent；

32、llm模块，依据llmagent输入，调用领域知识，获取用户对话结果；

33、领域知识工具集模块，为rag对话历史检索模块、ragagent检索模块和llm模块提供检索和调用数据库集合。

34、第三方面：一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。

35、第四方面：一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如如第一方面所提供的方法的步骤。

36、本发明的有益效果：

37、1、本发明提出了一种新的rag与llmagent结合方法和系统，提供了一种解决复杂多轮agent调用效果改善技术方案，本发明的方案在用户多轮对话过程中使用rag技术从历史对话记录中筛选相关对话上文，排除无关上文影响，提高llmagent执行效率和准确率。在agentprompt中，引入rag检索增强技术，引入具有相关指导意义的agent编排知识，嵌入agentprompt，从而保障复杂任务的完成准确率；rag在以上两个环节提取到的有效知识，经过精细prompt设计，可以精确指导llmagent完成复杂任务的理解和执行。

38、2、本发明在llmagent多轮对话实施过程中引入rag机制，匹配多轮对话的上文记录时有效选择历史记录，生成对话响应时能够实时检索agent编排知识库，辅助模型系统在对话过程中即时获取并整合所需的专业知识，有效弥补了单纯模型系统知识在完成领域复杂任务时的知识盲点，增强了模型系统在面对复杂、细节丰富的地理问题和任务时提供准确答案的能力。可以高效提升llmagent机制在领域复杂任务多轮对话能力，改善地理信息交互体验，能够为用户提供更为专业、精准且流畅的对话式地理信息服务。