基于大语言模型的连续问答方法、装置及电子设备与流程
- 国知局
- 2024-11-21 12:19:21
本发明涉及人工智能,具体涉及一种基于大语言模型的连续问答方法、装置及电子设备。
背景技术:
1、大语言模型是指使用大量文本数据预训练的深度学习模型,其采用transformer架构和预训练目标,通过增加模型大小、训练数据和计算资源来提升性能,可以生成自然语言文本或理解语言文本的含义;大语言模型可以处理多种自然语言任务,如可以应用于各种自然语言处理任务,如机器翻译、文本摘要、对话系统、问答系统等,能广泛应用于自然语言处理领域的多个场景中,包括不限于文本处理、文本生成、机器人对话、语音识别。
2、随着科技的不断发展,家居领域也逐步迎来新的发展方向,智能家居作为新的行业方向为企业发展提出新思路,智能家居产品开始走入用户的家庭生活。基于不同企业进行智能家居研发的技术框架和标准不统一,各个品牌的设备不能互通互联;而且,由于技术发展不成熟,产品质量不稳定,使用时为用户带来诸多不便,包括不限于系统故障率高、更换配件难、成本高、程序僵化等问题;这些情况均导致智能家居的产品和系统在应用时大多只是使用非常简洁的功能,无法根据用户的生活习惯提供个性化的服务。
3、人工智能技术的飞速发展,为智能家居提供更安全可靠的智能化服务奠定基础;目前的智能家居产品越来越智能化,包括开始支持语音控制、智能识别、远程监督控制等功能;大语言模型在训练学习后能够理解用户语言,学习用户思维,当其应用在智能家居领域使得产品为用户提供个性化、人性化的服务成为可能,为用户提供更加优质的使用体验,具有广阔的发展前景。
技术实现思路
1、本发明目的在于提供一种基于大语言模型的连续问答方法、装置及电子设备,通过对产品文档进行结构化分解,再通过大语言模型进行向量化存入向量数据库中;问答过程,根据用户问题是否包含产品及产品型号,选择调用大语言模型判断上下文是否相关进而搜索通用知识库,大语言模型联系用户问题总结搜索到的相关文档,生成答复内容回答用户问题。
2、为达成上述目的,本发明提出如下技术方案:
3、第一方面,提出一种基于大语言模型的连续问答方法,包括:
4、获取微调语料,对待微调的向量模型进行微调,生成经微调的优化向量模型;
5、获取产品文档,对所述产品文档进行结构化分解生成若干文本块,并采用所述优化向量模型对所述文本块进行向量化后存入向量数据库中;
6、基于大语言模型对所述产品文档进行产品指令集总结,所述产品指令集中每个产品指令以问答对形式表达,并采用所述优化向量模型对所述问答对进行向量化后存入通用知识库;其中,所述通用知识库包含对若干产品文档经所述大语言模型总结的产品指令集;
7、获取用户问题,判断所述用户问题中是否包含产品及产品型号;
8、若所述用户问题包含产品及产品型号,在所述向量数据库中查询与所述产品或所述产品型号对应的所述产品文档总结匹配答复内容,且当所述产品文档不能回答所述用户问题时,搜索所述通用知识库总结匹配答复内容;
9、若所述用户问题不包含产品及产品型号,解析所述用户问题的关键字,根据所述关键字确定所述产品型号以总结匹配答复内容;否则,调用所述大语言模型对连续问答进行关联性判断确定当前问题对应的产品是否为上一提问产品,进而根据上一提问的所述产品总结匹配答复内容或搜索所述通用知识库总结匹配答复内容。
10、进一步的,所述获取微调语料,对待微调的向量模型进行微调过程,包括:
11、获取若干产品文档,采用大语言模型根据产品文档生成与文档内容相关的若干问答对文本;其中,若干所述问答对文本包括对相同问答方式的多个问题、同一问题的不同问答方式;
12、获取原始用户问题,采用大语言模型对所述问答对文本进行分类,划分正样本文本和负样本文本;其中,所述原始用户问题包括所述问答对文本中的问题;
13、构建微调样本集,所述微调样本集中每个微调样本由所述原始用户问题、原始用户问题对应的正样本文本和负样本文本构成;
14、根据所述微调样本,对待微调的向量模型进行微调,生成经微调的优化向量模型。
15、进一步的,还包括:当所述用户问题不包含产品及产品型号,且搜索所述通用知识库总结匹配的答复内容与所述用户问题的匹配度低于预设阈值时,采用大语言模型思维链对所述用户问题进行补全,以再次搜索所述通用知识库总结匹配答复内容;
16、所述采用大语言模型思维链对所述用户问题进行补全的过程,包括:
17、获取用户问题,采用所述大语言模型解析所述用户问题的关键词汇;
18、根据所述关键词汇,利用所述大语言模型在所述通用知识库中匹配包含有所述关键词汇的若干产品指令,并建立若干所述产品指令间的关联;其中,所述关联包括产品指令的问答对象、问答目标结果和问答对象间的关联关系;
19、根据所述产品指令间的关联,构建基于所述关键词汇的问答思维链,并根据所述问答思维链构造提示模板;
20、根据提示模板和当前所述用户问题上一轮提问的问答对象,利用所述大语言模型生成补全后的用户问题。
21、进一步的,还包括:当所述用户问题不包含产品及产品型号,且搜索所述通用知识库总结匹配的答复内容与所述用户问题的匹配度低于预设阈值时,对所述用户问题进行补全以再次搜索所述通用知识库总结匹配答复内容;
22、对所述用户问题进行补全的过程包括:
23、获取所述用户问题发生前连续问答的多个问答对,采用所述大语言模型生成表征各所述问答对问答过程的若干问答关键字;
24、对所述问答对,根据各所述问答关键字的应用场景及功能进行分类,获得连续问答过程的问询范围;
25、对待补全的所述用户问题,采用所述大语言模型生成表征所述用户问题的若干关键词汇;
26、根据所述连续问答过程的问询范围,将若干所述关键词汇与各类所述问答关键字进行排列组合后利用所述大语言模型生成为若干预构造问题;
27、对任一所述预构造问题,计算所述预构造问题与所述连续问答的多个所述问答对间的关联度,选择关联度超过预设关联值且数值最大的所述预构造问题为补全后的用户问题。
28、进一步的,还包括:获取包含所述用户问题的连续问答的多个问答对,在所述通用知识库进行问答匹配,确定与当前连续问答的多个问答对匹配度超过预设匹配值的多个所述产品指令集;
29、对各所述产品指令集,获取所述产品指令集中与多个所述问答对关联度最高的下一产品指令作为预测的下一轮用户问题;
30、按照与多个所述问答对的关联度由高至低的方式,顺序展示预测的多个下一轮用户问题。
31、第二方面,提出一种基于大语言模型的连续问答装置,包括:
32、获取微调模块,用于获取微调语料,对待微调的向量模型进行微调,生成经微调的优化向量模型;
33、获取分解模块,用于获取产品文档,对所述产品文档进行结构化分解生成若干文本块,并采用所述优化向量模型对所述文本块进行向量化后存入向量数据库中;
34、总结模块,用于基于大语言模型对所述产品文档进行产品指令集总结,所述产品指令集中每个产品指令以问答对形式表达,并采用所述优化向量模型对所述问答对进行向量化后存入通用知识库;其中,所述通用知识库包含对若干产品文档经所述大语言模型总结的产品指令集;
35、获取判断模块,用于获取用户问题,判断所述用户问题中是否包含产品及产品型号;
36、若所述用户问题包含产品及产品型号,在所述向量数据库中查询与所述产品或所述产品型号对应的所述产品文档总结匹配答复内容,且当所述产品文档不能回答所述用户问题时,搜索所述通用知识库总结匹配答复内容;
37、若所述用户问题不包含产品及产品型号,解析所述用户问题的关键字,根据所述关键字确定所述产品型号以总结匹配答复内容;否则,调用所述大语言模型对连续问答进行关联性判断确定当前问题对应的产品是否为上一提问产品,进而根据上一提问的所述产品总结匹配答复内容或搜索所述通用知识库总结匹配答复内容。
38、进一步的,
39、所述获取微调模块获取微调语料,对待微调的向量模型进行微调,生成经微调的优化向量模型的执行单元,包括:
40、第一生成单元,用于获取若干产品文档,采用大语言模型根据产品文档生成与文档内容相关的若干问答对文本;其中,若干所述问答对文本包括对相同问答方式的多个问题、同一问题的不同问答方式;
41、第一分类单元,用于获取原始用户问题,采用大语言模型对所述问答对文本进行分类,划分正样本文本和负样本文本;其中,所述原始用户问题包括所述问答对文本中的问题;
42、第一构建单元,用于构建微调样本集,所述微调样本集中每个微调样本由所述原始用户问题、原始用户问题对应的正样本文本和负样本文本构成;
43、微调单元,用于根据所述微调样本,对待微调的向量模型进行微调,生成经微调的优化向量模型。
44、进一步的,还包括:
45、第一补全模块,用于当所述用户问题不包含产品及产品型号,且搜索所述通用知识库总结匹配的答复内容与所述用户问题的匹配度低于预设阈值时,采用大语言模型思维链对所述用户问题进行补全,以再次搜索所述通用知识库总结匹配答复内容;
46、所述第一补全模块采用大语言模型思维链对所述用户问题进行补全的执行单元,包括:解析单元,用于获取用户问题,采用所述大语言模型解析所述用户问题的关键词汇;匹配建立单元,用于根据所述关键词汇,利用所述大语言模型在所述通用知识库中匹配包含有所述关键词汇的若干产品指令,并建立若干所述产品指令间的关联;其中,所述关联包括产品指令的问答对象、问答目标结果和问答对象间的关联关系;第二构建单元,用于根据所述产品指令间的关联,构建基于所述关键词汇的问答思维链,并根据所述问答思维链构造提示模板;补全单元,用于根据提示模板和当前所述用户问题上一轮提问的问答对象,利用所述大语言模型生成补全后的用户问题。
47、进一步的,还包括:第二补全模块,用于当所述用户问题不包含产品及产品型号,且搜索所述通用知识库总结匹配的答复内容与所述用户问题的匹配度低于预设阈值时,对所述用户问题进行补全以再次搜索所述通用知识库总结匹配答复内容;
48、所述第二补全模块对所述用户问题进行补全的执行单元,包括:获取生成单元,用于获取所述用户问题发生前连续问答的多个问答对,采用所述大语言模型生成表征各所述问答对问答过程的若干问答关键字;第二分类单元,用于对所述问答对,根据各所述问答关键字的应用场景及功能进行分类,获得连续问答过程的问询范围;第二生成单元,用于对待补全的所述用户问题,采用所述大语言模型生成表征所述用户问题的若干关键词汇;构造单元,用于根据所述连续问答过程的问询范围,将若干所述关键词汇与各类所述问答关键字进行排列组合后利用所述大语言模型生成为若干预构造问题;计算选择单元,用于对任一所述预构造问题,计算所述预构造问题与所述连续问答的多个所述问答对间的关联度,选择关联度超过预设关联值且数值最大的所述预构造问题为补全后的用户问题。
49、第三方面,提出一种电子设备,包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从所述计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行上述的基于大语言模型的连续问答方法的步骤。
50、由以上技术方案可知,本发明的技术方案获得了如下有益效果:
51、本发明公开的基于大语言模型的连续问答方法、装置及电子设备,方法包括:获取微调语料,对待微调的向量模型进行微调,生成经微调的优化向量模型;获取产品文档,对所述产品文档进行结构化分解生成若干文本块,并采用所述优化向量模型对所述文本块进行向量化后存入向量数据库中;基于大语言模型对所述产品文档进行产品指令集总结,所述产品指令集中每个产品指令以问答对形式表达,并采用所述优化向量模型对所述问答对进行向量化后存入通用知识库;获取用户问题,判断是否包含产品及产品型号;若包含产品及产品型号,查询与产品或产品型号对应的产品文档总结匹配答复内容;若不包含产品及产品型号,解析用户问题的关键字,根据关键字确定产品型号以总结匹配答复内容;否则,调用大语言模型对连续问答进行关联性判断确定当前问题对应的产品是否为上一提问产品,进而根据上一提问的产品总结匹配答复内容或搜索通用知识库总结匹配答复内容。
52、本发明将大语言模型应用在智能家居领域中能够理解用户语言、学习用户思维,准确的回复用户问题,为用户提供个性化、人性化的服务,为用户提供更加优质的使用体验;同时,本发明在智能家居领域的应用为智能家居的发展提供新方向。
53、应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。
54、结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。
本文地址:https://www.jishuxx.com/zhuanli/20241120/335199.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。