一种基于向量数据库与语言模型的智能问答方法
- 国知局
- 2024-07-31 22:42:23
本发明涉及人工智能领域,特别是涉及一种基于向量数据库与语言模型的智能问答方法。
背景技术:
1、随着数字化时代的到来,人们对信息的获取和处理提出了更高的要求。传统的搜索引擎和问答系统虽然提供了海量的信息资源,但面临着信息时效性、个性化回答和精准度的挑战。用户经常需要从大量搜索结果中筛选出真正有用的答案,这个过程既耗时又低效。此外,现有语言模型信息更新有迟滞信以及依赖于静态的知识库,难以及时反映最新的信息和数据,导致用户无法获取最新的知识和资讯。
2、在自然语言处理领域,虽然出现了基于深度学习的语言模型,如bert、gpt等,它们在理解和生成自然语言方面取得了显著进展,但如何将这些模型与实时更新的信息源结合,以提供更准确、更及时的回答,仍是一个有待解决的问题。
技术实现思路
1、本发明的目的在于克服现有技术的不足,提供一种基于向量数据库与语言模型的智能问答方法,确保了回答的实时性和准确性,而且提升了回答的匹配度。
2、本发明的目的是通过以下技术方案来实现的:一种基于向量数据库与语言模型的智能问答方法,包括以下步骤:
3、s1.选择基础语言模型,在目标领域的数据集上对基础语言模型进行二次训练,训练得到的能够更好地理解和生成该领域文本的二次训练模型;
4、s2.构建为数据环境中提供精确检索服务的向量数据库;
5、s3.基于用户提问进行匹配,并对匹配结果进行评分,基于评分获取问题答案反馈给用户。
6、本发明的有益效果是:1.未预见提问的联网检索:当用户的提问在训练模型中找不到匹配答案,或打不到匹配得分时,通过联网即时检索模块自动激活,从互联网中检索相关信息。这一过程不仅确保了回答的实时性和准确性,而且提升了回答的匹配度,有效解决了传统模型在处理新颖或少见问题时的局限性。
7、2.信息来源的透明展示
8、在回答用户提问时能够显示信息的来源,这为用户提供了更多的上下文和信任度。这一特点使得用户可以对感兴趣的信息进行进一步的探索,增强了用户体验并提供了更全面的信息解答。
9、3.动态数据的同步更新与模型优化
10、通过向量数据库的动态数据更新机制,定期将新录入的内容同步至语言模型再训练数据库,这不仅减少了数据库冗余,还确保了数据的时效性和一致性。同时,向量数据库的存在使得系统具有轻量化更新机制,尤其是在处理特定行业或领域数据时,向量数据库能够匹配不同领域的专业问题,提高了答案的相关性和准确性。
技术特征:1.一种基于向量数据库与语言模型的智能问答方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于向量数据库与语言模型的智能问答方法,其特征在于:所述目标领域数据集的获取采集处理过程和数据集构建过程;
3.根据权利要求2所述的一种基于向量数据库与语言模型的智能问答方法,其特征在于:步骤s1中所述的基础语言模型为llama2,该模型包含两个部分,第一个部分是将输入的数据转换为向量,第二部分根据转换得到的向量输出用户理解的答案。
4.根据权利要求1所述的一种基于向量数据库与语言模型的智能问答方法,其特征在于:所述步骤s2包括以下子步骤:
5.根据权利要求1所述的一种基于向量数据库与语言模型的智能问答方法,其特征在于:所述向量数据库具备自动更新功能,即数据库内容会根据每一次用户主动上传的数据,按照步骤s201~s204定期同步处理,并更新数据库。
6.根据权利要求1所述的一种基于向量数据库与语言模型的智能问答方法,其特征在于:所述步骤s3包括:
7.根据权利要求6所述的一种基于向量数据库与语言模型的智能问答方法,其特征在于:所述步骤s304中的联网搜索包括:
8.根据权利要求6所述的一种基于向量数据库与语言模型的智能问答方法,其特征在于:所述步骤s304中,如果得分超过指定分,则:
技术总结本发明公开了一种基于向量数据库与语言模型的智能问答方法,包括以下步骤:S1.选择基础语言模型,在目标领域的数据集上对基础语言模型进行二次训练,训练得到的能够更好地理解和生成该领域文本的二次训练模型;S2.构建为数据环境中提供精确检索服务的向量数据库;S3.基于用户提问进行匹配,并对匹配结果进行评分,基于评分获取问题答案反馈给用户。本发明有效确保了回答的实时性和准确性,而且提升了回答的匹配度。技术研发人员:石仁达,赵建良受保护的技术使用者:香港中文大学(深圳)技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/194199.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表