技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于人工智能的数据知识库管理系统的制作方法  >  正文

一种基于人工智能的数据知识库管理系统的制作方法

  • 国知局
  • 2024-08-05 12:19:06

本发明涉及知识库管理,更具体地说,本发明涉及一种基于人工智能的数据知识库管理系统。

背景技术:

1、现有技术在用户提问后,系统首先通过自然语言处理技术理解用户意图和提取关键信息,然后利用机器学习模型将用户分类到相应的知识库类型,再根据文本相似度匹配或检索模型从知识库中检索或生成最相关的答案,并且系统根据实时更新的知识库和模型确保提供准确和及时的答案,但是导致不容易应对用户兴趣变化带来的检索问题和正确使用适当类型的数据知识库,从而不能够提供更准确、个性化和满足用户需求的答案。

2、为了解决上述缺陷,现提供一种技术方案。

技术实现思路

1、为了克服现有技术的上述缺陷,本发明的实施例提供一种基于人工智能的数据知识库管理系统,以解决上述背景技术中提出的问题。

2、为实现上述目的,本发明提供如下技术方案:

3、一种基于人工智能的数据知识库管理系统,包括数据知识库模块、用户预分类模块、智能问答模块、监测模块以及评估模块,模块之间信号连接;

4、数据知识库模块,用于对数据知识库进行分类处理,根据不同类型的数据,将数据知识库分类成多个大类;

5、用户预分类模块,用于使用智能算法构建分类模型,分类模型根据用户的提问将用户分类到一个或多个知识库类型中;

6、智能问答模块,用于基于人工智能技术,根据用户提出的问题,系统接收问题并分析问题提供答案,根据用户预分类的结果,在用户被分类的知识库中进行答案检索;

7、监测模块,用于设置监测区间,在监测区间内根据用户的提问采集用户的兴趣变化信息,其中,兴趣变化信息包括通过分析用户提问的差异信息和本身用户兴趣点的周期信息;

8、评估模块,用于对兴趣变化信息综合性分析,生成兴趣评估系数,根据兴趣评估系数与兴趣评估系数阈值对比,判断是否更换答案提取策略。

9、在一个优选的实施方式中,在监测区间内根据用户的提问采集用户的兴趣变化信息,包括:

10、兴趣变化信息从两方面进行考虑,其中,包括通过分析用户提问的差异信息和本身用户兴趣点的周期信息,差异信息通过散度变化系数和频率偏差系数表示,周期信息通过兴趣变化系数表示。

11、在一个优选的实施方式中,所述散度变化系数的获取逻辑为:

12、获取监测区间内用户的提问,根据用户每个提问,确定用户每次提问的主题,并确定主题隶属于知识库的类型;

13、通过利用知识图谱来确定主题隶属于知识库的类型,收集知识库中的主题和知识库类型,构建知识图谱,每个主题作为图谱中的一个节点,每个知识库类型也作为一个节点,边代表主题与知识库类型之间的关联,利用图谱中的路径搜索算法,找到与主题相关的知识库类型节点,确定主题的隶属关系,比较主题在不同类型知识库之间的隶属度,将主题归类为隶属度最高的知识库类型;

14、根据用户被分到的知识库类型,将被分到的知识库类型记作标记知识库,获得监测区间内隶属于标记知识库的主题数量,并将监测区间内隶属于标记知识库的主题数量标记为:dqn,其中,n=1、2、3、……、n,n为正整数,n为被分类知识库的类型;

15、获得监测区间内提问的数量,并将监测区间内提问的数量标记为:a,计算监测区间内标记知识库中不同类型知识库的分布,计算公式为:其中,qn为当前监测区间内标记知识库中不同类型知识库的分布;

16、获得预分类期间隶属于标记知识库的主题数量,并将预分类期间隶属于标记知识库的主题数量标记为:zqn,计算预分类期间标记知识库中不同类型知识库的分布,计算公式为:其中,pn预分类期间标记知识库中不同类型知识库的分布;

17、通过公式计算散度变化系数,计算公式为:其中,sdbh为散度变化系数。

18、在一个优选的实施方式中,所述频率偏差系数的获取逻辑为:

19、获取监测区间的时间长度,并将用户监测区间的时间长度标记为:sjjc,根据监测区间内隶属于标记知识库的主题数量,获得监测区间内隶属于标记知识库中使用不同类型知识库检索答案的频率,并将监测区间内隶属于标记知识库中使用不同类型知识库检索答案的频率标记为:jcn,其中,

20、获取预分类期间的时间长度,并将预分类期间的时间长度标记为:sjfl,获得预分类期间隶属于标记知识库中使用不同类型知识库检索答案的频率,将预分类期间隶属于标记知识库中使用不同类型知识库检索答案的频率标记为:fln,其中,

21、通过公式计算频率偏差系数,计算公式为:其中,plpc为频率偏差系数。

22、在一个优选的实施方式中,所述兴趣变化系数的获取逻辑为:

23、根据用户被分到的知识库类型,获得不同类型知识库中包含的主题,根据用户提问的历史记录获得用户关注的主题,并将用户关注的主题记作标记主题;

24、采集用户对标记主题感兴趣的初始时间,通过采集用户对标记主题不感兴趣的时间,获得用户对标记主题感兴趣的时间间隔,并将用户对标记主题感兴趣的时间间隔标记为:jgk,其中,k=1、2、3、……、k,k为正整数,k为标记主题的编号;

25、获得用户对标记主题感兴趣的时间平均值和标准差,并将用户对标记主题感兴趣的时间平均值和标准差标记为:jgavg和jgbzc,其中,

26、通过公式计算兴趣变化系数,计算公式为:xqbh=jgbzc×ln(jgbzc+1);其中,xqbh为兴趣变化系数。

27、在一个优选的实施方式中,对兴趣变化信息综合性分析,生成兴趣评估系数,包括:

28、将兴趣变化信息中通过分析用户提问的差异信息和本身用户兴趣点的周期信息综合性分析,将散度变化系数、频率偏差系数以及兴趣变化系数建立数学分析模型,生成兴趣评估系数;

29、散度变化系数和兴趣变化系数与兴趣评估系数成正相关关系,频率偏差系数与兴趣评估系数成负相关关系。

30、在一个优选的实施方式中,判断是否更换答案提取策略,包括:

31、设置兴趣评估系数阈值,将监测区间内的兴趣评估系数与兴趣评估系数阈值对比,若兴趣评估系数大于兴趣评估系数阈值,则基于监测区间用户的提问,重新使用分类模型确定用户被分到的知识库类型,系统根据用户被分到的知识库中存储的数据对用户的提问进行回答,若兴趣评估系数小于兴趣评估系数阈值,则保持优先使用标记知识库中的数据对用户的提问进行回答。

32、本发明的技术效果和优点:

33、本发明通过使用分类模型对用户进行预分类,确定用户初始感兴趣的领域,系统根据用户初始感兴趣的领域,对相关数据知识库进行检索,提供用户可能需要的答案,并根据用户的多次提问,监测用户提问的兴趣变化信息,及时根据用户的兴趣变化更换答案提取策略,有助于根据不同用户选择不同的数据知识库,提供更加符合用户需求的答案。

技术特征:

1.一种基于人工智能的数据知识库管理系统,其特征在于,包括数据知识库模块、用户预分类模块、智能问答模块、监测模块以及评估模块,模块之间信号连接;

2.根据权利要求1所述的一种基于人工智能的数据知识库管理系统,其特征在于,在监测区间内根据用户的提问采集用户的兴趣变化信息,包括:

3.根据权利要求2所述的一种基于人工智能的数据知识库管理系统,其特征在于,所述散度变化系数的获取逻辑为:

4.根据权利要求3所述的一种基于人工智能的数据知识库管理系统,其特征在于,所述频率偏差系数的获取逻辑为:

5.根据权利要求1所述的一种基于人工智能的数据知识库管理系统,其特征在于,所述兴趣变化系数的获取逻辑为:

6.根据权利要求5所述的一种基于人工智能的数据知识库管理系统,其特征在于,对兴趣变化信息综合性分析,生成兴趣评估系数,包括:

7.根据权利要求1所述的一种基于人工智能的数据知识库管理系统,其特征在于,判断是否更换答案提取策略,包括:

技术总结本发明公开了一种基于人工智能的数据知识库管理系统,具体涉及知识库管理技术领域,包括数据知识库模块、用户预分类模块、智能问答模块、监测模块以及评估模块,根据不同类型的数据,将数据知识库分类成多个大类,使用智能算法构建分类模型,根据用户的提问将用户分类到一个或多个知识库类型中,根据用户提出的问题,系统接收问题并分析问题提供答案,根据用户预分类的结果,在用户被分类的知识库中进行答案检索,设置监测区间,在监测区间内根据用户的提问采集用户的兴趣变化信息,对兴趣变化信息综合性分析,判断是否更换答案提取策略,本发明有助于根据不同用户选择不同的数据知识库,提供更加符合用户需求的答案。技术研发人员:张加官,伍超荣,雷强,杨叶,居红琛受保护的技术使用者:江苏安培信息科技有限公司技术研发日:技术公布日:2024/8/1

本文地址:https://www.jishuxx.com/zhuanli/20240802/262128.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。