基于人工智能的知识图谱构建方法、装置、设备及介质与流程
- 国知局
- 2025-01-10 13:14:15
本技术涉及人工智能开发与金融科技领域,尤其涉及基于人工智能的知识图谱构建方法、装置、计算机设备及存储介质。
背景技术:
1、在当今快速发展的金融科技领域,保险行业正经历着前所未有的数字化转型浪潮。知识图谱作为一种先进的数据组织与知识管理技术,以强大的关联分析能力、智能推理能力以及可视化展现特性,为保险行业提供了前所未有的数据处理与分析手段,有望显著提升风险评估、产品设计及客户服务反欺诈等多方面的效率和准确性。
2、然而,目前,保险领域的知识图谱通常采用人工构建的方式。这种人工构建知识图谱的方式,需要工作人员预先耗费大量时间和精力来收集、整理和编辑与图谱构建有关的数据,由于与图谱构建有关的数据庞杂且不断更新,会导致人工编辑知识图谱的效率较低,与此同时,由于工作人员的疏忽,会导致知识图谱编辑错误的情况,从而导致知识图谱的编辑准确度较低。
技术实现思路
1、本技术实施例的目的在于提出一种基于人工智能的知识图谱构建方法、装置、计算机设备及存储介质,以解决现有的人工构建知识图谱的方式存在效率较低且准确度较低的技术问题。
2、为了解决上述技术问题,本技术实施例提供一种基于人工智能的知识图谱构建方法,采用了如下所述的技术方案:
3、获取预先收集的原始保险知识文本;
4、对所述原始保险知识文本进行预处理,得到对应的保险知识文本;
5、基于训练好的实体抽取模型对所述保险知识文本进行实体抽取,得到所述保险知识文本中的保险实体;
6、基于训练好的实体属性抽取模型对所述保险知识文本与所述保险实体进行属性抽取,得到所述保险实体的属性值;
7、基于训练好的关系抽取模型对所述保险知识文本进行关系抽取,得到与所述保险知识文本对应的保险关系;
8、基于训练好的实体链接模型,使用所述保险实体、所述保险实体的属性值、所述保险关系对预设的本体模型进行数据映射处理,得到对应的映射结果;
9、基于预设的图数据库对所述映射结果进行知识存储处理,得到与所述保险知识文本对应的目标知识图谱。
10、进一步的,所述基于训练好的实体链接模型,使用所述保险实体、所述保险实体的属性值、所述保险关系对预设的本体模型进行数据映射处理,得到对应的映射结果的步骤,具体包括:
11、加载预先构建好的本体模型;其中,所述本体模型包括预定义的实体名词、预定义的实体属性名词和预定义的关系名词;
12、对于指定保险实体,基于所述实体链接模型计算所述指定保险实体与所述本体模型中预定义的实体名词之间的相似度数值;其中,所述指定保险实体为所有所述保险实体中的任意一个实体;
13、基于所述相似度数值,将所述指定保险实体链接至所述本体模型中对应的指定实体名词上;
14、获取与所述指定保险实体对应的指定属性值,并将所述指定属性值映射至所述本体模型中对应的指定实体属性名词上;
15、获取指定保险关系,将所述指定保险关系映射至所述本体模型中对应的指定关系名词上,直至完成对所有所述保险实体、所有所述保险实体的属性值以及所有所述保险关系的数据映射处理,并得到所述映射结果;其中,所述指定保险关系为所有所述保险关系中的任意一种关系。
16、进一步的,所述基于预设的图数据库对所述映射结果进行知识存储处理,得到与所述保险知识文本对应的目标知识图谱的步骤,具体包括:
17、对所述映射结果进行格式化处理,得到对应的目标映射结果;
18、调用所述图数据库,并在所述图数据库中定义与所述本体模型相对应的节点类型和关系类型;
19、基于所述节点类型与所述关系类型,将所述目标映射结果转化为所述图数据库中的节点数据与边数据;
20、将所述节点数据与所述边数据导入至所述图数据库内,得到对应的指定知识图谱;
21、基于预设的验证规则对所述指定知识图谱进行数据验证;
22、若所述指定知识图谱通过数据验证,则将所述指定知识图谱作为与所述保险知识文本对应的所述目标知识图谱。
23、进一步的,所述对所述原始保险知识文本进行预处理,得到对应的保险知识文本的步骤,具体包括:
24、获取预设的数据清洗策略与数据整合策略;
25、基于所述数据清洗策略对所述原始保险知识文本进行数据清洗处理,得到对应的第一保险知识文本;
26、基于所述数据整合策略对所述第一保险知识文本进行数据整合处理,得到对应的第二保险知识文本;
27、将所述第二保险知识文本作为所述保险知识文本。
28、进一步的,所述基于训练好的实体抽取模型对所述保险知识文本进行实体抽取处,得到所述保险知识文本中的保险实体的步骤之前,还包括:
29、收集保险领域的第一文本数据;
30、对所述文本数据进行标注处理,得到对应的第二文本数据;
31、将所述第二文本数据整理为符合预设的实体识别数据格式的样本数据;
32、获取预设的大语言模型;
33、使用所述样本数据与基于低秩适应的微调算法对所述大语言模型进行训练与微调处理,得到符合预设的模型构建要求的指定大语言模型;
34、将所述指定大语言模型作为所述实体抽取模型。
35、进一步的,所述基于训练好的关系抽取模型对所述保险知识文本进行关系抽取,得到与所述保险知识文本对应的保险关系的步骤之前,还包括:
36、从预设的多个数据源中收集包含实体、属性值和关系的数据集;
37、构建所述数据集与所述本体模型中包含的名词之间的映射关系;
38、基于所述映射关系生成与所述数据集对应的输出标签;
39、获取预设的分类模型;
40、将所述数据集作为模型输入,将所述输出标签作为模型输出对所述分类模型进行训练,得到对应的指定分类模型;
41、基于预设的评估数据集对所述指定分类模型进行模型评估;
42、若所述指定分类模型通过模型评估,则将所述指定分类模型作为所述实体链接模型。
43、进一步的,在所述基于预设的图数据库对所述映射结果进行知识存储处理,得到与所述保险知识文本对应的目标知识图谱的步骤之后,还包括:
44、获取预设的图谱测试数据集;
45、基于所述图谱测试数据集对所述目标知识图谱进行评估测试处理,得到对应的评估结果;
46、基于所述评估结果生成对应的评估报告;
47、将评估报告发送至预设的目标团队。
48、为了解决上述技术问题,本技术实施例还提供一种基于人工智能的知识图谱构建装置,采用了如下所述的技术方案:
49、第一获取模块,用于获取预先收集的原始保险知识文本;
50、预处理模块,用于对所述原始保险知识文本进行预处理,得到对应的保险知识文本;
51、第一抽取模块,用于基于训练好的实体抽取模型对所述保险知识文本进行实体抽取,得到所述保险知识文本中的保险实体;
52、第二抽取模块,用于基于训练好的实体属性抽取模型对所述保险知识文本与所述保险实体进行属性抽取,得到所述保险实体的属性值;
53、第三抽取模块,用于基于训练好的关系抽取模型对所述保险知识文本进行关系抽取,得到与所述保险知识文本对应的保险关系;
54、映射模块,用于基于训练好的实体链接模型,使用所述保险实体、所述保险实体的属性值、所述保险关系对预设的本体模型进行数据映射处理,得到对应的映射结果;
55、存储模块,用于基于预设的图数据库对所述映射结果进行知识存储处理,得到与所述保险知识文本对应的目标知识图谱。
56、为了解决上述技术问题,本技术实施例还提供一种计算机设备,采用了如下所述的技术方案:
57、所述计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现本技术实施例中提出的任一项所述的基于人工智能的知识图谱构建方法的步骤。
58、为了解决上述技术问题,本技术实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
59、所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本技术实施例中提出的任一项所述的基于人工智能的知识图谱构建方法的步骤。
60、与现有技术相比,本技术实施例主要有以下有益效果:
61、首先获取预先收集的原始保险知识文本;并对所述原始保险知识文本进行预处理,得到对应的保险知识文本;然后基于训练好的实体抽取模型对所述保险知识文本进行实体抽取,得到所述保险知识文本中的保险实体;之后基于训练好的实体属性抽取模型对所述保险知识文本与所述保险实体进行属性抽取,得到所述保险实体的属性值;后续基于训练好的关系抽取模型对所述保险知识文本进行关系抽取,得到与所述保险知识文本对应的保险关系;进一步基于训练好的实体链接模型,使用所述保险实体、所述保险实体的属性值、所述保险关系对预设的本体模型进行数据映射处理,得到对应的映射结果;最后基于预设的图数据库对所述映射结果进行知识存储处理,得到与所述保险知识文本对应的目标知识图谱。本技术基于实体抽取模型、实体属性抽取模型、关系抽取模型、实体链接模型以及图数据库的使用对保险知识文本进行处理,可以实现快速准确的构建出相应的目标知识图谱。由此能够避免人工收集、整理和编辑图谱数据所浪费的时间,从而有效提高知识图谱的构建效率,同时,还能够避免由于工作人员的疏忽而导致图谱编辑错误的情况,进而提高知识图谱的构建准确度。
本文地址:https://www.jishuxx.com/zhuanli/20250110/351810.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。