技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于多层次对齐的知识图谱融合方法及系统  >  正文

基于多层次对齐的知识图谱融合方法及系统

  • 国知局
  • 2024-07-31 23:20:50

本发明涉及数据处理领域,特别涉及基于多层次对齐的知识图谱融合方法及系统。

背景技术:

1、智能制造是基于新一代信息技术与先进制造技术深度融合,贯穿于设计、生产、管理、服务等制造活动各个环节,旨在提高制造业质量、效益和核心竞争力的先进生产方式。可见,研发面向制造全过程的设计制造运维一体化平台是实现智能制造的核心和关键难点。

2、设计制造运维一体化平台主要针对制造业多企业协同设计、分布式制造和多区域运维的新需求,结合业务数据的分层分级安全管理需求,解决多体系模型融合和传递的科学问题,突破复杂电子装备故障知识图谱构建、多态异构大差异模型数据同源与自动适配、分布式跨网协同数据安全存储等关键技术,建立设计制造运维一体化的分布式制造技术体系,最终实现多企业协同设计、分布式制造、多区域运维的数据动态共享、装备功能互调、调试结果互认、服务跨域协同。

3、设计制造运维一体化平台的构建经历了一个自底向上、自建自用、需求导向、分步实施的研发过程。整个过程缺乏集成化、协同化、整体性的规划,使得不同部门、不同业务之间的信息系统相对孤立,导致负责多企业协同设计、分布式制造与多区域运维的各个课题之间数据标准定义不一致、协同与共享难等问题。其中,在复杂电子装备故障诊断中体现得尤为明显。

4、协同设计部门针对分布式制造、多区域运维过程中的故障数据构建了设计反演故障知识图谱,旨在通过分析设计、制造过程中的故障数据指导设计;分布式制造部门针对模块调试、整机联试过程中的故障现象构建了调试联试故障知识图谱,通过研究基于知识图谱的故障自动分析技术,解决产品bit、串件测试和人工经验等传统故障定位方式存在的故障覆盖率低、费时费力、人员素质要求高等问题;多区域运维部门针对运维过程中的故障现象构建了跨域协同故障知识图谱,解决传统故障诊断过程缺乏自动化工具支持、故障复现和定位难、基地级制造商与相关配套企业以及各区域之间网络不互联等问题,最终实现故障模式精确识别与定位,跨域故障平均维修周期大幅缩短。

5、由于前期缺乏针对三个知识图谱的整体规划以及各个业务之间的关联性,导致三个知识图谱的内容存在重叠与互补,造成资源浪费、无法统一为各个业务提供服务、后期维护困难等问题。因此,基于原有知识图谱,开展异构知识图谱间数据表示的标准化、知识图谱融合技术的研究,最终形成一个统一的知识图谱,为用户提供更加完整和高质量的故障定位、故障诊断等服务成为当前一体化平台的迫切需求与重要研究方向。

技术实现思路

1、不同知识图谱(knowledge graph,kg)的构建由于需求特定和业务功能差异而涉及不同的数据源,导致各个知识图谱之间存在着异构、冗余和互补等问题。为了解决这些问题,知识图谱融合(knowledge fusion,kf)技术应运而生,其目的在于对图谱中的异构、冗余和互补等信息进行对齐和合并,从而形成全局统一的知识标识和关联。实体对齐(entityalignment,ea)技术旨在从不同的知识图谱中自动识别具有等价关系的实体,解决不同图谱对同一实体的命名差异,是提高知识图谱完整性、实现多源异构知识图谱自动融合的关键步骤。现有实体对齐方法中,主要分为传统实体对齐方法和基于嵌入的实体对齐方法两大类。传统的实体对齐方法侧重于关系推理和实体字符方面,通常借助实体字符相似度比较或关系推理完成实体对齐。实体字符相似度比较的实体对齐大多通过词频-逆向文件频率(tf-idf)、机器学习判别器、同义词典等传统技术进行相似度的计算。基于关系推理的实体对齐大多依赖kg内的关系,核心观念是建立关系相似函数、概率函数和关系可比性函数等机制,以评估关系间的语义等同性,在对应关系下实现实体对齐。传统的实体对齐方法通常侧重于关系推理和实体字符方面,对齐过程中涉及的实体属性各异且领域差异较大,难以将相似性算法进行统一。与此同时,传统的实体对齐方法还忽略了关系三元组结构之间的语义信息,未能充分表达实体的语义关联,存在一定的限制。基于嵌入的实体对齐方法主要采用知识图谱嵌入模型,学习将实体映射到低维向量空间的嵌入表示,计算实体的嵌入表示相似度,最后得到对齐实体。部分基于嵌入的实体对齐方法主要利用知识图谱的关系特征来对齐实体。比如transe模型将关系嵌入看作头实体嵌入与尾实体嵌入之间的转换嵌入。具体而言,给定三元组(h,r,t),期望头实体嵌入与关系嵌入之和接近尾实体的嵌入,即h+r≈t。mtranse基于transe将各个kg的关系、实体编码到不同嵌入空间内,并提供了转换规则,以计算实体之间的嵌入距离,从而实现实体对齐。iptranse和bootea是两种自训练方法,它们将两个知识图谱嵌入到一个统一的嵌入空间中,并迭代地将新的实体对齐信息作为监督信号进行标记。gcn-align则在图结构上学习实体的嵌入表示,并通过迭代的方式不断优化实体对齐的嵌入,使得两个知识图谱中相似的实体能够在共享的嵌入空间中更接近,从而实现实体对齐任务。以上这些方法主要依赖知识图谱中的关系特征进行实体对齐,缺乏对属性、文本描述等其他特征的应用。因此,部分基于嵌入的实体对齐方法通过整合不同类型的特征来加强基于关系的嵌入。jape则将图谱中的关系、属性结合,实现实体间的匹配。kdcoe共同训练关系嵌入和文本描述嵌入,而attre则加入了字符级文字嵌入。然而,以上这些特征并不是被平等对待的,而是用来改进基于关系的嵌入且无法整合新特性。

2、本发明提供基于多层次对齐的知识图谱融合方法,包括:获取设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱;针对现有基于嵌入的知识图谱融合方法无法平等对待实体、关系和属性等多个特征的问题,构建多层次对齐的知识图谱融合模型,其中,所述多层次对齐的知识图谱融合模型包括知识图谱输入模块、知识图谱嵌入模块及知识图谱融合输出模块;所述知识图谱输入模块对所述设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱进行预处理,重点解决本体层标准不统一、数据噪音大的问题;所述知识图谱嵌入模块以平等的方式通过不同编码器分别提取所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱中的实体、关系及属性的嵌入特征;所述知识图谱融合输出模块基于所述知识图谱嵌入模块提取的实体、关系及属性的嵌入特征,对所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱进行融合,生成融合后的故障知识图谱;基于所述融合后的故障知识图谱,进行电子装备故障诊断。

3、进一步地,为了消除数据源之间的差异性和不一致性,为后续的融合处理提供一致的基础,对所述设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱进行预处理,包括:对所述设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱进行本体层标准的统一;对所述设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱进行去噪及文本标准化。

4、进一步地,所述知识图谱嵌入模块提取所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱中的实体、关系及属性的嵌入特征,包括:对于所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱中的每个实体,使用离散文字嵌入模型提取所述实体包含的令牌的离散文字嵌入和符号文字嵌入模型提取所述实体包含的令牌的符号文字嵌入,生成所述实体的嵌入特征。

5、进一步地,所述知识图谱嵌入模块提取所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱中的实体、关系及属性的嵌入特征,包括:通过transe模型提取所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱中的关系的嵌入特征。

6、进一步地,所述知识图谱嵌入模块提取所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱中的实体、关系及属性的嵌入特征,包括:对于所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱中每个属性,将所述属性的嵌入和所述属性的值的嵌入拼接成一个矩阵,将所述矩阵输入至卷积神经网络,获取所述属性的嵌入特征。

7、进一步地,为了衡量获得的属性嵌入的合理性,建立以下损失函数训练所述卷积神经网络:

8、

9、scattr(h(3),a,v)=-||h(3)-cnn(<a,v>)||

10、其中,φ(3)表示仅在属性嵌入层次下的综合实体嵌入,h(3)为属性的嵌入,a为属性,v为属性的值,cnn(·)为卷积运算,z+=za∪zb∪zc表示待融合的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱中的真实属性三元组的集合。

11、进一步地,为了完成实体对齐,所述知识图谱融合输出模块基于所述知识图谱嵌入模块提取的实体、关系及属性的嵌入特征,对所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱进行融合,生成融合后的故障知识图谱,包括:对所述知识图谱嵌入模块提取的设计反演故障知识图谱的实体、关系及属性的嵌入特征进行融合,得到设计反演故障知识图谱的综合实体嵌入;对所述知识图谱嵌入模块提取的调试联试故障知识图谱的实体、关系及属性的嵌入特征进行融合,得到调试联试故障知识图谱的综合实体嵌入;对所述知识图谱嵌入模块提取的跨域协同故障知识图谱的实体、关系及属性的嵌入特征进行融合,得到跨域协同故障知识图谱的综合实体嵌入;基于所述设计反演故障知识图谱的综合实体嵌入、所述调试联试故障知识图谱的综合实体嵌入和所述跨域协同故障知识图谱的综合实体嵌入,计算不同知识图谱之间的实体相似度,完成实体的对齐,生成所述融合后的故障知识图谱。

12、进一步地,为了综合各个嵌入层次的贡献,更准确地捕获文本的语义特征,对所述知识图谱嵌入模块提取的设计反演故障知识图谱的实体、关系及属性的嵌入特征进行融合,得到设计反演故障知识图谱的综合实体嵌入,包括:基于权重和或共享空间,对所述知识图谱嵌入模块提取的设计反演故障知识图谱的实体、关系及属性的嵌入特征进行融合,得到设计反演故障知识图谱的综合实体嵌入。

13、进一步地,基于以下公式计算不同知识图谱之间的实体相似度:

14、

15、其中,dis(em,en)为设计反演故障知识图图谱中的实体em和调试联试故障知识图谱中的实体en的相似度,为设计反演故障知识图图谱中的实体em的综合实体嵌入,为调试联试故障知识图谱中的实体en的综合实体嵌入,||·||1为l1范数。

16、本发明提供基于多层次对齐的知识图谱融合系统,包括:图谱获取模块,用于获取设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱;模型建立模块,用于构建多层次对齐的知识图谱融合模型,解决现有基于嵌入的知识图谱融合方法无法平等对待实体、关系和属性等多个特征的问题,其中,所述多层次对齐的知识图谱融合模型包括知识图谱输入模块、知识图谱嵌入模块及知识图谱融合输出模块;图谱融合模块,用于基于所述知识图谱输入模块对所述设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱进行预处理;所述图谱融合模块还用于基于所述知识图谱嵌入模块提取所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱中的实体、关系及属性的嵌入特征;所述图谱融合模块还用于基于所述知识图谱融合输出模块基于所述知识图谱嵌入模块提取的实体、关系及属性的嵌入特征,对所述预处理后的设计反演故障知识图谱、调试联试故障知识图谱和跨域协同故障知识图谱进行融合,生成融合后的故障知识图谱;故障诊断模块,用于基于所述融合后的故障知识图谱,进行电子装备故障诊断。

17、相比于现有技术,本发明提供的基于多层次对齐的知识图谱融合方法及系统,至少具备以下有益效果:

18、1、针对设计制造运维一体化平台中的知识图谱具有本体层不统一、数据噪音大等特点,对平台中的各知识图谱进行数据预处理,为后续的融合提供一致的基础。

19、2、针对现有基于嵌入的知识图谱融合方法无法平等对待实体、关系和属性等多个特征的问题,提出一种基于多层次对齐的知识图谱融合方法。该方法首先以平等的方式通过不同编码器分别提取实体、关系、属性的嵌入特征,再对多种嵌入特征进行融合,得到综合实体嵌入,最后通过l1距离计算不同知识图谱间综合实体嵌入的相似性,发现对齐实体。

本文地址:https://www.jishuxx.com/zhuanli/20240730/197118.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。