基于隐含概念挖掘的物资运输本体生成方法、装置和设备与流程
- 国知局
- 2024-07-31 23:26:29
本技术涉及物资运输,特别是一种基于隐含概念挖掘的物资运输本体生成方法、装置和设备。
背景技术:
1、目前,关系数据库(relational databases,rdb)被广泛用于存储和管理各个领域行业的大量数据。然而,由于关系数据模型的知识表征能力较弱,基于关系数据库的语义集成、知识挖掘、理解与互操作存在较大挑战。
2、本体,是指特定领域的概念集合及其内在逻辑关系的规范化语义描述,为领域数据提供了基本的分类框架与关联描述机制,进而对数据蕴含的语义进行合理组织。本体可视为人类知识语义框架的数字化抽象,是人、机之间的知识桥梁,具有易于查询、扩展、理解、共享的优势。将关系数据库自动转换为本体可以为数据添加语义,实现与其他系统和应用程序的互操作性,支持对数据的推理,并创建更灵活的知识表示。本体动态生成是指系统能够自动地根据给定数据源的结构和内容,敏捷地生成本体。
3、然而,由于物资运输关系数据库中的数据源内容复杂多样,现有的对关系型数据的本体动态生成技术的适用性有限,容易遗漏原始数据的语义内容,使得生成的本体会丢失掉一些本体语义信息。因此,有必要开发一种基于隐含概念挖掘的物资运输本体生成方法、装置和设备,以提高生成的本体的准确率。
技术实现思路
1、鉴于上述问题,本技术实施例提供了一种基于隐含概念挖掘的物资运输本体生成方法、装置和设备,以便克服上述问题或者至少部分地解决上述问题。
2、本技术实施例的第一方面,提供了一种基于隐含概念挖掘的物资运输本体生成方法,所述方法包括:
3、从物资运输信息关系数据库中提取得到关系数据库表;
4、确定所述关系数据库表中的一个或多个类型列;类型列表示所述关系数据库表中具有概念类别语义的数据列;
5、从所述关系数据库表中提取得到关系数据特征,所述关系数据特征至少包括:所述关系数据库表的数据列、主键、外键和约束信息;
6、根据所述关系数据特征和所述类型列,应用本体生成规则,生成物资运输信息本体。
7、在一种可能的实施方式中,所述确定所述关系数据库表中的一个或多个类型列,包括:
8、将所述关系数据库表转换为数值型数据矩阵;
9、从所述数值型数据矩阵中选择一个数据列,作为潜在类型列;
10、对于所述数值型数据矩阵中的每行数据,删除其中所述潜在类型列所属数值,得到待聚类特征向量;
11、对所述待聚类特征向量进行聚类,得到多个聚类簇;
12、根据所述多个聚类簇,计算聚类质量得分,所述聚类质量得分表示所述多个聚类簇的聚类质量;
13、遍历所述数值型数据矩阵中的所有数据列,根据每个数据列的聚类质量得分,确定关系数据库表中的一个或多个类型列。
14、在一种可能的实施方式中,所述对所述待聚类特征向量进行聚类,包括:
15、确定所述潜在类型列的每个数据在所述数值型数据矩阵中的取值;
16、将所述潜在类型列的所有取值的种类数量确定为目标聚类数;
17、利用k-means聚类算法,按照所述目标聚类数对所述待聚类特征向量进行聚类。
18、在一种可能的实施方式中,根据所述多个聚类簇,计算聚类质量得分,包括:
19、计算所述多个聚类簇的轮廓图分数,将所述轮廓图分数作为所述潜在类型列的聚类质量得分。
20、在一种可能的实施方式中,所述根据所述关系数据特征和所述类型列,应用本体生成规则,生成物资运输信息本体,包括:
21、对于所述关系数据库表,创建对应的本体类;
22、为所述类型列创建子类,生成所述子类与所述本体类的父子类关系;
23、对于所述关系数据特征中,不属于所述类型列的每个普通数据列,在本体中创建一个同名数据属性,使其定义域为所述本体类,其值范围为该普通数据列的sql数据类型;
24、对于所述关系数据特征中的主键内的每个数据列,在本体中创建一个同名数据属性,使其定义域为所述本体类,其值范围为该数据列的sql数据类型,为该同名数据属性添加一个关键公理。
25、在一种可能的实施方式中,所述为所述类型列创建子类,包括:
26、对于每个所述类型列,为所述类型列中的每种取值创建一个子类。
27、在一种可能的实施方式中,所述根据所述关系数据特征和所述类型列,应用本体生成规则,生成物资运输信息本体,包括:
28、根据为所述类型列创建的各个子类,创建一个类不相交公理。
29、本技术实施例第二方面还提供了一种基于隐含概念挖掘的物资运输本体生成装置,所述装置包括:
30、提取模块,用于从物资运输信息关系数据库中提取得到关系数据库表;
31、类型列确定模块,用于确定所述关系数据库表中的一个或多个类型列;所述类型列表示所述关系数据库表中具有概念类别语义的数据列;
32、关系数据特征提取模块,用于从所述关系数据库表中提取得到关系数据特征,所述关系数据特征至少包括:所述关系数据库表的数据列、主键、外键和约束信息;
33、本体生成模块,用于根据所述关系数据特征和所述类型列,应用本体生成规则,生成物资运输信息本体。
34、在一种可能的实施方式中,所述类型列确定模块,包括:
35、矩阵转换子模块,用于将所述关系数据库表转换为数值型数据矩阵;
36、潜在类型列确定子模块,用于从所述数值型数据矩阵中选择一个数据列,作为潜在类型列;
37、特征向量生成子模块,用于对于所述数值型数据矩阵中的每行数据,删除其中所述潜在类型列所属数值,得到待聚类特征向量;
38、聚类子模块,用于对所述待聚类特征向量进行聚类,得到多个聚类簇;
39、聚类质量评估子模块,用于根据所述多个聚类簇,计算聚类质量得分,所述聚类质量得分表示所述多个聚类簇的聚类质量;
40、类型列确定子模块,用于遍历所述数值型数据矩阵中的所有数据列,根据每个数据列的聚类质量得分,确定关系数据库表中的一个或多个类型列。
41、在一种可能的实施方式中,所述聚类子模块,包括:
42、取值确定单元,用于确定所述潜在类型列的每个数据在所述数值型数据矩阵中的取值;
43、目标聚类数确定单元,用于将所述潜在类型列的所有取值的种类数量确定为目标聚类数;
44、聚类单元,用于利用k-means聚类算法,按照所述目标聚类数对所述待聚类特征向量进行聚类。
45、在一种可能的实施方式中,所述聚类质量评估子模块,包括:
46、轮廓图分数计算单元,用于计算所述多个聚类簇的轮廓图分数,将所述轮廓图分数作为所述潜在类型列的聚类质量得分。
47、在一种可能的实施方式中,所述本体生成模块,包括:
48、第一生成子模块,用于对于所述关系数据库表,创建对应的本体类;
49、第二生成子模块,用于为所述类型列创建子类,生成所述子类与所述本体类的父子类关系;
50、第三生成子模块,用于对于所述关系数据特征中,不属于所述类型列的每个普通数据列,在本体中创建一个同名数据属性,使其定义域为所述本体类,其值范围为该普通数据列的sql数据类型;
51、第四生成子模块,用于对于所述关系数据特征中的主键内的每个数据列,在本体中创建一个同名数据属性,使其定义域为所述本体类,其值范围为该数据列的sql数据类型,为该同名数据属性添加一个关键公理。
52、在一种可能的实施方式中,所述第二生成子模块,还用于:
53、对于每个所述类型列,为所述类型列中的每种取值创建一个子类。
54、在一种可能的实施方式中,所述本体生成模块,还包括:
55、第五生成子模块,用于根据为所述类型列创建的各个子类,创建一个类不相交公理。
56、本技术实施例第三方面还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,所述处理器执行所述计算机程序以实现本技术实施例第一方面所述的基于隐含概念挖掘的物资运输本体生成方法中的步骤。
57、本技术实施例第四方面还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现本技术实施例第一方面所述的基于隐含概念挖掘的物资运输本体生成方法中的步骤。
58、本技术实施例第五方面还提供了一种计算机程序产品,所述计算机程序产品在电子设备上运行时,使处理器执行时实现如本技术实施例第一方面所述的基于隐含概念挖掘的物资运输本体生成方法中的步骤。
59、本技术实施例提供的一种基于隐含概念挖掘的物资运输本体生成方法,该方法包括:从物资运输信息关系数据库中提取得到关系数据库表;确定所述关系数据库表中的一个或多个类型列;所述类型列表示所述关系数据库表中具有概念类别语义的数据列;从所述关系数据库表中提取得到关系数据特征,所述关系数据特征至少包括:所述关系数据库表的数据列、主键、外键和约束信息;根据所述关系数据特征和所述类型列,应用本体生成规则,生成物资运输信息本体。本技术实施例通过识别关系数据库表中的类型列,类型列作为关系数据库表中的特殊列,也可以表达一定的语义充当本体的角色,具有概念类别语义。本技术结合关系数据特征和识别得到的类型列,应用本体生成规则,生成物资运输信息本体,以挖掘关系数据库表中的隐含概念(具有概念类别语义的类型列),避免语义遗漏,得到更为准确的本体。
本文地址:https://www.jishuxx.com/zhuanli/20240730/197574.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表