技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种本体动态生成方法与流程  >  正文

一种本体动态生成方法与流程

  • 国知局
  • 2024-07-31 22:43:59

本公开涉及数据处理,特别是涉及一种本体动态生成方法。

背景技术:

1、“本体”是指特定领域的概念集合及其内在逻辑关系的规范化语义描述,可为领域数据提供基本的分类框架与关联描述机制,进而对数据蕴含的语义进行合理组织。本体可视为人类知识语义框架的数字化抽象,是人、机之间的知识桥梁,具有易于查询、扩展、理解、共享的优势。

2、“本体建模”指采用基于本体的知识表示方法进行知识建模。其核心任务是明确领域中的概念、概念的属性和约束条件和概念之间的层次关系。通常包括领域分析与概述、定义概念和关系、建立类和实例和定义规则与约束等步骤。具体而言,是通过定义一组本体公理(axioms)来描述知识的过程。

3、“动态本体”指本体内容在系统运行时可灵活扩展、修改或删除,可快捷地与其他本体进行融合关联,从而在不断变化的环境中有效工作,适应新的信息和变化。“本体动态生成”指系统能够自动地根据新获取的数据源,动态、灵活地生成本体。

4、构建高质量领域本体是异构数据集成、知识建模等任务的迫切需求,然而本体的构建过程需要大量的人工投入,因而较为繁琐。当前,根据数据自动地生成或提取本体一直是本体领域的研究热点。

技术实现思路

1、鉴于上述问题,本公开实施例提供了一种本体动态生成方法,以便克服上述问题或者至少部分地解决上述问题。

2、本公开实施例的第一方面,提供了一种本体动态生成方法,所述方法包括:

3、获取数据表的大类,所述数据表的大类包括结构化数据表和半结构化数据表;

4、针对不同大类的数据表,采用所述大类对应的语义类别识别算法,识别每个大类的数据表的小类;其中,所述语义类别识别算法包括结构化语义类别识别算法和半结构化语义类别识别算法;所述结构化数据表的小类包括:结构化数据实体表、结构化数据普通事件表和结构化数据n元关联表;所述半结构化数据表的小类包括:半结构化数据实体表、半结构化数据普通事件表和半结构化数据n元关联表;所述结构化数据普通事件表和所述半结构化数据普通事件表为包含时间信息的数据表;所述n为大于1的正整数;

5、按照各个小类对应的本体生成规则,对各个小类的数据表进行转换,得到本体。

6、可选地,在所述数据表的大类为结构化数据表的情况下,所述采用所述大类对应的语义类别识别算法,识别每个大类的数据表的小类,包括:

7、判断所述结构化数据表中是否包括时间信息,所述时间信息包括:普通时间点、起止时间信息和时间持续长度;

8、在所述结构化数据表中包括时间信息的情况下,将所述结构化数据表的小类确定为结构化数据普通事件表;

9、在所述结构化数据表中不包括时间信息的情况下,判断所述结构化数据表的主键是否由n个外键组成;

10、在所述结构化数据表的主键由n个外键组成的情况下,将所述结构化数据表的小类确定为结构化数据n元关联表;

11、在所述结构化数据表的主键不由n个外键组成的情况下,将所述结构化数据表的小类确定为结构化数据实体表。

12、可选地,在所述数据表的大类为半结构化数据表的情况下,所述采用所述大类对应的语义类别识别算法,识别每个大类的数据表的小类,包括:

13、判断所述半结构化数据表中是否包括时间信息,所述时间信息包括:普通时间点、起止时间点和时间长度;

14、在所述半结构化数据表中包括时间信息的情况下,将所述半结构化数据表的小类确定为半结构化数据普通事件表;

15、在所述半结构化数据表中不包括时间信息的情况下,判断所述半结构化数据表是否有n个引用外部数据表的数据列;

16、在所述半结构化数据表有n个引用外部数据表的数据列的情况下,将所述半结构化数据表的小类确定为半结构化数据n元关联表;

17、在所述半结构化数据表没有n个引用外部数据表的数据列的情况下,将所述半结构化数据表的小类确定为半结构化数据实体表。

18、可选地,所述按照各个小类对应的本体生成规则,对各个小类的数据表进行转换,得到本体,包括:

19、针对结构化数据普通事件表和半结构化数据普通事件表,为所述数据表中不同的时间信息属性列定义不同的数据属性,并将数据列的定义域确定为本体类,将所述数据列的值范围确定为time owl数据类型中的特有类型;time owl为支持时间概念的本体描述语言;

20、根据所述数据属性、所述定义域和所述值范围,生成所述本体。

21、可选地,所述为所述数据表中不同的时间信息属性列定义不同的数据属性,包括:

22、针对普通时间点数据列,在所述本体中创建intemporalposition数据属性;intemporalposition表征在时间位置上;

23、针对起始时间信息数据列和终止时间信息数据列,在所述本体中创建hasbeginning和hasend两个数据属性;hasbeginning表征存在开始,hasend表征存在终止;

24、针对描述时间持续长度的数据列,在所述本体中创建hasduration数据属性;hasduration表征持续时间。

25、可选地,所述将所述数据列的值范围确定为time owl数据类型中的特有类型,包括:

26、将所述普通时间点数据列的值范围确定为time:temporalposition;time:temporalposition是用于表示时间点的数据类型;

27、将所述起始时间信息数据列和所述终止时间信息数据列的值范围确定为time:temporalduration;time:temporalduration用于在本体建模中表示时间的持续期间;

28、将所述描述时间持续长度的数据列的值范围确定为time:duration;time:duration是用于表示持续时间的数据类型。

29、可选地,所述按照各个小类对应的本体生成规则,对各个小类的数据表进行转换,得到本体,包括:

30、针对所述结构化数据n元关联表,为外键定义实体关联关系及所述关联关系的逆关系,包括:在所述外键引用实体表或事件表的情况下,在所述本体中创建一个对象属性,所述对象属性的域为关联类,且所述对象属性的范围是根据所述外键引用的实体表或事件表确定的,将所述对象属性定义为functional单值属性,并创建所述对象属性的逆对象属性,将所述逆对象属性定义为inverse functional;functional单值属性是功能性属性,inverse functional是functional的逆功能属性。

31、可选地,所述按照各个小类对应的本体生成规则,对各个小类的数据表进行转换,得到本体,包括:

32、针对所述半结构化数据n元关联表,为引用外部实体表标识的数据列定义事件-实体关系及所述事件-实体关系的逆关系,包括:确定数据列引用的实体类,在本体中创建一个对象属性,所述对象属性的域为事件类,且所述对象属性的范围是根据所述数据列引用的实体类确定的,并创建所述对象属性的逆对象属性。

33、可选地,所述按照各个小类对应的本体生成规则,对各个小类的数据表进行转换,得到本体,包括:

34、针对所述半结构化数据n元关联表,为引用外部数据表id的数据列定义事件-事件关联关系及所述事件-事件关联关系的逆关系,包括:确定所述数据列引用的事件类,在所述本体中创建一个对象属性,所述对象属性的域为事件类,且所述对象属性的范围是根据所述数据列引用的事件类确定的,并创建所述对象属性的逆对象属性。

35、可选地,所述按照各个小类对应的本体生成规则,对各个小类的数据表进行转换,得到本体,包括:

36、根据各个数据表的小类,在所述本体中创建所述各个数据表对应的类别,所述类别包括实体类、事件类和关联类;

37、在所述数据表为事件类的情况下,指定所述类别为time:temporalentity的子类;time:temporalentity为时间实体。

38、本公开实施例的第二方面,提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行指令,以实现如第一方面的本体动态生成方法。

39、本公开实施例的第三方面,提供了一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面的本体动态生成方法。

40、本公开实施例包括以下优点:

41、本公开实施例中,细分了数据表的类别,将数据表分为了结构化数据实体表、结构化数据普通事件表、结构化数据n元关联表、半结构化数据实体表、半结构化数据普通事件表和半结构化数据n元关联表;进而,针对类别的数据表采用不同的本体生成规则,可以更加准确地对各个数据表进行转换,从而得到准确的本体。此外,数据表中包括事件类的数据表,实现了对事件特有的信息进行建模,有效区别了事件与其他普通实体。

本文地址:https://www.jishuxx.com/zhuanli/20240730/194351.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。