一种推理树数据的合成方法、系统、电子设备及存储介质
- 国知局
- 2024-09-11 14:35:38
本发明属于数据合成,具体涉及一种推理树数据的合成方法、系统、电子设备及存储介质。
背景技术:
1、合成数据是指通过程序自动生成而非实际采集的数据。在隐私、安全、保密、数据采集成本等因素导致真实数据缺乏时,合成数据被广泛应用于机器学习训练、模型测试、仿真实验等方面。
2、逻辑推理是智能的重要组成,使用大语言模型进行逻辑推理进行问题求解时,要求模型根据一段给定的上下文和问题,通过分析、推理和判断文本中蕴含的逻辑关系进行作答。训练模型掌握逻辑推理能力,一个重要的基础是提供训练数据集,对问题求解的推理过程进行示例。
3、但是,逻辑关系明确且推理过程正确的高质量数据是稀缺的,按照目前的模型的增长速度,现有高质量的数据将难以满足模型对于训练数据的需求。
技术实现思路
1、本发明为了克服现有技术的不足,提供了一种推理树数据的合成方法、系统、电子设备及存储介质,以获得图数据的逻辑推理过程,从而可以使得训练模型更好地理解逻辑推理的结构,评估和修正逻辑推理过程。
2、为了实现上述目的,本发明采用以下技术方案:
3、一种推理树数据的合成方法,包括:
4、获取本体;
5、基于所述本体,合成图数据;
6、采用第一推理机对所述本体和所述图数据进行推理,以获得断言和推导匹配所述断言的解释;
7、利用dl2prolog将所述解释转换为prolog知识库、将所述断言转换为prolog询问;
8、以及利用第二推理机对所述prolog知识库和所述prolog询问进行推理,以获得从所述prolog知识库出发推导所述prolog询问的推理树。
9、进一步地,所述获取本体,包括:
10、获取一个web本体语言和语义web规则语言表示的所述本体;
11、以及使用pellet推理机对所述本体进行推理,检测所述本体是否具有一致性,如果所述本体具有一致性则进入所述基于所述本体,合成图数据的步骤。
12、进一步地,所述图数据包括正例断言集和负例断言集。
13、进一步地,所述采用第一推理机对所述本体和所述图数据进行推理,以获得断言和推导匹配所述断言的解释,包括:
14、使用所述pellet推理机对所述本体和所述正例断言集共同构成的知识库进行推理;
15、对每个新推出的所述断言,使用所述pellet推理机获得推导所述断言的一个解释,并以所述断言和对应的所述解释组成一个断言-解释对;
16、以及对所述负例断言集中的每个负例断言,使用所述pellet推理机对所述本体、所述正例断言集和所述负例断言进行推理,以获得不一致的一个解释,并以所述负例断言的否定断言和对应的所述解释组成一个断言-解释对。
17、进一步地,所述利用dl2prolog将所述解释转换为prolog知识库、将所述断言转换为prolog询问,包括:
18、利用dl2prolog将所述断言-解释对中的解释转换为prolog知识库;
19、利用dl2prolog将所述断言-解释对中的断言转换为prolog询问;
20、以及基于所述prolog知识库和所述prolog询问,形成询问-知识库对。
21、进一步地,所述利用第二推理机对所述prolog知识库和所述prolog询问进行推理,以获得从所述prolog知识库出发推导所述prolog询问的推理树,包括:
22、利用tuprolog对每一个询问-知识库对,分别使用所述prolog知识库、所述prolog询问作为tuprolog的理论和询问输入进行推理,以获取从所述prolog知识库出发推导所述prolog询问的推理树。
23、进一步地,所述利用第二推理机对所述prolog知识库和所述prolog询问进行推理,以获得从所述prolog知识库出发推导所述prolog询问的推理树,还包括:
24、如果所述tuprolog不在预设时间内获取推理树,则停止所述推理,并将所述prolog知识库中的所有子句顺序随机排列,使用重排顺序的所述prolog知识库、所述prolog询问作为所述tuprolog的理论和询问输入进行推理,直到在所述预设时间内成功获取一个从所述prolog知识库出发推导所述prolog询问的推理树。
25、另外,本发明还提供了一种使用如上述的推理树数据的合成方法的系统,包括:
26、获取模块,用于获取本体;
27、图数据合成模块,用于基于所述本体,合成图数据;
28、第一推理模块,用于采用第一推理机对所述本体和所述图数据进行推理,以获得断言和推导匹配所述断言的解释;
29、转换模块,用于利用dl2prolog将所述解释转换为prolog知识库、将所述断言转换为prolog询问;
30、以及第二推理模块,用于利用第二推理机对所述prolog知识库和所述prolog询问进行推理,以获得从所述prolog知识库出发推导所述prolog询问的推理树。
31、另外,本发明还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的推理树数据的合成方法。
32、另外,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现如上述的推理树数据的合成方法。
33、在本发明中,通过从开源本体网站获取表示领域知识体系的本体,然后通过图数据合成方法获得图数据,进一步,对图数据进行本体推理并为推理结论产生解释,最后,将解释转换成论据结构的推理树表示形式,即获得了树形结构的推理过程样本。该方法能够源源不断地合成数据,且合成数据的质量比真实数据更可控,从而为训练模型提供高质量数据。
技术特征:1.一种推理树数据的合成方法,其特征在于,包括:
2.根据权利要求1所述的推理树数据的合成方法,其特征在于,所述获取本体,包括:
3.根据权利要求2所述的推理树数据的合成方法,其特征在于:所述图数据包括正例断言集和负例断言集。
4.根据权利要求3所述的推理树数据的合成方法,其特征在于,所述采用第一推理机对所述本体和所述图数据进行推理,以获得断言和推导匹配所述断言的解释,包括:
5.根据权利要求4所述的推理树数据的合成方法,其特征在于,所述利用dl2prolog将所述解释转换为prolog知识库、将所述断言转换为prolog询问,包括:
6.根据权利要求5所述的推理树数据的合成方法,其特征在于,所述利用第二推理机对所述prolog知识库和所述prolog询问进行推理,以获得从所述prolog知识库出发推导所述prolog询问的推理树,包括:
7.根据权利要求6所述的推理树数据的合成方法,其特征在于,所述利用第二推理机对所述prolog知识库和所述prolog询问进行推理,以获得从所述prolog知识库出发推导所述prolog询问的推理树,还包括:
8.一种使用如权利要求1-7任一项所述的推理树数据的合成方法的系统,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的推理树数据的合成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的推理树数据的合成方法。
技术总结本发明公开了一种推理树数据的合成方法、系统、电子设备及存储介质,该方法包括获取本体;基于所述本体,合成图数据;采用第一推理机对所述本体和所述图数据进行推理,以获得断言和推导匹配所述断言的解释;利用DL2Prolog将所述解释转换为Prolog知识库、将所述断言转换为Prolog询问;以及利用第二推理机对所述Prolog知识库和所述Prolog询问进行推理,以获得从所述Prolog知识库出发推导所述Prolog询问的推理树。本发明采用解释转换成论据结构的推理树表示形式,获得了树形结构的推理过程样本,能够源源不断地合成数据,且合成数据的质量比真实数据更可控,为训练模型提供高质量数据。技术研发人员:刘斌,左嘉成,单承正,董锟博,刘广生,丁兆云,朱先强,朱承受保护的技术使用者:中国人民解放军国防科技大学技术研发日:技术公布日:2024/9/9本文地址:https://www.jishuxx.com/zhuanli/20240911/291510.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。