技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种构建仿人解答引擎的方法及装置 > 正文

一种构建仿人解答引擎的方法及装置

国知局
2024-10-09 16:09:35

本发明涉及人工智能，尤其涉及一种构建仿人解答引擎的方法及装置。

背景技术：

1、机器解答是人工智能领域长期活跃的前沿研究课题，近年来在相关领域的技术进步和智能化教育需求的合力推动下，机器解答代数型题目形成了新的研究高峰。代数型题目是涉及代数关系计算的题目，包括物理代数题、化学代数题、算术文字题、数学中代数题、带图形的代数题、平面几何计算题、平面几何计算代数题、函数型代数题等等。机器解答经过60多年的发展，产出了丰富研究成果。在机器解答理论方面，发展出了状态转移理论，该理论既可以对现有的解答算法进行解释，又可以对设计新的解答算法提供思考指导。在机器解答算法方面，目前已经研发了100多种针对代数型题目的解答算法，为了对其主要技术进行介绍，采用机器解答的状态转移理论可以将这100多种算法划分为五种主要解答状态表示的方法，分别是基于双框模型的解答方法、基于方程的解答方法、基于表达式的解答方法、基于seq2x的解答方法、基于关系组的解答方法。下面分别对机器解答代数型题目发展出的理论和解答算法这两方面进行简述。

2、1. 机器解答代数型题目的状态转移理论

3、机器解答代数型题目的状态转移理论将代数型题目的解答过程建模为从一种状态经过转移技术转化成另一种状态的循环表示过程，其中的“状态”是对代数型题目解答算法的中间结果状态的抽象表示，“转移技术”是实现从一种状态到另一种状态的方法，在算法程序实现的级别中，状态则是一个抽象的数据结构，用来对一组中间结果进行一致化的存储表示，转移技术则是一组具有标准接口的执行程序。依据状态转移理论，机器解答代数型题目的算法可以表示成“状态转移图”，机器解答的状态转移图是对现有的机器解答算法内部构造的图形化表示，不仅有助于对已有的机器解答方法和算法进行分析，还有助于分析机器解答方法和算法下一次进化方向。

4、2. 现有解答算法主要归纳为五类解答方法

5、(1) 基于双框模型的解答方法。基于双框模型的解答方法遵循的核心思想是以知识表示框架来存储题目理解的结果，以策略框架作为知识推理的动力作用到知识表示框架上，从而产生题目的理解过程和解答结果。依据状态转移理论，基于双框模型的解答方法的状态转移图中普遍都使用了两种类型的框架来构建表示算术文字题的解答模型，这两类框架分别是知识表示框架和推理策略框架，因此基于双框模型的解答方法中有两个主要的状态节点，分别是知识表示框架的状态节点和推理策略框架的状态节点。再结合解答的题目输入状态节点和解答输出状态节点，基于双框模型的解答方法中一共有三种主要的转移技术：第一个转移技术是利用语义模板匹配将题目文本中包含的知识填充到知识表示框架中；第二个转移技术是利用题目类型匹配选定题目的推理策略框架；第三个转移技术是利用推理策略框架进行推理求解获取题目的解答。

6、(2)基于方程的解答方法。基于方程的解答方法的核心思想是以方程作为题目的等价表示状态，并基于方程形成方程组，以解方程组为动力求解出题目的答案。由于求解方程组可以依赖于现有的已经成熟的数学工具，因此，以方程为中心的解答方法解答题目的主要阶段在于题目理解，即如何获取题目等价表示的方程并形成方程组。以方程为中心的方法使用的题目等价表示方程组是双框模型之后提出一种全新的题目等价表示状态，相较于双框模型方法，以方程为中心的方法的题目等价状态得到了简化，其获取方程组的过程减少了对于题目文本自然语言理解的依赖。依据状态转移理论，基于方程的解答方法的状态转移图中有五种状态，其中有三种主要的状态，分别是特征文本状态节点、方程模板状态节点以及方程组状态节点。因此，这类解答算法中有四个转移技术：第一个转移技术是利用特征抽取方法得到题目的特征文本；第二个转移技术是对特征文本进行计算匹配到方程模板；第三个转移技术是利用参数映射将方程模板转化成方程组；第四个转移技术则是对方程组进行求解得到题目答案。

7、(3)基于表达式的解答方法。基于表达式的解答方法将题目文本转化成一个由数字和运算符组成的答案表达式进行求解。依据状态转移理论，基于表达式的解答方法的状态转移图中有三种主要的状态：数量运算对象、表达式树和表达式，因此，这个状态转移图中有四个转移技术：第一个转移技术是对题目文本中数量进行分类识别得到参数运算的数量运算对象；第二个转移技术是利用规则对数量运算对象进行推理得到题目文本对应的表达式树；第三个转移技术是将表达式树转化成表达式；第四个转移技术作是求解表达式得到题目答案。

8、(4)基于seq2x的解答方法。基于seq2x（sequence-to-x，x可以是seq、tree和dag，分别对应序列、树和有向无环图）的解答方法利用训练的seq2x模型将题目输入状态转移成答案表达式进行计算求解。seq2x的解答方法潜在假设是一个题目可以等价成一个答案表达式进行表示，该方法借鉴自然语言处理领域的“编码-解码”的范式，其过程主要是计算向量。依据状态转移理论，基于seq2x的解答算法的状态转移图中有五个状态节点，除了输入的题目文本状态节点和输出的题目解答状态节点以外，还有三个关键的状态节点：文本向量序列状态节点、表达式向量序列状态节点和表达式状态节点。因此，这类解答算法中有四个转移技术来连接这五个状态节点：第一个转移技术是将给定题目文本编码为文本向量序列；第二个转移技术是将题目文本的向量序列转化为表达式隐态向量；第三个转移技术是将表达式隐态向量转化为答案表达式；第四个转移技术是对答案表达式计算求解得到题目解答。基于seq2x的解答方法的状态转移图表明尽管基于seq2x的解答算法在后续的研究中发展融合了很多新的深度学习的技术和方法，但是其主要是针对状态转移图中的动作引入了新的技术方法从而构建了新的解答算法。

9、(5)基于关系组的解答方法。基于关系组的解答方法将题目输入状态等价转化成关系组进而转化成方程组进行求解。该方法的潜在假设是一个算术文字题目可以等价表示成一个方程组进行求解。基于关系组的解答方法的核心是以关系作为理解题目的粒度，而不是孤立的数字，其题目理解的主要过程就是获取题目解答所需要的关系组。基于关系组的解答方法的算法中存在一个共同的状态，即关系组。因此，基于关系组的解答方法的状态转移图中有三个主要的状态：文本标注序列、关系组和方程组，该方法输出的状态是题目解答。基于关系组的解答方法的状态转移图中有四个关键的转移技术：第一个转移技术是对题目文本进行词性标注得到文本标注序列；第二个转移技术是从题目文本的标注序列中抽取关系得到关系组；第三个转移技术是将关系组转化成方程组；第四个转移技术是求解答方程组得到题目的解答。基于关系组的解答方法后续引入了向量计算，从而产生了向量化的表示状态和转移技术。

10、从上述对机器解答代数型题目发展出的理论和解答算法的评述可以看出，机器解答代数型题目的研究取得了丰富成果，但是相关研究成果还未达到智能教育应用的要求，还有很大的发展空间。尽管机器解答代数型题目研究领域已经提出了100多种算法，然而普遍的一个现状是一篇论文中开发的解答算法往往都是希望使用一个算法来统一解答不同类型的题目，这样的解答方法已经被证明是不可行的，其算法能够解答的题目范围非常有限。

技术实现思路

1、本发明提供一种构建仿人解答引擎的方法及装置，用以解决现有技术中能够解答的题目范围有限的缺陷。

2、第一方面，本发明提供一种构建仿人解答引擎的方法，包括：获取每个解答算法的状态转移图；所述状态转移图包括输入节点、关键状态节点、输出节点以及节点之间的状态转移路径，输入节点与解答算法的输入状态对应，关键状态节点与解答算法的关键状态之间一一对应，输出节点与解答算法的输出状态对应，状态转移路径与状态之间的转移关系一一对应；将所有的状态转移图中的输入节点、输出节点以及相同的关键状态节点、相同的状态转移路径分别进行合并集成，形成集成状态转移图；对所述集成状态转移图进行功能配置，以构建解答技术静态图作为仿人解答引擎；其中，对集成状态转移图进行功能配置的方法包括：配置集成状态转移图中的输入节点，用于接收代数型题目并对代数题型目进行内容解析，确定下一次状态转移路径以进行状态转移；配置集成状态转移图中的关键状态节点，用于根据当前节点接收的通过状态转移生成的状态内容，确定下一次状态转移路径以进行状态转移；配置集成状态转移图中的输出节点，用于根据接收到的状态转移节点输入的状态内容，输出代数型题目的解答内容。

3、根据本发明提供的一种构建仿人解答引擎的方法，对于输入节点和关键状态节点，确定下一次状态转移路径以进行状态转移，包括：在节点具有多个状态转移路径的情况下，根据当前接收到的状态内容，从多个状态转移路径中确定出至少一个目标状态转移路径以进行状态转移；在节点仅有一个状态转移路径的情况下，采用仅有的一个状态转移路径进行状态转移。

4、根据本发明提供的一种构建仿人解答引擎的方法，在所述关键状态节点接收多个状态转移路径转移的状态内容的情况下，对所有的状态内容进行数据整合处理。

5、根据本发明提供的一种构建仿人解答引擎的方法，在节点具有多个状态转移路径的情况下，将所述节点称为发散转出节点；根据当前接收到的状态内容，从多个转移路径中确定出至少一个目标状态转移路径以进行状态转移，包括：将当前接收到的状态内容输入至预先构建的当前的发散转出节点的第一决策模型中，输出预测的路径标签，以进行状态转移；其中，构建任一发散转出节点的第一决策模型的步骤包括：获取任一发散转出节点关于状态转移路径的决策数据集；所述决策数据集包括所述任一发散转出节点接收到的状态内容，以及对应的路径标签；其中，路径标签包括下一次状态转移路径和节点的标签；基于所述决策数据集，分析状态内容与路径标签之间的基于规则驱动的映射关系，构建所述任一发散转出节点的第一决策模型。

6、根据本发明提供的一种构建仿人解答引擎的方法，在节点具有多个状态转移路径的情况下，将所述节点称为发散转出节点；根据当前接收到的状态内容，从多个转移路径中确定出至少一个目标状态转移路径以进行状态转移，包括：将当前接收到的状态内容输入至预先训练完成的当前的发散转出节点的第二决策模型中，输出预测的路径标签，以进行状态转移；其中，构建任一发散转出节点的第二决策模型的步骤包括：获取任一发散转出节点关于状态转移路径的决策数据集；所述决策数据集包括所述任一发散转出节点接收到的状态内容，以及对应的路径标签；其中，路径标签包括下一次状态转移路径和节点的标签；利用决策数据集训练预设机器学习模型，将训练完成的预设机器学习模型作为所述第二决策模型。

7、根据本发明提供的一种构建仿人解答引擎的方法，还包括：在进行状态转移的过程中缺少必要的知识的情况下，从预先设置的知识库中获取必要的知识。

8、根据本发明提供的一种构建仿人解答引擎的方法，还包括：在出现新的解答算法时，对所述仿人解答引擎进行配置更新。

9、根据本发明提供的一种构建仿人解答引擎的方法，对所有的状态内容进行数据整合处理的处理方式包括以下处理方式中的一项或多项的组合：信息合并、内容清洗以及优先排序。

10、第二方面，本发明还提供一种构建仿人解答引擎的装置，包括：

11、状态转移图获取模块，用于获取每个解答算法的状态转移图；所述状态转移图包括输入节点、关键状态节点、输出节点以及节点之间的状态转移路径，输入节点与解答算法的输入状态对应，关键状态节点与解答算法的关键状态之间一一对应，输出节点与解答算法的输出状态对应，状态转移路径与状态之间的转移关系一一对应；

12、集成状态转移图构建模块，用于将所有的状态转移图中的输入节点、输出节点以及相同的关键状态节点、相同的状态转移路径分别进行合并集成，形成集成状态转移图；

13、仿人解答引擎构建模块，用于对所述集成状态转移图进行功能配置，以构建解答技术静态图作为仿人解答引擎；其中，对集成状态转移图进行功能配置包括：

14、配置集成状态转移图中的输入节点，用于接收代数型题目并对代数型题目进行内容解析，确定下一次状态转移路径以进行状态转移；配置集成状态转移图中的关键状态节点，用于根据当前节点接收的通过状态转移生成的状态内容，确定下一次状态转移路径以进行状态转移；配置集成状态转移图中的输出节点，用于根据接收到的状态转移节点输入的状态内容，输出代数型题目的解答内容。

15、第三方面，本发明提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述构建仿人解答引擎的方法的步骤。

16、第四方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述构建仿人解答引擎的方法的步骤。

17、本发明提供的构建仿人解答引擎的方法及装置，通过集成多个算法的状态转移图，构建集成状态转移图，并对集成状态转移图进行功能配置生成解答技术静态图作为仿人解答引擎，可以进一步提升解答题目的性能和效率；进一步地，本发明模仿了人类的思维过程，通过一系列状态转移来逐步解析和解决代数型题目，使得解答引擎更加灵活和智能，能够处理复杂多变的问题类型，扩大了可解答的题目范围。