技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于多元学习行为因果推断的动态认知诊断方法 > 正文

一种基于多元学习行为因果推断的动态认知诊断方法

国知局
2024-11-18 18:15:15

本发明涉及教育大数据挖掘、图神经网络与学生行为建模领域，具体涉及一种基于多元学习行为因果推断的动态认知诊断方法。

背景技术：

1、学习行为是学习者在参与学习时所产生的过程性动作或结果。按照学习行为发生所处的阶段，可将其分为结果性行为和过程性行为。

2、面向结果性行为的动态认知诊断，通过挖掘学习者的作答结果来推测其潜在认知水平，其中，作答结果通常指正确或错误的二元结果。经典认知诊断模型，如irt、dina、bkt，根据学习者反应的二元结果来推测其潜在认知水平。然而，在多项选择题中，作答结果可被拓展为多种作答选项，而不只是常见的二元结果。这些模型均以结果性行为为研究目标，联合多种认知因素，共同挖掘潜在认知水平。实际上，当前大部分认知诊断模型都基于结果性学习行为，忽略了多元化过程性学习行为对认知状态的影响，导致学习者认知水平与学习过程的割裂。因此，通过挖掘过程性行为来诊断学习者真实认知状态还需进一步探索。

3、面向过程性行为的动态认知诊断，在面向结果性行为的动态认知诊断模型基础上，融入学习过程中的学习行为信息，以推测学习者的潜在认知水平。由于过程性学习行为中隐含着丰富的认知状态信息，融合过程性行为的认知诊断有助于提高诊断的准确性。虽然目前的研究从不同角度引入了过程性行为并进行了一定的尝试，但它们将学习行为用于丰富作答交互的表示，并没有探究行为和知识间的内在关联。同时，从整体来看，当前认知诊断中关于过程性行为的研究相对较少，且已有相关研究仅使用零散的行为特征，这也无法全面刻画学习过程。因此，鉴于过程性学习行为对学习成效的重要性，从学习行为中挖掘学习者的潜在认知状态，探究行为和知识之间的关联，研究面向过程性行为的动态认知诊断建模是本领域的重要研究方向和发展趋势。

4、在大规模开放在线课程(massive open online courses,moocs)研究领域中，已经有许多关于学习过程中多元化学习行为的研究。特别地，有学者引入“点击流”来描述学习过程中的时序行为序列。点击流(click stream)是学习者在学习系统中持续访问的轨迹，常用于在线学习平台中学习者辍学率的预测。学习者在作答结束后，还可参与一些其它活动，比如查看解析，视频学习，以及巩固练习等，这些活动可形成“活动流(activitystream)”。事实上，“点击流”和“活动流”能全面记录学习行为序列，有助于采用神经网络技术来模拟学习者的真实学习过程。然而，基于点击流和活动流建模的过程性行为在认知诊断领域的应用还有待研究。

5、现有动态认知诊断忽视了长周期学习过程中多元化行为对学习者认知的影响，导致无法精准评估学习者的综合认知水平，进而影响了模型的可解释性。而多元化的学习行为与学习成效间存在复杂的因果关联，且不同行为要素对学习者认知状态的影响存在差异，挖掘学习过程中的关键行为要素将有助于提高诊断结果的精准性和可解释性。

技术实现思路

1、由于学习过程中的行为特征繁杂多样，如学习者在作答过程中反复修改，会形成“点击流”；学习者在做题结束后通过文本解析或针对性视频推荐来反思，形成“活动流”。学习者的学习成效与多种行为要素之间存在因果关联，且关联程度不尽相同。因此，基于学习过程形成的多元化行为，提出一种基于多元学习行为因果推断的动态认知诊断方法，构建作答行为图并使用图神经网络进行编码，通过因果注意力来挖掘多元行为与知识状态间的关联，最终完成对学习者认知水平的动态诊断。

2、本发明的目的就是为了针对现有认知诊断忽视了对多元化学习行为的因果分析而造成其结果存在诊断偏差和因果难解释问题，提供一种基于多元学习行为因果推断的动态认知诊断方法，借助点击流和活动流对学习过程行为建模，通过多元行为特征构建学习行为图。同时考虑学习行为与认知之间的因果关联，通过因果注意力机制学习权重差异，实现关键行为子图和低效行为子图的自动划分。随后将学习行为视作因果推断中的变量，对低效行为进行干预，建立关键行为与低效行为的组合，获取生成图。基于已获取的关键行为子图、低效行为子图和生成图表征，通过多任务机制来设置不同的预测目标，以此挖掘学习行为和内隐认知之间的因果关联，增强学习者认知水平动态诊断的可解释性。

3、本发明的目的是通过如下技术措施来实现的，一种基于多元学习行为因果推断的动态认知诊断方法，包括以下步骤：

4、步骤1，获取学习过程中的包括知识、行为和时序数据，构建学生作答数据集；知识数据包括某一时刻学生所作答的试题和试题相关的知识，行为数据包括学生在作答过程中反复修改答案而形成的点击流，以及作答结束后学生查看解析、视频资源而形成的活动流；时序数据包括当前行为发生时间戳信息；

5、步骤2，针对数据集中学生的点击流和活动流，构建学习行为图，将不同的行为特征映射至统一的行为空间，具体包括：通过时间戳统计点击特征构建点击流子图，通过时间戳统计活动特征构建活动流子图，并连接点击流子图和活动流子图，形成统一的学习行为图；

6、步骤3，将学习行为图中的行为划分为关键行为和低效行为，形成关键行为子图和低效行为子图这两个子图，并使用do算子干预生成干预图，以挖掘关键行为和低效行为与知识状态的因果关系；

7、步骤4，基于已获取的关键行为子图、低效行为子图和干预图表征，通过多任务机制来设置不同的预测目标，以此挖掘学习行为和内隐认知之间的因果关联，并将关键行为、低效行为与真实的作答计算交叉损失熵，而低效行为与固定值做交叉损失熵，最终损失函数由三者加权求和来计算，实现关键行为预测、干预图预测、低效行为预测。

8、进一步的，步骤2中点击流子图的构建方式如下；

9、首先，从点击流中，表示i时刻对试题n的点击行为，nc表示点击流的总个数；通过时间戳依次统计学习者每个选项的行为特征，抽取点击选项选项耗费的反应时间tn和选项重复次数pn三种行为特征；

10、其次，根据点击选项的时间戳信息，设定初始节点、中间节点和结束节点，节点记为节点的初始嵌入采用随机初始化的方法；

11、最后，将起止节点与中间过程的点击选项节点相连，反应时间和选项次数与对应的点击选项相连，完成各节点间的边关系，构建点击流子图中的边通过节点和边的设置，形成点击流子图来描述学习者作答过程。

12、进一步的，步骤2中活动流子图的构建方式如下；

13、学习者作答完成后，按时间顺序，构建学习者查看答案解析、观看视频、推荐练习作答行为组成活动流，记表示i时刻对试题n的活动行为，na表示活动流的总个数；

14、首先，从活动流中，通过时间戳依次统计学习者参与的每个活动的行为特征，抽取活动类型活动时间活动次数这些活动行为特征；

15、其次，根据三种活动行为特征，获取活动节点节点的初始嵌入采用随机初始化的方法；

16、再次，节点之间的边设置，根据时间戳的前后信息，在活动类型节点之间建立边连接，活动时间节点、活动次数节点与对应的活动类型节点分别建立边连接，构建活动流子图中的边

17、进一步的，步骤3的具体实现方式如下：

18、(3-1)获取学习行为图中的节点表征；

19、(3-2)关键行为子图和低效行为子图的划分

20、通过因果注意力方法来自动学习关联，并将行为划分为对知识状态有显著影响的关键学习行为和影响微弱的低效学习行为，具体来说，

21、首先，设置两个多层感知机分别从节点级和边级获取注意力得分，即：

22、第一，获取节点级注意力得分：对于学习行为图中的每个节点，设置多层感知机，节点的节点级注意力得分计算公式如下：

23、

24、其中，mlpnode是针对节点的多层感知机，函数exp()代表自然指数函数，hi表示行为图中的第i个节点表征，hn表示行为图所有节点表征；

25、第二，获取边级注意力得分：对于学习行为图中的每条边，设置多层感知机，边e的边级注意力得分计算公式如下：

26、

27、其中，mlpedge是针对边的多层感知机，表示行为图中的第i和j节点所形成的边e的表征，表示拼接，表示点击流子图中的边，表示活动流子图中的边；

28、由此，将每个点和每条边的注意力得分聚集，从而形成针对整个行为图的节点级注意力得分和边级注意力得分

29、而对于低效学习行为，用1减去对应的关键学习行为的得分，得到低效学习行为的节点注意力得分和边注意力得分，即整个行为图的节点注意力得分和边注意力得分分别被表示为

30、(3-3)使用do算子干预获取干预图，来挖掘关键学习行为和低效学习行为与知识状态的因果关系；

31、首先，用因果注意力的得分从学习行为图中分别抽取出关键行为子图和低效行为子图即⊙代表矩阵的hadamard乘积，xn为学习行为图节点的表征矩阵和学习行为图的邻接矩阵an；

32、随后，通过池化来获取两个子图的表征，即关键行为表征和低效行为表征并使用队列结构构建存储库，记为mb，来记录多个学习者不同的低效行为子图的表征；

33、再次，为了挖掘影响学习成效的行为要素，将学习行为视作因果推断中的变量，对低效行为进行干预，即固定关键行为变量而改变低效行为变量，干预过程公式为：

34、

35、其中，为通过干预操作生成得到的图，为从存储库中获取的低效行为；

36、最后，对于每个关键行为，从存储库中随机获取多个不同的低效行为分别与之组合，从而生成若干个干预图，干预图集合记为m为干预图的数量。

37、进一步的，步骤(3-1)得到具体实现方式如下；

38、首先，使用图注意力网络gat来完成行为图编码，从学习行为图中获取行为图节点的表征矩阵xn和行为图的邻接矩阵an；

39、其次，根据邻居节点与自身的相关程度，采用图卷积方法开展行为图节点的信息聚合，得到整个图的所有节点表征hn，记hn＝gconv(an,xn⊙mn)，其中，⊙表示点乘，gconv表示图卷积操作，mn是通过自注意力机制得到的注意力权重矩阵，即其中，权重wq和wk用于注意力机制中的线性转换，dk表示的嵌入维度；

40、最后，再通过一个线性层来完成节点更新，获取最终的节点表征。

41、进一步的，步骤4中实现关键行为预测的具体实现方式如下；

42、对于关键行为，关键学习行为与反应正误表现间存在因果关联，采用表示关键行为，其中qn+1是待作答的试题，σ是sigmoid激活函数，mlpk是多层感知机，是学习者认知状态，计算公式如下：

43、

44、其中，mhsa代表多头自注意力网络，表示知识特征，表示时序特征和表示关键行为特征，通过步骤3获得；

45、将与真实的作答结果计算交叉损失熵，损失函数记为其中rn+1是在待作答试题qn+1上的真实反应结果，rn+1∈{0，1}，0表示作答错误，1表示作答正确，n表示学习者的总作答数量。

46、进一步的，步骤4中实现低效行为预测的具体实现方式如下；

47、对于低效行为，低效学习行为与作答表现不具有因果关联，因此，将通过线性层，即得到预测结果将其与固定值0.5计算交叉损失熵，固定值0.5是二分类的中间值意味着低效行为难以影响作答结果；损失函数记作mlpl是多层感知机。

48、进一步的，步骤4中实现干预图预测的具体实现方式如下；

49、最后，干预图是对低效行为进行干预操作和关键行为组合生成的，因此，对于每个干预图，将其通过线性层，即qn+1是待作答的试题，mlpi是多层感知机，得到预测结果与集合中的干预图对应，进而将其与对应的真实的作答结果计算交叉损失熵，即

50、

51、进一步的，最终的损失函数则通过加权求和得到，即其中λ1和λ2是超参数权重，用来调节后两个损失函数的影响。

52、进一步的，知识特征表示学习者作答的试题的知识信息，采用试题编号或者试题相关联的知识点，采用embedding进行嵌入；

53、时序特征根据学习过程时序数据中的时间戳信息，计算学生每次作答与上次作答之间的时间间隔，采用embedding进行嵌入。

54、与现有技术相比，本发明的有益效果是：现有动态认知诊断忽视了长周期学习过程中多元化行为对学习者认知的影响，导致无法精准评估学习者的综合认知水平，进而影响了模型的可解释性。而本发明方法考虑多元化的学习行为与学习成效间存在复杂的因果关联，且不同行为要素对学习者认知状态的影响存在差异，以此来挖掘学习过程中的关键行为要素，有助于提高诊断结果的精准性和可解释性。