一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种面向可持续发展教育的学习辅助方法及系统

2022-06-05 08:48:04 来源:中国专利 TAG:


1.本发明涉及教育信息化领域,尤其涉及一种面向可持续发展教育的学习辅助方法及系统。


背景技术:

2.在全球范围内,可持续性和数字化已经成为了未来社会发展的重要趋势。2021年的诺贝尔物理学奖授予了研究全球变暖的气象学家,这反映了全球对气候变化问题的重视,也体现出人类社会可持续性发展的重要性。可持续的未来始于个人及其行为的改变,因此可持续发展教育尤为重要,联合国提出可持续发展教育全球行动计划,希望使每个人都能获得可持续发展所需的知识,技能,价值观和态度,而最终的目标是通过可持续发展教育实现17项可持续发展目标,建立一个公平可持续的世界。其中可持续发展教育常以项目式学习的方式应用在教学场景中。
3.而对于可持续发展教育的研究有以下问题,首先,现有研究大多针对学生的学习行为,而很少关心学生对于知识本身的认知过程,尤其是在项目式学习中所需要重视跨领域知识之间的关联关系,而不是单独的知识点本身;其次,现有研究鲜少有对可持续发展内容本身相关的知识进行管理与整合,使得原本内容广泛含糊的可持续发展知识更加碎片化与异构化,难以被有效的应用于教学环境中,以达到教育学生使其获得可持续发展意识和能力的目的。
4.专利文献cn105844978a公开了一种小学语文词语学习辅助语音机器人装置及其工作方法,包括语音识别模块,用于处理学生语音输入即输入的指定词语,将输入的语音转换为文本信息,反馈识别结果给学生;智能检索模块,根据语音识别结果自动结合本地数据和网络搜索结果匹配返回数据;语音合成模块,用于将文本转换为语音朗读。该方法的知识检索采用直接的数据库检索方式,无法很好的对真正讨论过程中的语义进行理解,达到真正智能反馈讨论所需相应知识的目的,无法提供深入的教学指导。同时其教学工作方法仅为学生提供了孤立的词语信息,并未体现知识之间的关联关系。
5.专利文献cn109492115a公开了一种汽修知识实体网络构建方法、装置及设备,方法包括:获取结构化汽修数据;对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体;遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间的关系实体;根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。通过知识实体网络的构建,实现为汽修人员提供丰富准确的汽修知识的目的。
6.但该方法并未针对实体知识的反馈方法做出设计,没有考虑到如何设计知识反馈方法能够使得用户更好的接受与消化新知识。


技术实现要素:

7.为了解决上述问题,本发明提供了一种面向可持续发展教育的学习辅助方法,通过该方法将可持续领域相关知识结构化,并以此为数据基础通过识别学习交流对话中的语义内容,为用户反馈相互关联的知识网络,拓展用户解决与分析问题的思路,从而提高用户的综合学习能力,达到更好的学习实践效果。
8.一种面向可持续发展教育的学习辅助方法,包括:
9.s1获取学习交流过程中的对话文本,识别对话文本中的关键词;
10.s2根据s1中识别获得的关键词,提取实体以及对应的标签,所述标签包括function、technology以及sustainable;
11.s3基于s2中实体及对应的标签,提取出属于可持续发展教育领域的知识实体;
12.s4基于相似度计算,将s3中的知识实体链接到预先构建关于可持续发展领域的图数据库中,获得对应的匹配实体;
13.s5基于s4中获得的匹配实体,进行图数据库检索,输出全局知识实体网络;
14.s6基于s5中全局知识实体网络,通过深入检索,获得细节知识实体网络。
15.具体的,所述全局知识实体网络和细节知识实体网络包括实体本身的知识内容,以及在可持续发展教育领域图数据库中相关联实体对应的知识实体。
16.优选的,所述s4中图数据库是基于sdg目标针对可持续发展领域进行构建,从而使得检索结果更加符合可持续发展教育方向。
17.优选的,所述s4中匹配实体是基于树遍历的知识实体链接方法获得,通过树遍历的方式可以降低实体连接过程的运算压力,同时保证不影响链接结果与关键词的关联度。
18.具体的,所述树遍历的知识实体链接方法,具体为:
19.s4.1基于知识实体对应的标签,图数据库中进行检索同一标签下的知识实体,生成候选实体集;
20.s4.2通过词嵌入方法,将候选实体集与知识实体向量化;
21.s4.3将知识实体的标签与候选实体集标签的父节点,通过余弦距离计算相似度,获得第一匹配分数;
22.s4.4选出第一匹配分数最高的父节点,再次计算知识实体的标签与该父节点的所有子节点的相似度,获得第二匹配分数;
23.s4.5根据第一匹配分数与第二匹配分数的综合评分,获得最佳匹配实体。
24.具体的,所述s5中图数据库检索,基于s4获得匹配实体与对应的标签,与图数据库进行匹配:
25.当匹配实体的图数据库实体标签为function时,将图数据库中实体标签对应的知识实体内容反馈生成全局知识实体网络;
26.当匹配实体的图数据库实体标签为technology时,通过dijkstra查找由technology标签实体到其相关的sustainable标签实体的最短路径,将该路径上实体节点对应的知识实体内容反馈生成全局知识实体网络;
27.当匹配实体的图数据库实体标签为sustainable时,通过tf-idf算法对匹配结果进行筛选,获得多个实体及其相关的知识实体内容,反馈生成全局知识实体网络。
28.优选的,所述s6中深入检索是基于全局知识实体网络中用户想深入学习的知识实
体,通过直接输入知识实体与对应标签的一跳实体检索或/和用于检索知识实体标签不明确的多跳路径查询,获取细节知识实体网络。
29.具体的,所述的一跳实体检索是基于cypher查询语言进行的数据库检索方法。
30.具体的,所述多跳路径检索是基于转移假设的评分函数,通过计算元素之间的距离对三元组的合理性进行度量,评分函数得分越高,元组的事实合理度越高。针对一对多或\和多对多的复杂关系,将实体向量投影到向量空间中,计算其投影向量后通过transe方式计算得分函数,从而判断检索的知识实体是否与现有标签是否有关,通过最小化算法将待检索的知识实体与最相关的标签进行拟合,直至拟合结果大于阈值时输出检索结果。
31.本发明还提供了一种基于上述学习辅助方法的系统,该系统操作简单,通过各个模块协助完成快速检索并输出用户需要的重要知识点,以及相关联知识网络的反馈。
32.一种学习辅助方法的系统,包括:
33.实体识别模块,用于识别对话文本中的关键词,并获取实体与对应的标签;
34.图数据库模块,基于图数据库,对获取的实体与对应标签进行匹配;
35.知识提醒模块,基于图数据库模块的匹配结果,进行检索并输出结果;
36.知识查询模块,用于人工输入实体内容进行检索,并输出结果。
37.优选的,所述实体识别模块包括由pytorch框架搭建的bilstm crf实体识别模型,用于提取对话文本中的向量特征,并计算向量特征与目标标签之间的相似度,最终输出相似度最高的标签,所述标签包括function、technology以及sustainable。
38.与现有技术相比,本发明的有益效果:
39.(1)结合知识图谱技术,将可持续发展领域相关的知识进行了结构化整理,使得学生能够更好的理解与实践可持续发展概念。
40.(2)通过语音实体识别方法人工检索的技术整合,使得系统能够根据项目式学习中学生的需求进行知识反馈,达到学习辅助的效果。
41.(3)通过树遍历实体链接方法以及知识反馈方法的设计,使得系统能够反馈不同领域相关联知识的知识网络,而非孤立的知识节点,真正的提高了学生的自主学习与综合能力。
附图说明
42.图1为本发明提供的面向可持续发展教育的学习辅助方法的流程示意图;
43.图2为本发明提供的树遍历的知识实体链接方法的流程示意图;
44.图3为本发明的全局知识实体网络的反馈流程示意图;
45.图4为本发明的细节知识实体网络的反馈流程示意图;
46.图5为实施学习辅助方法的系统的结构示意图。
具体实施方式
47.为了使检索内容更加符合可持续发展教育方向,通过实验数据收集与分析,对图数据库的实体语义类型与语义关系进行构建。
48.图数据库的实体语义类型包括技术(technology),功能(function)以及可持续(sustainable)三大类标签,其中可持续与技术部分的实体采用自顶向下的方法进行细分
类:关于可持续类部分,根据联合国sdg元数据数据库的分类标准将语义类型细分为goal与target,其语义关系设计为contain,语义基元以三元组的表示《goal,contain,target》;关于技术类部分,根据现有的计算机领域类知识图谱分类标准将语义类型细分为category,subcategory以及instance,语义基元以三元组的表示为《category,subclass of,subcategory》,《subcategory,instance of,instance》。
49.为了更好的将可持续与其技术实现方法结合在一起,设计语义关系have function of,have technology of两种关系,分别连接功能与target实体,功能与subclass实体,语义基元以三元组的表示为《target,have function of,function》,《function,have technology of,subcategory》。
50.基于上述方式构建的图数据库,通过爬取相关结构化与非机构化的数据并进行人工标注,对图数据库进行补充:其中数据包括wiki百科数据,实验收集对话样本,sdg元数据以及万方数据的可持续目标相关专利。
51.对于wiki百科数据进行层级式数据爬取,在wiki百科的category列表中利用正则表达式对数据进行标签挖掘获取词条,设置层级爬取深度为3。最后利用文本规则匹配和人工检查的方式进行数据二次处理,并将其整理为子类树存储在csv文件中。
52.如图1所示,一种面向可持续发展教育的学习辅助方法,包括:
53.s1获取学习交流过程中的对话文本,识别对话文本中的关键词;
54.s2根据s1中识别获得的关键词,提取实体以及对应的标签:
55.通过预先训练获得的实体识别模型完成,基于pytorch框架搭建,利用bilstm crf网络进行训练。
56.首先读取标注数据并将数据文本向量化,得到词向合集x=(x1,x2,x3...xn),其中xn表示每个one-hot向量,维度为文本字典大小。并在word embedding层把xn表示的one-hot向量转化为中文分词的词向量word embedding。
57.然后在lstm层输入word embedding序列w=(w1,w2…
wn),得到hidden layer的序列将序列输入下一层的线性层,从hidden layer的m维向量映射到k维的标签合集中提取特征p=(p1,p2,...,pn),即每一个维度作为每一个词对不同标签的打分。
58.将bi-lstm层输出的标签分数作为最后一层crf的输入,计算不同标签的transition matrix,同时为每一个得分矩阵添加一个start,end标签作为约束,最终矩阵表达式为t
(k 2)(k 2)
,该矩阵维度为(k 2)*(k 2)。
59.将输出获得的标签序列记为y=(y1,y2,...,yn),x为序列的词向量表示,则句子对应的标签序列打分为bi-lstm层输出的特征对应标签得分与crf输出的标签对分数的综合:
[0060][0061]
最后通过softmax算法得到归一化概率:
[0062]
[0063]
转换为对数似然函数,训练的过程求最大似然函数:
[0064]
log p(y
x
|x)=score(x,y
x
)-log∑exp(score(x,y))
[0065]
在模型预测的过程中,利用viterbi解码算法对动态规划问题求解:
[0066]y*
=arg max
y score(x,y)
[0067]
其中y表示句子x所对应的所有可能的标签序列,y为句子x所对应的标签序列。
[0068]
将数据分为30个epoch进行训练,最后实体识别模型的最终评估效果为准确率0.9804,召回率0.9813,与f1分数0.9798,总体能达到本发明要求达到的准确率,完成对输入的自然语言语句,进行识别并输出其中的标签。
[0069]
s3基于s2中实体及对应的标签,提取出属于可持续发展教育领域的知识实体;
[0070]
s4基于相似度计算,将s3中的知识实体链接到预先构建关于可持续发展领域的图数据库中,获得对应的匹配实体:如图2所示,树遍历的知识实体链接方法具体为,在图数据库进行检索同一标签的实体,将其作为候选集e,使用word2vec实现词嵌入,将候选集实体e与实体提及m由文本分别映射为向量,其中m为实体对应的标签。
[0071]
首先将m与本标签实体中的父节点f(f∈e)使用余弦距离进行相似度计算,得到m与f的匹配度分数sf:
[0072][0073]
遍历所有父节点f后对所得的匹配度分数进行排序,选出分数排序最高的节点f,再遍历f节点的所有子节点集合c(c∈e)计算得到匹配度分数sc:
[0074][0075]
最佳匹配实体的目标函数为:
[0076]ebest
=argmaxe(sf,sc)
[0077]
最后输出目标函数最高的匹配实体。
[0078]
s5基于s4中获得的匹配实体,进行图数据库检索,输出全局知识实体网络,如图3所示,全局知识实体网络的获取过程:
[0079]
当匹配实体的图数据库实体标签为function时,通过have function of路径和have technology of路径查询其一跳实体r1,并将其作为相关实体节点作为全局知识实体网络进行反馈;
[0080]
当匹配实体的图数据库实体标签为technology时,通过一种基于dijkstra最短路径算法的实体筛选方法,基本思想首先对图数据库中的节点与关系进行投影以创建匿名图,再通过dijkstra查找由technology标签实体到其相关的sustainable标签实体的最短路径,并将该路径上的实体节点作为全局知识实体网络进行反馈;
[0081]
当匹配实体的图数据库实体标签为sustainable时,由于其链接实体量过多,为了降低信息冗余度,通过一种基于tf-idf的实体筛选方法:先通过关系have function of路径查询与标签链接的一跳实体r1=(e1,e2…en
),设定阈值t,当n<t时,直接返回r1;当n>t时,遍历集合r1中的实体,计算其td-idf值,其中|di|为csv文件中所有词的数量,|d|为csv文件集合的总数,|d
r1
|为csv文件集中出现实体r1的文档数量:
[0082][0083][0084]
tf-idf
r1
=tf
r1
*idf
r1
[0085]
再对r1集合中的实体计算的tf-idf
r1
值进行排序,返回e,r1的前t个实体及其对应查询的have technology of路径查询的实体r2作为全局知识实体网络。
[0086]
s6基于全局知识实体网络中用户想深入学习的知识实体,进行深入检索,获得细节知识实体网络,其中深入检索包括直接输入知识实体与对应标签的一跳实体检索,以及用于检索知识实体标签不明确的多跳路径查询,如图4所示,细节知识实体网络的获取过程:
[0087]
一跳实体检索应用于用户已知目标知识实体与对应的标签的查询,是最简单的检索方式,例如subclass of等,用户输入查询实体与关系,系统将查询模板转化为cypher查询语言进行数据库检索,并将检索到的子图进行可视化返回。
[0088]
多跳实体检索方法应用于对于technology实体与sustainable实体这样没有明确关系的多跳实体间的推理关系的查询,在此将本方法建模为知识推理模型,使用基于转移假设的评分函数,通过计算元素之间的距离对三元组的合理性进行度量,评分函数得分越高,元组的事实合理度越高。
[0089]
基于事实元组(h,r,t)有h r≈t,针对一对多与多对多的复杂关系,将实体向量投影到向量空间中,计算其投影向量:
[0090][0091][0092]
基于transe方法设计得分函数,以判断查询的technology实体与sustainable实体是否有关,通过最小化f(h,r,t)得分函数对图谱中technology实体与sustainable实体关系进行拟合,通过训练得到函数拟合阈值tq,超过本阈值的元素及关系可被认为是合理的事实关系:
[0093]
f(h,r,t)=||h

r-t

||
l1/l2
[0094]
当查询的实体h与关系r的得分f(h,r,t)>tq时,证明其推理关系成立,多跳实体间存在联系,并将本查询实体相关的多跳路径作为细节知识实体网络进行反馈;当实体h与关系r的得分f(h,r,t)<tq时,说明推理关系不成立;为了更好全面的验证其推理关系是否存在,增加一个检验环节,即通过dijkstra最短路径算法的实体筛选方法,查询实体h的路径尾结点s,并将算法查找的实体s与学生查询的实体h进行实体链接,若查询到链接实体相匹配,则证明实体直接存在关联关系,将该实体相关多跳路径作为细节知识实体网络进行反馈,反之则证明实体间不存在关联关系,反馈显示未查询到相关关系信息。
[0095]
如图5所示,一种学习辅助方法的系统,包括:
[0096]
实体识别模块,用于识别对话文本中的关键词,并获取实体与对应的标签;
[0097]
图数据库模块,基于图数据库,对获取的实体与对应标签进行匹配;
[0098]
知识提醒模块,基于图数据库模块的匹配结果,进行检索并输出结果;
[0099]
知识查询模块,用于人工输入实体内容进行检索,并输出结果。
[0100]
具体使用过程:开始学习交流,通过实体识别模块识别出交流对话中的关键词,并获取实体与对应的标签;通过图数据库模块对获取的实体进行匹配,生成候选知识实体与对应标签;知识提醒模块基于候选知识实体与对应标签进行检索,生成全局知识实体网络;知识查询模块基于人工输入实体内容进行检索,生成细节知识实体网络。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献