一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种数据库表分类分级方法、装置、设备及存储介质与流程

2022-11-12 21:30:38 来源:中国专利 TAG:

技术特征:
1.一种数据库表分类分级方法,其特征在于,包括:获取待分类分级数据库表的表名和所有信息项的项名,并对所述表名和所述所有信息项的项名进行预处理,得到目标表名和多个目标项名;将所述目标表名和多个所述目标项名输入至添加注意力机制的循环神经网络分类模型,以便通过所述循环神经网络分类模型对所述待分类分级数据库表所属领域进行分类,得到目标分类标签;将多个所述目标项名输入至文本相似匹配模型,以便通过所述文本相似匹配模型对所述目标项名对应的信息项进行分类,得到多个信息项类别;从保密定级规则映射表中确定出与所述目标分类标签和所述多个信息项类别对应的保密等级。2.根据权利要求1所述的数据库表分类分级方法,其特征在于,所述对所述表名和所述所有信息项的项名进行预处理,得到目标表名和多个目标项名,包括:对所述表名和所述所有信息项的项名中存在相同名称的信息进行去重,得到去重后表名和去重后项名;删除所述去重后表名和所述去重后项名中包含的无语义的非中文字符,得到目标表名和多个目标项名。3.根据权利要求1所述的数据库表分类分级方法,其特征在于,还包括:采集不同领域的历史数据库表的表名和所有信息项的项名,得到历史数据库表表名和历史信息项项名,并对所述历史数据库表表名和所述信息项项名进行预处理,得到采样表名和采样信息项项名;利用所述采样表名和所述采样信息项项名对添加注意力机制的初始循环神经网络模型进行训练,得到所述循环神经网络分类模型;其中,所述初始循环神经网络模型采用双层双向gru结构。4.根据权利要求3所述的数据库表分类分级方法,其特征在于,还包括:分别对每个所述采样信息项项名进行分词处理,得到多个采样分词,并通过预设的词向量模型将所述多个采样分词转换为词向量,得到多个采样词向量;分别对每个所述采样信息项项名对应的所述多个采样词向量进行加权平均,得到对应的采样向量表征;利用所述采样向量表征并对照信息项分类字典构造与所述多个所述采样信息项项名对应的信息项的向量表征字典,并将所述向量表征字典输入至初始文本相似匹配模型进行训练,得到所述文本相似匹配模型。5.根据权利要求4所述的数据库表分类分级方法,其特征在于,所述对所述所有信息项进行分类,得到多个信息项类别,包括:对照所述信息项分类字典,分别判断每个所述目标项名是否与所述信息项分类字典中存在的信息项名称完全匹配;若所述目标项名与所述信息项分类字典中存在的信息项名称完全匹配,则输出与所述目标项名对应的信息项类别;若所述目标项名与所述信息项分类字典中存在的信息项名称不完全匹配,则分别计算所述目标项名与所述向量表征字典中各个所述采样向量表征之间的相似度,得到多个相似
度计算结果;获取多个所述相似度计算结果中的最大值,得到最大相似度值,并判断所述最大相似度值是否超过预设相似度阈值,若超过则输出与所述最大相似度值对应的信息项类别,若未超过则判定所述目标项名对应的信息项无对应的信息项类别。6.根据权利要求5所述的数据库表分类分级方法,其特征在于,所述分别计算所述目标项名与所述向量表征字典中各个所述采样向量表征之间的相似度,得到多个相似度计算结果,包括:分别对每个所述目标项名进行分词处理,得到对应的多个目标分词,并通过所述词向量模型将所述多个目标分词转换为词向量,得到多个目标词向量;分别对每个所述目标项名对应的所述多个目标词向量进行加权平均,得到对应的目标向量表征;将所述目标向量表征与所述向量表征字典中所有所述采样向量表征进行相似度计算,得到多个相似度计算结果。7.根据权利要求1至6任一项所述的数据库表分类分级方法,其特征在于,所述将所述目标表名和多个所述目标项名输入至添加注意力机制的循环神经网络分类模型,包括:根据预先构造的数据库表字典,将所述目标表名和多个所述目标项名中的每个字符均转化为对应的字典索引,得到编码后表名和多个编码后项名;将所述编码后表名和多个所述编码后项名输入至添加注意力机制的循环神经网络分类模型。8.一种数据库表分类分级装置,其特征在于,包括:数据获取模块,用于获取待分类分级数据库表的表名和所有信息项的项名;数据预处理模块,用于对所述表名和所述所有信息项的项名进行预处理,得到目标表名和多个目标项名;数据库表分类模块,用于将所述目标表名和多个所述目标项名输入至添加注意力机制的循环神经网络分类模型,以便通过所述循环神经网络分类模型对所述待分类分级数据库表所属领域进行分类,得到目标分类标签;信息项分类模块,用于将多个所述目标项名输入至文本相似匹配模型,以便通过所述文本相似匹配模型对所述目标项名对应的信息项进行分类,得到多个信息项类别;数据库表分级模块,用于从保密定级规则映射表中确定出与所述目标分类标签和所述多个信息项类别对应的保密等级。9.一种电子设备,其特征在于,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1至7任一项所述的数据库表分类分级方法。10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的数据库表分类分级方法。

技术总结
本申请公开了一种数据库表分类分级方法、装置、设备及存储介质,涉及计算机技术领域,包括:对待分类分级数据库表的表名和所有信息项的项名进行预处理得到目标表名和目标项名,并将其输入至添加注意力机制的循环神经网络分类模型得到目标分类标签;将目标项名输入至文本相似匹配模型,以便通过文本相似匹配模型对目标项名对应的信息项进行分类得到多个信息项类别;从保密定级规则映射表中确定出与目标分类标签和多个信息项类别对应的保密等级。本申请通过将深度学习和规则映射结合来进行库表分类分级,提高了输出的可解释性,同时能够灵活更新分级映射规则,通过文本相似度计算方法可快速高效识别信息项类别,无需额外标注数据和训练模型。据和训练模型。据和训练模型。


技术研发人员:邱星煜 吴杰 齐伟钢
受保护的技术使用者:成都卫士通信息产业股份有限公司
技术研发日:2022.08.18
技术公布日:2022/11/11
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献