一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

改进用于基于相似性的工业组件模型请求系统的无监督嵌入方法与流程

2022-04-24 17:33:32 来源:中国专利 TAG:

技术特征:
1.一种用于比较用于基于相似性的工业组件模型请求系统的无监督嵌入方法的计算机实现的方法,包括:a)提供与工业组件模型相关的文本语料库(200)和测试词列表,b)通过改变所述测试词列表中每个测试词的出现中的一些出现来修改所述文本语料库(220),对于每个测试词,经修改的文本语料库因此包含每个测试词的第一版本的出现、以及每个测试词的第二版本的出现,c)在经修改的文本语料库上运行无监督嵌入方法(260),并获得经修改的文本语料库的词的向量表示;d)针对所述测试词中的至少一些测试词,通过比较这些测试词的所述第一版本的向量表示和这些测试词的所述第二版本的向量表示,确定与所述无监督嵌入方法相关联的评分值(270);e)在利用另一种无监督嵌入方法的情况下,使用步骤a)的所述文本语料库和所述测试词列表运行步骤b)到d),并返回相应的评分值。2.根据权利要求1所述的计算机实现的方法,其中,通过改变每个测试词的出现中的至少一半出现来修改所述文本语料库(220)的步骤b)包括:将所述测试词的出现中的基本上一半的出现修改为所述文本语料库中不存在的选定别名,并保留其它出现不变。3.根据权利要求1或2所述的计算机实现的方法,其中,通过改变每个测试词的出现中的至少一半出现来修改所述文本语料库(220)的步骤b)包括:将所述测试词的出现中的基本上一半的出现修改为所述文本语料库中不存在的选定别名,并将其他出现修改为所述文本语料库中不存在的另一个选定别名。4.根据前述权利要求中的一个权利要求所述的计算机实现的方法;其中,所述测试词列表是预先确定的。5.根据权利要求1至3所述的计算机实现的方法,其中,通过确定所述文本语料库内的所述词的对数频率分布,并通过选择在所述对数频率分布中均匀间隔的词,来获得所述测试词列表。6.根据前述权利要求中的一个权利要求所述的计算机实现的方法,其中,步骤d)包括:基于测试词的所述第一版本的嵌入与所述测试词的所述第二版本的嵌入之间的相似性距离,来确定所述测试词的评分值。7.根据前述权利要求中的一个权利要求所述的计算机实现的方法;其中,步骤d)包括:通过确定测试词的所述第一版本的嵌入与所有其它词的嵌入之间的相似性距离、所述测试词的所述第二版本的嵌入与所有其它词的嵌入之间的相似性距离来确定所述测试词的评分值,并返回以下各项中的一项:-与所述测试词的所述第二版本的嵌入相比,嵌入更接近所述测试词的所述第一版本的嵌入的词的数量,-与所述测试词的所述第一版本的嵌入相比,嵌入更接近所述测试词的所述第二版本的嵌入的词的数量,以及-以下数量之和:与所述测试词的所述第二版本的嵌入相比,嵌入更接近所述测试词的所述第一版本的嵌入的词的数量;与所述测试词的所述第一版本的嵌入相比,嵌入更接近所述测试词的所述第二版本的嵌入的词的数量。
8.根据前述权利要求中的一个权利要求所述的计算机实现的方法;其中,步骤d)包括:通过对所述测试词中的至少一些测试词的评分值进行平均,来确定评分值分数。9.根据前述权利要求中的一个权利要求所述的计算机实现的方法;其中,步骤d)包括:通过返回所述测试词和对应测试词的分数值中的至少一些的评分值,来确定评分值分数。10.一种计算机程序,其包括用于执行前述权利要求中的任何权利要求所述的方法的指令。11.一种数据存储介质,其上记录有根据权利要求10所述的计算机程序。12.一种计算机系统,其包括耦合到存储器(4)的处理器,所述存储器(4)上记录有根据权利要求10所述的计算机程序。

技术总结
用于比较用于基于相似性的工业组件模型请求系统的无监督嵌入方法的计算机实现的方法,包括:a)提供与工业组件模型相关的文本语料库(200)和测试词列表,b)通过改变测试词列表中每个测试词的出现中的一些出现来修改文本语料库(220),对于每个测试词,经修改的文本语料库因此包含每个测试词的第一版本的出现、以及每个测试词的第二版本的出现,c)在经修改的文本语料库上运行无监督嵌入方法(260),并获得经修改的文本语料库的词的向量表示;d)针对测试词中的至少一些测试词,通过比较这些测试词的第一版本的向量表示和这些测试词的第二版本的向量表示,确定与无监督嵌入方法相关联的评分值(270);e)在利用另一种无监督嵌入方法的情况下,使用步骤a)的文本语料库和测试词列表运行步骤b)到d),并返回相应的评分值。并返回相应的评分值。并返回相应的评分值。


技术研发人员:X
受保护的技术使用者:达索系统公司
技术研发日:2021.10.19
技术公布日:2022/4/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献