一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本差异度的计算方法及系统与流程

2022-12-10 17:34:46 来源:中国专利 TAG:

技术特征:
1.一种文本差异度的计算方法,其特征在于,包括:获取第一文本的长度和第二文本的长度;在所述第一文本的长度和所述第二文本的长度满足第一预设条件的情况下,根据所述第一文本与所述第二文本之间的目标莱文斯坦距离、所述第一文本的长度以及所述第二文本的长度,计算所述第一文本与所述第二文本的差异度;其中,所述第一预设条件为所述第一文本的长度和所述第二文本的长度均不等于第一预设值,且所述第一文本的长度与所述第二文本的长度不相等或者所述第一文本的长度与所述第二文本的长度相等。2.根据权利要求1所述的文本差异度的计算方法,其特征在于,在所述第一文本的长度和所述第二文本的长度均不等于第一预设值,且所述第一文本的长度与所述第二文本的长度不相等情况下,所述根据第一文本的长度、第二文本的长度以及所述第一文本与所述第二文本之间的目标莱文斯坦距离,计算所述第一文本与所述第二文本的差异度,包括:分别将所述第一文本和所述第二文本拼接成一个字符串,得到所述第一文本对应的第一字符串和所述第二文本对应的第二字符串;将所述第一字符串与所述第二字符串之间的莱文斯坦距离作为所述目标莱文斯坦距离;根据所述第一文本的长度、所述第二文本的长度和所述目标莱文斯坦距离,计算所述差异度。3.根据权利要求1所述的文本差异度的计算方法,其特征在于,在所述第一文本的长度和所述第二文本的长度均不等于第一预设值,且所述第一文本的长度与所述第二文本的长度相等的情况下,所述根据第一文本的长度、第二文本的长度以及所述第一文本与所述第二文本之间的目标莱文斯坦距离,计算所述第一文本与所述第二文本的差异度,包括:遍历所述第一文本中的每个句子,计算所述第一文本中的任一句子与所述第二文本中第一目标位置的句子之间的莱文斯坦距离,并确定第三字符串和第四字符串的长度的最大值,所述第一目标位置为与所述第一文本中的任一句子所在所述第一文本中的位置相同的位置,所述第三字符串为所述第一文本中的任一句子对应的字符串,所述第四字符串为所述第二文本中第一目标位置的句子对应的字符串;将所述第一文本中的每个句子与所述第二文本中的每个句子之间的莱文斯坦距离之和作为所述目标莱文斯坦距离,并将所述第一文本中的每个句子对应的第三字符串的长度以及所述第二文本中的每个句子对应的第四字符串的长度的最大值之和作为第一文本的长度与第二文本的长度之和;根据所述目标莱文斯坦距离以及所述第一文本的长度与第二文本的长度之和,计算所述差异度。4.根据权利要求1所述的文本差异度的计算方法,其特征在于,在所述第一文本的长度和所述第二文本的长度均不等于第一预设值,且所述第一文本的长度与所述第二文本的长度相等的情况下,所述根据第一文本的长度、第二文本的长度以及所述第一文本与所述第二文本之间的目标莱文斯坦距离,计算所述第一文本与所述第二文本的差异度,还包括:遍历所述第一文本中的每个段落,计算所述第一文本中的任一段落与所述第二文本中第二目标位置的段落之间的莱文斯坦距离,并确定第五字符串和第六字符串的长度的最大
值,所述第二目标位置为与所述第一文本中的任一段落所在所述第一文本中的位置相同的位置,所述第五字符串为所述第一文本中的任一段落对应的字符串,所述第六字符串为所述第二文本中第二目标位置的段落对应的字符串;将所述第一文本中的每个段落与所述第二文本中的每个段落之间的莱文斯坦距离之和作为所述目标莱文斯坦距离,并将所述第一文本中的每个段落对应的第五字符串的长度以及所述第二文本中的每个段落对应的第六字符串的长度的最大值之和作为第一文本的长度与第二文本的长度之和;根据所述目标莱文斯坦距离以及所述第一文本的长度与第二文本的长度之和,计算所述差异度。5.根据权利要求1-4任一项所述的文本差异度的计算方法,其特征在于,所述方法,还包括:在所述第一文本的长度和所述第二文本的长度满足第二预设条件的情况下,确定所述第一文本与所述第二文本的差异度为第二预设值;其中,所述第一预设条件为所述第一文本的长度或者所述第二文本的长度等于第一预设值。6.一种文本差异度的计算系统,其特征在于,包括:数据获取模块以及第一计算模块;所述数据获取模块,用于获取第一文本的长度和第二文本的长度;所述第一计算模块,用于在所述第一文本的长度和所述第二文本的长度满足第一预设条件的情况下,根据所述第一文本与所述第二文本之间的目标莱文斯坦距离、所述第一文本的长度以及所述第二文本的长度,计算所述第一文本与所述第二文本的差异度;其中,所述第一预设条件为所述第一文本的长度和所述第二文本的长度均不等于第一预设值,且所述第一文本的长度与所述第二文本的长度不相等或者所述第一文本的长度与所述第二文本的长度相等。7.根据权利要求6所述的文本差异度的计算系统,其特征在于,所述系统,还包括:第二计算模块,用于在所述第一文本的长度和所述第二文本的长度满足第二预设条件的情况下,确定所述第一文本与所述第二文本的差异度为第二预设值;其中,所述第二预设条件为所述第一文本的长度或者所述第二文本的长度等于第一预设值。8.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述文本差异度的计算方法。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至5任一项所述文本差异度的计算方法。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述文本差异度的计算方法。

技术总结
本发明提供一种文本差异度的计算方法及系统,方法包括:获取第一文本的长度和第二文本的长度;在所述第一文本的长度和所述第二文本的长度满足第一预设条件的情况下,根据所述第一文本与所述第二文本之间的目标莱文斯坦距离、所述第一文本的长度以及所述第二文本的长度,计算所述第一文本与所述第二文本的差异度。本发明基于待比较的文本的长度和目标莱文斯坦距离计算待比较的文本之间的差异度,解决了在文本数据量非常大情况下,人工比较速度慢、操作繁琐的问题,提高了待比较的文本的差异度的计算效率,同时能够使得用户快速了解待比较的文本之间的差异程度。比较的文本之间的差异程度。比较的文本之间的差异程度。


技术研发人员:万飞
受保护的技术使用者:传神语联网网络科技股份有限公司
技术研发日:2022.10.13
技术公布日:2022/12/9
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献