技术新讯 > 乐器声学设备的制造及制作,分析技术 > 词语添加方法及装置、设备、存储介质、程序产品与流程  >  正文

词语添加方法及装置、设备、存储介质、程序产品与流程

  • 国知局
  • 2024-06-21 11:47:57

本技术实施例涉及自然语言处理,涉及但不限于一种词语添加方法及装置、设备、存储介质、程序产品。

背景技术:

1、语音识别是对输入的语音数据进行识别,得到语音对应的文本内容的过程。在语音识别及相关技术领域中,热词通常是指通过语音识别得到的语音文本内容中存在特定语义或是能够被指定系统接收并触发相应操作的词语。通过构建包含多个热词的词库,可以确定不同热词与互动操作之间的对应关系。具体而言,指定系统获取并处理外部语音数据,识别其中是否存在指定热词,然后根据指定热词与预设互动操作的对应关系,实现对家电、车辆或其他可交互对象的控制,提高了用户操作的便捷性。

2、在相关技术中,构建热词库时通常忽略了用户发音对热词识别的影响,例如,不同的地区方言中,相似的发音可能对应不同的文本内容。因此,在语音识别中将导致部分词语被错误地识别为热词库中的热词,并引发系统的错误响应,热词的识别准确率和用户体验都可能无法满足要求。

技术实现思路

1、有鉴于此,本技术实施例提供的词语添加方法及装置、设备、存储介质、程序产品,能够根据目标词语与发音相似词语和预设热词库中已有热词之间的相似度,以及对目标词语进行语音识别的结果,确定目标词语的综合识别可靠性,并判断是否将目标词语添加到预设热词库中,提高了对添加后的预设词库中的热词进行语音识别的准确性。本技术实施例提供的词语添加方法及装置、设备、存储介质、程序产品是这样实现的:

2、本技术实施例提供的词语添加方法,包括:

3、确定目标词语在不同的语言环境中的多个发音相似词语,所述不同的语言环境包括普通话环境以及目标地区方言环境;

4、根据所述不同的语言环境下,所述目标词语对应的语音数据与待比对词语对应的语音数据间的发音相似度,确定所述目标词语与所述待比对词语间的目标词语相似度,所述待比对词语包括所述多个发音相似词语和预设热词库包含的多个热词;

5、在所述目标词语相似度满足预设相似度条件的情况下,对所述目标词语对应的语音数据在不同的噪声环境进行语音识别处理,获取所述目标词语的语音识别结果;

6、根据所述目标词语相似度以及所述语音识别结果,确定所述目标词语的综合识别可靠性;

7、在所述综合识别可靠性符合预设的可靠性条件的情况下,将所述目标词语添加到所述预设热词库中。

8、在一些实施例中,所述根据所述不同的语言环境下,所述目标词语对应的语音数据与待比对词语对应的语音数据间的发音相似度,确定所述目标词语与所述待比对词语间的目标词语相似度,包括:

9、根据预设的语音识别算法,获取所述不同的语言环境下所述目标词语对应的语音数据的频谱特征与所述待比对词语对应的语音数据的频谱特征间的所述发音相似度;

10、根据所述待比对词语在预先存储的历史文本数据集中的出现频率,获取所述待比对词语对应的使用频繁程度,所述历史文本数据集包括历史获取的多个语音数据对应的文本数据;

11、根据所述发音相似度和所述使用频繁程度,确定所述目标词语与所述待比对词语间的目标词语相似度。

12、在一些实施例中,所述根据所述不同的语言环境下,所述目标词语对应的语音数据与待比对词语间对应的语音数据的发音相似度,确定所述目标词语与所述待比对词语间的目标词语相似度,包括:

13、根据所述不同的语言环境下,所述目标词语对应的语音数据与所述多个发音相似词语对应的语音数据间的发音相似度,确定所述目标词语的误识别程度,所述误识别程度用于表征因为发音相似度的大小而容易引起误识别的程度;

14、在所述误识别程度符合预设误识别条件的情况下,根据所述目标词语对应的语音数据与所述多个热词对应的语音数据间的发音相似度,确定所述目标词语与所述待比对词语间的目标词语相似度。

15、在一些实施例中,所述根据所述不同的语言环境下,所述目标词语对应的语音数据与所述多个发音相似词语对应的语音数据间的发音相似度,确定所述目标词语的误识别程度,包括:

16、根据所述多个发音相似词语在预先存储的历史文本数据集中的出现频率,获取所述多个发音相似词语对应的使用频繁程度,所述历史文本数据集包括历史获取的多个语音数据对应的文本数据;

17、在所述多个发音相似词语的数量小于预设第一数量的情况下,根据不同发音相似词语的使用频繁程度,确定所述多个发音相似词语中的至少部分发音相似词语为热门相似词语;

18、在所述热门相似词语的数量小于预设第二数量要求的情况下,根据所述不同的语言环境下,所述目标词语对应的语音数据与所述多个发音相似词语对应的语音数据间的发音相似度,获取发音相似度大于预设阈值的语言环境的误识别环境数目;

19、根据所述误识别环境数目、不同的语言环境中所述目标词语对应的语音数据与所述多个发音相似词语对应的语音数据间的发音相似度以及不同发音相似词语的使用频繁程度,确定所述多个发音相似词语对应的综合误识别情况;

20、根据所述综合误识别情况、所述多个发音相似词语的数量以及所述热门相似词语的数量,确定所述目标词语的所述误识别程度。

21、在一些实施例中,所述确定目标词语在不同的语言环境中的多个发音相似词语,包括:

22、在所述不同的语言环境下,对所述目标词语对应的语音数据的频谱特征与预设词库中的词语对应的语音数据的频谱特征进行特征相似度比对,确定特征相似度高于预设相似度阈值的词语为发声相似词语。

23、在一些实施例中,所述对所述目标词语对应的语音数据在不同的噪声环境进行语音识别处理,获取所述目标词语的语音识别结果,包括:

24、在不同的噪声环境中对所述目标词语对应的语音数据进行语音识别处理,获取所述目标词语对应的语音数据的识别文本数据;

25、将不同的噪声环境中获取的所述识别文本数据与所述目标词语进行匹配,获取包括匹配成功次数和匹配成功比例的语音识别结果。

26、本技术实施例提供的词语添加装置,包括:

27、相似词语获取模块,用于确定目标词语在不同的语言环境中的多个发音相似词语,所述不同的语言环境包括普通话环境以及目标地区方言环境;

28、相似度评估模块,用于根据所述不同的语言环境下,所述目标词语对应的语音数据与待比对词语对应的语音数据间的发音相似度,确定所述目标词语与所述待比对词语间的目标词语相似度,所述待比对词语包括所述多个发音相似词语和预设热词库包含的多个热词;

29、可靠性评估模块,用于在所述目标词语相似度满足预设相似度条件的情况下,对所述目标词语对应的语音数据在不同的噪声环境进行语音识别处理,获取所述目标词语的语音识别结果;根据所述目标词语相似度以及所述语音识别结果,确定所述目标词语的综合识别可靠性;

30、添加处理模块,用于在所述综合识别可靠性符合预设的可靠性条件的情况下,将所述目标词语添加到所述预设热词库中。

31、本技术实施例提供的计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本技术实施例所述的方法。

32、本技术实施例提供的计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本技术实施例提供的所述的方法。

33、本技术实施例提供的计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本技术实施例提供的所述的方法。

34、本技术实施例所提供的词语添加方法、装置、计算机设备和计算机可读存储介质,通过在不同的语言环境中,确定目标词语的多个发音相似词语,不同的语言环境包括有普通话环境和目标地区方言环境。对于不同的方言环境,比较目标词语与包括发音相似词语和预设热词库中热词的待比对词语的语音数据之间的发音相似度,从而确定目标词语相似度,该目标词语相似度越高,后续对目标词语进行语音识别时的就越容易被错误识别为待比对词语,同时也就不适合被添加到预设热词库中。如果目标词语的相似度满足预设条件,本技术提供的方法还会对目标词语的语音数据进行不同的噪声环境下的语音识别处理,获取目标词语的语音识别结果,结合目标词语相似度和语音识别结果,确定目标词语的综合识别可靠性,只有当综合识别可靠性符合预设的可靠性条件时,将目标词语添加到预设热词库中。

35、这样,在将目标词语添加到预设热词库之前,确定其与发音相似词语和预设热词库中已有热词间的目标词语相似度,并结合对目标词语进行语音识别的识别结果,对目标词语的综合识别可靠性进行判断,降低了目标词语添加到预设热词库后并错误识别的概率,提高了对添加后的预设词库中的热词进行语音识别的准确性。

本文地址:https://www.jishuxx.com/zhuanli/20240618/23622.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。