技术新讯 > 乐器声学设备的制造及制作,分析技术 > 关键词识别方法、装置、电子设备及存储介质与流程  >  正文

关键词识别方法、装置、电子设备及存储介质与流程

  • 国知局
  • 2024-06-21 11:33:01

本发明涉及人工智能,具体涉及一种关键词识别方法、装置、电子设备及存储介质。

背景技术:

1、近年来,随着深度学习技术的快速发展,深度神经网也越来越用来进行关键词语音识别。深度神经网络可以被用于对语音信号端到端建模,深度网络的学习容量大,可以在大数据量上进行有监督。常用的模型有,深度卷积神经网络,循环神经网络如lstm,gru等,基于注意力机制的神经网络等。深度神经网络用于关键词语音识别大致可以分为两个部分,一个部分为特征提取,一个部分为时空特征整合识别。例如,深度卷积神经网络用于语音识别时,通常将语音转换为mfcc特征,然后只是单纯的将mfcc特征视为图片进行识别,导致识别精度比较低。

技术实现思路

1、本技术提供了一种关键词识别方法、装置、电子设备及存储介质,提高对语音关键词的识别精度,以及提高对语音关键词识别的鲁棒性。

2、第一方面,本技术实施例提供一种关键词识别方法,包括:

3、获取待识别语音在各个时间窗口下的频谱特征;

4、将所述各个时间窗口下的频谱特征分别输入到特征提取网络,得到所述待识别语音在不同频率下的频域特征;其中,每个频率下的频域特征是按照时间窗口从前往后的顺序对所述待识别语音在每个频率下的频域特征进行累积得到的;

5、将所述不同频率下的频域特征输入到抉择网络,得到所述待识别语音的关键词;

6、其中,所述特征提取网络的网络参数以及所述抉择网络的网络参数是基于动力学预先设定的,所述特征提取网络和所述抉择网络之间的网络参数是通过训练得到的。

7、应说明的是,本技术的频域特征是指,待识别语音在频域下的能量。特征提取网络包含有多层子特征提取网络,每层子特征提取网络用于提取不同频率下的频域特征;抉择网络包括多层子抉择网络,每层子抉网络用于累积频域特征,并作出最终的决策。具体地,每层子抉择网络包括多个神经元,多个神经元之间相互抑制和自兴奋,最终竞争获取的神经元作出决策。可以看出,在本技术实施例中,在对待识别语音进行关键词识别时,并非单纯的将各个时间窗口下的频谱特征组成特征图,而是按照时间的顺序去处理每个时间窗口下的频谱特征,这样就可以按照时间的顺序去累积频谱特征,从而考虑到不同语音序列在时序上的联系,从而提高了对语音关键词的识别精度。此外,抉择网络中的神经元之间相互抑制和竞争,这样当待识别语音为噪声时,所有的神经元都无法作出抉择,这个时候网络也就处于不响应的状态,从而使关键词识别的鲁棒性比较高。并且,由于一些网络参数是通过动力学设置好的,无需训练,故本技术的网络模型可以使用数量较少的语音样本进行训练,以及可以很方便的实现在线学习。

8、在一些可能的实施方式中,所述特征提取网络包括n层子特征提取网络,所述n层子特征提取网络用于提取不同频率下的特征,每层子特征提取网络包括多个神经元;所述将所述频谱特征输入到特征提取网络,得到所述待识别语音不同频率下的频域特征,包括:

9、根据第l-1层子特征提取网络中各个神经元在时间窗口t下的突触电流,以及第l层子特征提取网络中各个神经元在时间窗口t-1下的突触电流,得到所述第l层子特征提取网络中各个神经元在时间窗口t下的突触电流,所述时间窗口t为各个时间窗口中的任意一一个,所述时间窗口t-1为所述时间窗口t的前一个时间窗口;当l=1时,第0层子特征提取网络中各个神经元在时间窗口t下的突触电流为所述待识别语音在所述时间窗口t下的频谱特征;

10、赋值l=l+1,并重复上述步骤,直至l=n时,得到第n层子特征提取网络中各个神经元在所述时间窗口t下的突触电流;

11、根据所述第n层子特征提取网络中各个神经元在所述时间窗口t下的突触电流,确定所述待识别语音在所述时间窗口t,以及不同频率下的频域特征;

12、根据所述待识别语音在所述时间窗口t下,以及不同频率下的频域特征,确定所述待识别语音在各个时间窗口,以及不同频率下的频域特征。

13、可以看出,在本技术实施例中,每个子特征提取网络用于提取不同频率下的频域特征,并且将提取出的频域特征输出给下一个子特征提取网络,这样针对任意一个时间窗口来说,最后一个子特征提取网络就可以将该时间窗口下的语音序列在各个频率下的特征提取出来。并且,不同的时间窗口下的语音序列是按照时间的先后顺序输入给特征提取网络的,这样最后一层子特征提取网络就可以按照时间的顺序,将待识别语音在各个频率下的频域特征累积起来,从而在语音关键词识别时,可以考虑语音在时序上的联系,进而提高关键词识别精度。

14、在一些可能的实施方式中,所述根据第l-1层子特征提取网络中各个神经元在时间窗口 t下的突触电流,以及第l层子特征提取网络中各个神经元在时间窗口t-1下的突触电流,得到所述第l层子特征提取网络中各个神经元在时间窗口t下的突触电流,包括:

15、获取所述第l层子特征提取网络中的第i个神经元与所述第l-1层子特征提取网络中的第j个神经元之间的第一权重矩阵;

16、获取所述第l层子特征提取网络中的第i个神经元与所述第l层子特征提取网络中的第 k个神经元之间的第二权重矩阵,其中,i≠k;

17、获取与所述第l层子特征提取网络对应的预设时间常数;

18、根据所述第一权重矩阵、所述第二权重矩阵、所述预设时间常数、所述第l-1层子特征提取网络中各个神经元在时间窗口t下的突触电流,以及所述第l层子特征提取网络中各个神经元在时间窗口t-1下的突触电流,确定所述第l层子特征提取网络中的第i个神经元在所述时间窗口t下的突触电流;

19、根据所述第l层子特征提取网络中的第i个神经元在所述时间窗口t下的突触电流,确定所述第l层子特征提取网络中各个神经元在时间窗口t下的突触电流;

20、其中,所述第一权重矩阵、所述第二权重矩阵以及所述预设时间常数均是基于动力学预先设定的。

21、在一些可能的实施方式中,所述第l层子特征提取网络中的第i个神经元在时间窗口t 下的突触电流满足以下公式:

22、

23、其中,

24、其中,为所述第l层子特征提取网络中的第i个神经元在时间窗口t下的突触电流,τl为与所述第l层子特征提取网络对应的预设时间常数,且l越大,τl越大,以使不同深度的子特征提取网络提取不同频率下的频域特征;

25、为所述第一权重矩阵,nl-1为所述第l-1层子特征提取网络中神经元的数量;

26、为所述第二权重矩阵,nl为所述第l层子特征提取网络中神经元的数量;

27、为第1层子特征提取网络中的第i个神经元与第0层子特征提取网络中的第j个神经元之间的第一权重矩阵,nin为所述第0层子特征提取网络中的神经元的数量;

28、为所述时间窗口t下的频谱特征;

29、r为激活函数,则为对所述第l-1层子特征提取网络中的第j个神经元在所述时间窗口t下的突触电流进行激活,为对所述第l层子特征提取网络中的第k个神经元在所述时间窗口t-1下的突触电流进行激活;

30、i和k的取值均为1到nl的整数,且i≠k,j的取值为1到nl-1的整数。

31、可以看出,通过设置神经元之间的权重矩阵,可以使频域特征按照时间的先后顺序进行累积,进而可以考虑到时序关系,提高语音识别精度。

32、在一些可能的实施方式中,所述是从高斯分布进行采样得到;且矩阵mi,k的最大特征根与1的差值大于第一阈值;

33、其中,

34、其中,e为单位矩阵,δt为预设迭代时间步长。

35、所述是从均匀分布中采样得到,且所述使所述第l层子特征提取网络中的第i个神经元与所述第l-1层子特征提取网络中的第j个神经元之间的连接保持兴奋与抑制平衡。

36、可以看出,在本技术实施例中,设置矩阵mi,k的最大特征根与1的差值大于阈值,这样就可以保证网络模型处于混沌的边缘,可以快速去响应待识别语音,从而无需去唤醒网络模型,更有利于将网络模型部署在硬件设备上。

37、在一些可能的实施方式中,所述抉择网络包括m层子抉择网络;每层子抉择网络包括多个神经元;所述将所述不同频率下的频域特征输入到抉择网络,得到所述待识别语音的关键词,包括:

38、根据第u-1层子抉择网络中的各个神经元在时间窗口t下的突触电流,以及第u层子抉择网络中的各个神经元在时间窗口t-1下的突触电流,得到所述第u层子抉择网络中的各个神经元在所述时间窗口t下的突触电流,所述时间窗口t为各个时间窗口中的任意一个,所述时间窗口t-1为所述时间窗口t的前一个时间窗口;当u=1时,第0层子抉择网络中的各个神经元在所述时间窗口t下的突触电流为预设动力学电流;

39、赋值u=u+1,并重复上述步骤,直至u=m时,得到第u层子抉择网络中各个神经元的在所述时间窗口t下的突触电流;

40、根据所述第u层子抉择网络中的各个神经元在各个时间窗口下的突触电流,得到所述待识别语音的关键词。

41、可以看出,在本技术实施例中,在每层子抉择网络中设置多个神经元,且保持多个神经元之间互馈连接,这样在子抉择网络中的神经元在竞争时,就会接收到前一个子抉择网络中的神经元传递过来的前馈兴奋电流、前馈抑制电流,以及本层子抉择网络中的神经元所传递的侧抑制电流,以及自己的自兴奋电流,从而实现基于兴奋和抑制的机制进行竞争和抉择,从而当输入的语音是噪声时,所有神经元都无法作出抉择,只有输入了真正的语音时,才会作出正确的抉择,进而提高了网络模型的鲁棒性。

42、在一些可能的实施方式中,所述根据第u-1层子抉择网络中的各个神经元在时间窗口t 下的突触电流,以及第u层子抉择网络中的各个神经元在时间窗口t-1下的突触电流,得到所述第u层子抉择网络中的各个神经元在所述时间窗口t下的突触电流,包括:

43、获取所述第u层子抉择网络中的第i个神经元的自兴奋权重矩阵;其中,所述第u层子抉择网络中的第i个神经元为所述第u层子抉择网络中任意一个神经元;

44、获取所述第u层子抉择网络中的第i个神经元与第u-1层子抉择网络中的第i个神经元之间的前馈兴奋权重矩阵,其中,所述第u层子抉择网络中的第i个神经元与所述第u-1层子抉择网络中的第i个神经元对应同一个分类类别;

45、获取所述第u层子抉择网络中的第i个神经元与所述第u层子抉择网络中的第k个神经元之间的侧抑制权重矩阵,其中,i≠k;

46、获取所述第u层子抉择网络中的第i个神经元与所述第u层子抉择网络中的第j个神经元之间的前馈抑制权重矩阵,其中,i≠j;

47、根据所述第u-1层子抉择网络中的各个神经元在时间窗口t下的突触电流、所述第u层子抉择网络中的各个神经元在时间窗口t-1下的突触电流、所述自兴奋权重矩阵、所述前馈兴奋权重矩阵、所述侧抑制权重矩阵,以及所述前馈抑制权重矩阵,确定所述第u层子抉择网络中的第i神经元在所述时间窗口t下的突触电流;

48、根据所述第u层子抉择网络中的第i神经元在所述时间窗口t下的突触电流,得到所述第u层子抉择网络中的各个神经元在所述时间窗口t下的突触电流。

49、在一些可能的实施方式中,所述第u层子抉择网络中的第i个神经元在时间窗口t下的突触电流满足以下公式:

50、

51、其中,为所述第u层子抉择网络中的第i个神经元在时间窗口t下的突触电流;

52、为所述u层子抉择网络中的第i个神经元的动力学电流,且

53、

54、其中,为与所述第u层子抉择网络对应的预设时间常数,γ,β,θ,α均为预设超参;

55、为所述自兴奋权重矩阵;为所述前馈兴奋权重矩阵;

56、为所述侧抑制权重矩阵;为所述前馈抑制权重矩阵;

57、mu为所述第u层子抉择网络中神经元的数量,k的取值为1到mu的整数,且i≠k;

58、为所述第u-1层子抉择网络中的第i神经元在所述时间窗口t下的动力学电流;

59、mu-1为所述第u-1层子抉择网络中神经元的数量,为所述第u-1层子抉择网络中的第j个神经元在时间窗口t下的动力学电流,则j的取值为1到mu-1的整数,且j≠i;

60、为第u层子抉择网络所接收的背景偏置电流;

61、ii为特征提取网络前馈输入到决策网络的电流;

62、

63、在一些可能的实施方式中,所述根据所述第u层子抉择网络中的各个神经元在各个时间窗口下的突触电流,得到所述待识别语音的关键词,包括:

64、获取第所述m层子抉择网络中的各个神经元在每个时间窗口下的突触电流;

65、若所述第m层子抉择网络中的第一神经元在任意一个时间窗口下的突触电流大于第二阈值,则将所述第一神经元对应的类别,作为所述待识别语音的关键词,其中,所述第一神经元为所述第m层子抉择网络中的任意一个神经元。

66、可以看出,在本实施方式中,神经元在竞争时,会接收到前一个子抉择网络中的神经元传递过来的前馈兴奋电流、前馈抑制电流,以及本层子抉择网络中的神经元所传递的侧抑制电流,以及自己的自兴奋电流,从而实现基于兴奋和抑制的机制进行竞争和抉择,从而当输入的语音是噪声时,所有神经元都无法作出抉择,只有输入了真正的语音时,才会作出正确的抉择,进而提高了网络模型的鲁棒性。并且实时检测每个神经元的输出电流,当某个神经元能正确作出抉择时,会立马作出抉择,提高了语音关键词的识别效率。

67、在一些可能的实施方式中,获取待识别语音各个时间窗口下的频谱特征之前,所述方法还包括:

68、根据关键词识别任务,构造语音样本;

69、根据所述语音样本,对初始的特征提取网络以及初始的抉择网络进行训练,得到损失值;

70、根据所述损失值,采用force learning训练策略,调整所述特征提取网络与所述抉择网络之间的网络参数,得到所述特征提取网络和所述抉择网络。

71、可以看出,在本实施方式中,由于基于动力学模型预先构造好了很多无需训练的网络参数,因此只需要少量的训练样本即可完成对模型的训练,实现了基于小样本进行模型训练。

72、在一些可能的实施方式中,当所述关键词识别任务为针对同一说话人的不同说话内容时,所述语音样本为同一个说话人的不同说话内容;

73、当所述关键词识别任务为针对不同说话人的不同说话内容时,所述语音样本为不同说话人的不同说话内容。

74、可以看出,在本技术实施方式中,针对不同的关键词识别任务,构造出数量和类型不同的训练样本,使用这样的样本,可以进行针对性的训练。

75、第二方面,本技术实施例提供一种关键词识别装置,包括:获取单元和处理单元;

76、所述获取单元,用于获取待识别语音在各个时间窗口下的频谱特征;

77、所述处理单元,用于将所述各个时间窗口下的频谱特征分别输入到特征提取网络,得到所述待识别语音在不同频率下的频域特征;其中,每个频率下的频域特征是按照时间窗口从前往后的顺序对所述待识别语音在每个频率下的频域特征进行累积得到的;

78、将所述不同频率下的频域特征输入到抉择网络,得到所述待识别语音的关键词;

79、其中,所述特征提取网络的网络参数以及所述抉择网络的网络参数是基于动力学预先设定的,所述特征提取网络和所述抉择网络之间的网络参数是通过训练得到的。

80、在一些可能的实施方式中,所述特征提取网络包括n层子特征提取网络,所述n层子特征提取网络用于提取不同频率下的特征,每层子特征提取网络包括多个神经元;在将所述频谱特征输入到特征提取网络,得到所述待识别语音不同频率下的频域特征方面,所述处理单元,具体用于:

81、根据第l-1层子特征提取网络中各个神经元在时间窗口t下的突触电流,以及第l层子特征提取网络中各个神经元在时间窗口t-1下的突触电流,得到所述第l层子特征提取网络中各个神经元在时间窗口t下的突触电流,所述时间窗口t为各个时间窗口中的任意一一个,所述时间窗口t-1为所述时间窗口t的前一个时间窗口;当l=1时,第0层子特征提取网络中各个神经元在时间窗口t下的突触电流为所述待识别语音在所述时间窗口t下的频谱特征;

82、赋值l=l+1,并重复上述步骤,直至l=n时,得到第n层子特征提取网络中各个神经元在所述时间窗口t下的突触电流;

83、根据所述第n层子特征提取网络中各个神经元在所述时间窗口t下的突触电流,确定所述待识别语音在所述时间窗口t,以及不同频率下的频域特征;

84、根据所述待识别语音在所述时间窗口t下,以及不同频率下的频域特征,确定所述待识别语音在各个时间窗口,以及不同频率下的频域特征。

85、在一些可能的实施方式中,在根据第l-1层子特征提取网络中各个神经元在时间窗口t 下的突触电流,以及第l层子特征提取网络中各个神经元在时间窗口t-1下的突触电流,得到所述第l层子特征提取网络中各个神经元在时间窗口t下的突触电流方面,所述处理单元,具体用于:

86、获取所述第l层子特征提取网络中的第i个神经元与所述第l-1层子特征提取网络中的第j个神经元之间的第一权重矩阵;

87、获取所述第l层子特征提取网络中的第i个神经元与所述第l层子特征提取网络中的第 k个神经元之间的第二权重矩阵,其中,i≠k;

88、获取与所述第l层子特征提取网络对应的预设时间常数;

89、根据所述第一权重矩阵、所述第二权重矩阵、所述预设时间常数、所述第l-1层子特征提取网络中各个神经元在时间窗口t下的突触电流,以及所述第l层子特征提取网络中各个神经元在时间窗口t-1下的突触电流,确定所述第l层子特征提取网络中的第i个神经元在所述时间窗口t下的突触电流;

90、根据所述第l层子特征提取网络中的第i个神经元在所述时间窗口t下的突触电流,确定所述第l层子特征提取网络中各个神经元在时间窗口t下的突触电流;

91、其中,所述第一权重矩阵、所述第二权重矩阵以及所述预设时间常数均是基于动力学预先设定的。

92、在一些可能的实施方式中,所述第l层子特征提取网络中的第i个神经元在时间窗口t 下的突触电流满足以下公式:

93、

94、其中,

95、其中,为所述第l层子特征提取网络中的第i个神经元在时间窗口t下的突触电流,τl为与所述第l层子特征提取网络对应的预设时间常数,且l越大,τl越大,以使不同深度的子特征提取网络提取不同频率下的频域特征;

96、为所述第一权重矩阵,nl-1为所述第l-1层子特征提取网络中神经元的数量;

97、为所述第二权重矩阵,nl为所述第l层子特征提取网络中神经元的数量;

98、为第1层子特征提取网络中的第i个神经元与第0层子特征提取网络中的第j个神经元之间的第一权重矩阵,nin为所述第0层子特征提取网络中的神经元的数量;

99、为所述时间窗口t下的频谱特征;

100、r为激活函数,则为对所述第l-1层子特征提取网络中的第j个神经元在所述时间窗口t下的突触电流进行激活,为对所述第l层子特征提取网络中的第k个神经元在所述时间窗口t-1下的突触电流进行激活;

101、i和k的取值均为1到nl的整数,且i≠k,j的取值为1到nl-1的整数。

102、在一些可能的实施方式中,所述是从高斯分布进行采样得到;且矩阵mi,k的最大特征根与1的差值大于第一阈值;

103、其中,

104、其中,e为单位矩阵,δt为预设迭代时间步长。

105、所述是从均匀分布中采样得到,且所述使所述第l层子特征提取网络中的第i个神经元与所述第l-1层子特征提取网络中的第j个神经元之间的连接保持兴奋与抑制平衡。

106、在一些可能的实施方式中,所述抉择网络包括m层子抉择网络;每层子抉择网络包括多个神经元;在将所述不同频率下的频域特征输入到抉择网络,得到所述待识别语音的关键词方面,所述处理单元,具体用于:

107、根据第u-1层子抉择网络中的各个神经元在时间窗口t下的突触电流,以及第u层子抉择网络中的各个神经元在时间窗口t-1下的突触电流,得到所述第u层子抉择网络中的各个神经元在所述时间窗口t下的突触电流,所述时间窗口t为各个时间窗口中的任意一个,所述时间窗口t-1为所述时间窗口t的前一个时间窗口;当u=1时,第0层子抉择网络中的各个神经元在所述时间窗口t下的突触电流为预设动力学电流;

108、赋值u=u+1,并重复上述步骤,直至u=m时,得到第u层子抉择网络中各个神经元的在所述时间窗口t下的突触电流;

109、根据所述第u层子抉择网络中的各个神经元在各个时间窗口下的突触电流,得到所述待识别语音的关键词。

110、在一些可能的实施方式中,在根据第u-1层子抉择网络中的各个神经元在时间窗口t下的突触电流,以及第u层子抉择网络中的各个神经元在时间窗口t-1下的突触电流,得到所述第u层子抉择网络中的各个神经元在所述时间窗口t下的突触电流方面,所述处理单元,具体用于:

111、获取所述第u层子抉择网络中的第i个神经元的自兴奋权重矩阵;其中,所述第u层子抉择网络中的第i个神经元为所述第u层子抉择网络中任意一个神经元;

112、获取所述第u层子抉择网络中的第i个神经元与第u-1层子抉择网络中的第i个神经元之间的前馈兴奋权重矩阵,其中,所述第u层子抉择网络中的第i个神经元与所述第u-1层子抉择网络中的第i个神经元对应同一个分类类别;

113、获取所述第u层子抉择网络中的第i个神经元与所述第u层子抉择网络中的第k个神经元之间的侧抑制权重矩阵,其中,i≠k;

114、获取所述第u层子抉择网络中的第i个神经元与所述第u层子抉择网络中的第j个神经元之间的前馈抑制权重矩阵,其中,i≠j;

115、根据所述第u-1层子抉择网络中的各个神经元在时间窗口t下的突触电流、所述第u层子抉择网络中的各个神经元在时间窗口t-1下的突触电流、所述自兴奋权重矩阵、所述前馈兴奋权重矩阵、所述侧抑制权重矩阵,以及所述前馈抑制权重矩阵,确定所述第u层子抉择网络中的第i神经元在所述时间窗口t下的突触电流;

116、根据所述第u层子抉择网络中的第i神经元在所述时间窗口t下的突触电流,得到所述第u层子抉择网络中的各个神经元在所述时间窗口t下的突触电流。

117、在一些可能的实施方式中,所述第u层子抉择网络中的第i个神经元在时间窗口t下的突触电流满足以下公式:

118、

119、其中,为所述第u层子抉择网络中的第i个神经元在时间窗口t下的突触电流;

120、为所述u层子抉择网络中的第i个神经元的动力学电流,且

121、

122、其中,为与所述第u层子抉择网络对应的预设时间常数,γ,β,θ,α均为预设超参;

123、为所述自兴奋权重矩阵;为所述前馈兴奋权重矩阵;

124、为所述侧抑制权重矩阵;为所述前馈抑制权重矩阵;

125、mu为所述第u层子抉择网络中神经元的数量,k的取值为1到mu的整数,且i≠k;

126、为所述第u-1层子抉择网络中的第i神经元在所述时间窗口t下的动力学电流;

127、mu-1为所述第u-1层子抉择网络中神经元的数量,为所述第u-1层子抉择网络中的第j个神经元在时间窗口t下的动力学电流,则j的取值为1到mu-1的整数,且j≠i;

128、为第u层子抉择网络所接收的背景偏置电流;

129、ii为特征提取网络前馈输入到决策网络的电流;

130、

131、在一些可能的实施方式中,在根据所述第u层子抉择网络中的各个神经元在各个时间窗口下的突触电流,得到所述待识别语音的关键词方面,所述处理单元,具体用于:

132、获取第所述m层子抉择网络中的各个神经元在每个时间窗口下的突触电流;

133、若所述第m层子抉择网络中的第一神经元在任意一个时间窗口下的突触电流大于第二阈值,则将所述第一神经元对应的类别,作为所述待识别语音的关键词,其中,所述第一神经元为所述第m层子抉择网络中的任意一个神经元。

134、在一些可能的实施方式中,所述装置还包括训练单元;

135、在所述获取单元获取待识别语音各个时间窗口下的频谱特征之前,所述训练单元,用于:

136、根据关键词识别任务,构造语音样本;

137、根据所述语音样本,对初始的特征提取网络以及初始的抉择网络进行训练,得到损失值;

138、根据所述损失值,采用force learning训练策略,调整所述特征提取网络与所述抉择网络之间的网络参数,得到所述特征提取网络和所述抉择网络。

139、在一些可能的实施方式中,当所述关键词识别任务为针对同一说话人的不同说话内容时,所述语音样本为同一个说话人的不同说话内容;

140、当所述关键词识别任务为针对不同说话人的不同说话内容时,所述语音样本为不同说话人的不同说话内容。

141、第三方面,本技术实施例提供了一种电子设备,包括:存储器,用于存储程序;处理器,用于执行存储器存储的程序;当存储器存储的程序被执行时,处理器用于实现上述第一方面中的方法。

142、第四方面,本技术实施例提供了提供一种计算机可读介质,该计算机可读介质存储用于设备执行的程序代码,该程序代码包括用于实现上述第一方面中的方法。

143、第五方面,本技术实施例提供了提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机实现上述第一方面中的方法。

144、第六方面,本技术实施例提供了提供一种芯片,该芯片包括处理器与数据接口,处理器通过数据接口读取存储器上存储的指令,实现上述第一方面中的方法。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22180.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。