技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种用于智能客服机器人的语音信号智能处理方法及系统 > 正文

一种用于智能客服机器人的语音信号智能处理方法及系统

国知局
2024-06-21 11:28:54

本发明涉及数据处理，具体涉及一种用于智能客服机器人的语音信号智能处理方法及系统。

背景技术：

1、语音信号处理是实现语音识别、语音合成以及语音交互等智能技术的基础，智能客服机器人通过语音交互能够更高效地与用户沟通，为企业提供更好的客户服务。为了保证智能客服机器人的工作效率，通常会使用滤波器对语音信号进行去噪滤波。

2、现有方法通常利用lms(least mean squares)最小均方差算法调整滤波器权重，对语音信号进行去噪，但由于语音信号会因周围环境的变化会含有不同程度的噪声，传统的lms最小均方差算法的步长通常进行人为设置，导致调整的滤波器权重过大或过小，使语音信号存在滤波过度或者滤波不足的情况，降低了滤波器对语音信号的滤波效率。

技术实现思路

1、本发明提供一种用于智能客服机器人的语音信号智能处理方法及系统，以解决现有的问题：传统的lms最小均方差算法的步长通常进行人为设置，导致调整的滤波器权重过大或过小，使语音信号存在滤波过度或者滤波不足的情况，降低了滤波器对语音信号的滤波效率。

2、本发明的一种用于智能客服机器人的语音信号智能处理方法及系统采用如下技术方案：

3、一方面，本发明实施例提供一种用于智能客服机器人的语音信号智能处理方法，包括以下步骤：

4、采集智能客服机器人的语音数据序列，所述语音数据序列中包含多帧语音数据，每帧语音数据对应一个语音幅值；

5、根据不同语音数据之间的语音幅值的变化差异，从语音数据序列中划分出客服未回复语音段；将除客服未回复语音段以外的每帧语音数据记为对照语音数据，根据对照语音数据与客服未回复语音段之间所含信息内容量的差异，得到每个对照语音数据的信息丢失率，所述信息丢失率用于描述对照语音数据中丢失的客服语音交流有效内容量；

6、根据客服未回复语音段与对照语音数据之间能量信息的分布情况以及信息丢失率，得到每个对照语音数据的最佳步长，根据最佳步长对每个对照语音数据进行滤波。

7、优选的，所述根据不同语音数据之间的语音幅值的变化差异，从语音数据序列中划分出客服未回复语音段，包括的具体方法为：

8、在语音数据序列中，将所有语音数据的语音幅值的最大值记为语音最大值；预设一个数量参数以及一个语音数据数量，将记为初筛标准语音值；将第一个语音幅值大于初筛标准语音值记为初筛语音数据；将初筛语音数据前个语音数据构成的数据段记为客服未回复语音段。

9、优选的，所述根据对照语音数据与客服未回复语音段之间所含信息内容量的差异，得到每个对照语音数据的信息丢失率，包括的具体方法为：

10、对客服未回复语音段进行快速傅里叶变换得到客服未回复语音段的频谱图；对每个对照语音数据进行快速傅里叶变换得到每个对照语音数据的频谱图；

11、对于任意一个对照语音数据，根据对照语音数据的频谱图与客服未回复语音段的频谱图之间每个频率的能量差异，得到对照语音数据与客服未回复语音段之间每个频谱频率的能量差异因子；

12、根据对照语音数据与客服未回复语音段之间每个频谱频率的能量差异因子，得到每个对照语音数据的初始信息丢失率；

13、对所有初始信息丢失率进行线性归一化，将归一化后的每个初始信息丢失率记为信息丢失率。

14、优选的，所述根据对照语音数据的频谱图与客服未回复语音段的频谱图之间每个频率的能量差异，得到对照语音数据与客服未回复语音段之间每个频谱频率的能量差异因子，包括的具体方法为：

15、；

16、式中，表示对照语音数据与客服未回复语音段之间频谱频率为的能量差异因子；表示对照语音数据的频谱图中频率为的功率；表示客服未回复语音段的频谱图中频率为的功率；表示取绝对值。

17、优选的，所述根据对照语音数据与客服未回复语音段之间每个频谱频率的能量差异因子，得到每个对照语音数据的初始信息丢失率，包括的具体方法为：

18、；

19、式中，表示对照语音数据的初始信息丢失率；表示对照语音数据的频谱图中所有频率的最大值；表示对照语音数据的频谱图中频率数值为的频率；表示预设的低通滤波器的截止频率；表示对照语音数据与客服未回复语音段之间频谱频率为的能量差异因子；表示预设的超参数；表示对照语音数据与客服未回复语音段之间频谱频率为的能量差异因子；表示以自然常数为底的指数函数。

20、优选的，所述根据客服未回复语音段与对照语音数据之间能量信息的分布情况以及信息丢失率，得到每个对照语音数据的最佳步长，根据最佳步长对每个对照语音数据进行滤波，包括的具体方法为：

21、获取客服未回复语音段的噪声程度；

22、对于任意一个对照语音数据，根据客服未回复语音段的噪声程度以及信息丢失率得到对照语音数据在若干迭代次数下的迭代步长因子；

23、对于任意一个迭代次数，根据对照语音数据在迭代次数下的迭代步长因子得到对照语音数据在迭代次数下的参考步长；

24、将对照语音数据在迭代次数下的参考步长作为lms最小均方差算法的步长，根据步长利用lms最小均方差算法获取对照语音数据的一个稳态误差，获取对照语音数据的所有稳态误差；预设一个步长选取差异值阈值，对于任意两个相邻的稳态误差，将第二个稳态误差与第一个稳态误差的差值的绝对值记为第二个稳态误差的步长选取差异值，获取所有稳态误差的步长选取差异值；在所有稳态误差的步长选取差异值中，将步长选取差异值第一次大于的稳态误差对应的参考步长作为对照语音数据的最佳步长；

25、将每个对照语音数据的最佳步长作为lms最小均方差算法的步长，根据lms最小均方差算法的步长获取每个对照语音数据对应滤波器的权重，根据每个对照语音数据对应滤波器的权重进行滤波得到每个滤波后的对照语音数据，将每个滤波后的对照语音数据存储在数据库中。

26、优选的，所述获取客服未回复语音段的噪声程度，包括的具体方法为：

27、获取客服未回复语音段的信息熵；

28、；

29、式中，表示客服未回复语音段的噪声程度；表示客服未回复语音段的信息熵；表示以自然常数为底的指数函数。

30、优选的，根据客服未回复语音段的噪声程度以及信息丢失率得到对照语音数据在若干迭代次数下的迭代步长因子，包括的具体方法为：

31、；

32、式中，表示对照语音数据在任意一个迭代次数下的迭代步长因子；表示客服未回复语音段的噪声程度；表示预设的超参数；表示对照语音数据的信息丢失率；表示迭代步长因子对应的迭代次数；表示以2为底的对数函数。

33、优选的，根据对照语音数据在迭代次数下的迭代步长因子得到对照语音数据在迭代次数下的参考步长，包括的具体方法为：

34、；

35、式中，表示对照语音数据在迭代次数下的参考步长；表示预设的超参数；表示对照语音数据在迭代次数下的迭代步长因子；表示向上取整。

36、另一方面，本发明实施例提供一种用于智能客服机器人的语音信号智能处理系统，该系统包括存储器和处理器，所述处理器执行所述存储器存储的计算机程序，以实现上述一种用于智能客服机器人的语音信号智能处理方法的步骤。

37、本发明的技术方案的有益效果是：根据不同语音数据之间的语音幅值的变化差异，从语音数据序列中划分出客服未回复语音段；根据对照语音数据与客服未回复语音段之间所含信息内容量的差异，得到对照语音数据的信息丢失率；根据客服未回复语音段与对照语音数据之间能量信息的分布情况以及信息丢失率，得到对照语音数据的最佳步长；根据最佳步长对对照语音数据进行滤波；其中信息丢失率反映了对照语音数据中丢失的客服语音交流有效内容量；本发明使lms最小均方差算法的步长获取更加智能，提高了滤波器权重的合理性，提高了滤波器对语音信号的去噪效果，提高了智能客服机器人处理语音信号的效率。