技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种语音处理方法、系统、装置及存储介质与流程 > 正文

一种语音处理方法、系统、装置及存储介质与流程

国知局
2024-08-05 12:00:04

本技术涉及语音处理领域，特别涉及一种语音处理方法、系统、装置及存储介质。

背景技术：

1、随着语音技术日益成熟，其中的语音处理算法更是发挥着举足轻重的作用。语音处理算法得以不断优化，通过语音增强或降噪处理能够精准地提取其中的有效语音信号，进而消除背景噪音和干扰，从而提升语音识别的准确性和清晰度。这一技术的应用，不仅提高了语音交互的效率和体验，还为智能家居、医疗、教育等领域带来了更加智能和便捷的服务。

2、目前的语音处理算法的处理方式为：由技术人员设置语音处理算法中的处理参数，在语音处理效果较差是，也是由技术人员分析具体原因，通过技术人员不断调整语音处理算法中的处理参数，以寻找处理效果更好的处理参数取值。

3、但是此种语音处理方法依赖于人工操作，处理效率较低，且这种方式往往依赖于个人的经验和直觉，因此具有很强的主观性，不同的技术人员在相同的语音和噪声样本下会设置出不同的参数，导致结果的不稳定性。

技术实现思路

1、本技术的目的是提供一种语音处理方法、系统、装置及存储介质，不再依赖于人工操作，大大提高了处理效率，同时，由于算法是基于评估指标进行优化，而不是依赖于个人经验和直觉，因此具有更强的客观性和稳定性，可以保证在相同的语音和噪声样本下得到一致的处理结果，提高语音处理的效率和稳定性。

2、第一方面，本技术提供了一种语音处理方法，包括：

3、根据初始处理参数对原始语音进行优化处理，得到第一优化语音；

4、根据所述第一优化语音的评估指标和所述初始处理参数利用预设优化算法确定下一处理参数；

5、利用所述下一处理参数对所述第一优化语音进行优化处理，得到第二优化语音；

6、在所述第二优化语音满足迭代结束条件时，输出所述第二优化语音和/或所述下一处理参数和/或所述第二优化语音的评估指标；

7、在所述第二优化语音未满足所述迭代结束条件时，将所述第二优化语音作为所述第一优化语音、所述下一处理参数作为所述初始处理参数，进入根据所述第一优化语音的评估指标和所述初始处理参数利用预设优化算法确定下一处理参数的步骤。

8、在一种实施例中，根据初始处理参数对原始语音进行优化处理，得到第一优化语音之前，还包括：

9、获取用户输入的对所述原始语音进行优化处理的优化算法类型；

10、根据所述优化算法类型确定与所述优化算法类型对应的参数类型；

11、根据所述参数类型设定初始处理参数。

12、在一种实施例中，根据初始处理参数对原始语音进行优化处理，得到第一优化语音之前，还包括：

13、设定处理参数群，根据所述处理参数群随机生成所述初始处理参数；

14、根据所述第一优化语音的评估指标和所述初始处理参数利用预设优化算法确定下一处理参数，包括：

15、计算处理参数群中的每组处理参数的评估指标；

16、根据每组所述处理参数的评估指标和所述第一优化语音的评估指标更新每组所述处理参数的个体最优处理参数和全局最优处理参数；

17、根据所述个体最优处理参数和所述全局最优处理参数确定所述下一处理参数。

18、在一种实施例中，根据所述个体最优处理参数和所述全局最优处理参数确定所述下一处理参数，包括：

19、根据所述个体最优处理参数、所述全局最优处理参数和惯性因子确定所述处理参数群中每个所述处理参数的移动速度和移动方向，以使各个所述处理参数根据所述移动速度和所述移动方向移动，得到更新后的处理参数群；

20、根据所述更新后的处理参数群确定所述下一处理参数。

21、在一种实施例中，利用所述下一处理参数对所述第一优化语音进行优化处理，得到第二优化语音之后，还包括：

22、对所述第二优化语音进行评估，得到第二优化语音的评估指标；

23、判断所述第二优化语音的评估指标是否达到预设阈值；

24、若达到所述预设阈值，则判定所述第二优化语音满足所述迭代结束条件；

25、若未达到所述预设阈值，则判定所述第二优化语音未满足所述迭代结束条件。

26、在一种实施例中，利用所述下一处理参数对所述第一优化语音进行优化处理，得到第二优化语音之后，还包括：

27、判断迭代次数是否达到预设次数或者迭代时间是否达到预设时间；

28、若所述迭代次数达到所述预设次数或者所述迭代时间达到所述预设时间，判定所述第二优化语音满足所述迭代结束条件；

29、若所述迭代次数未达到所述预设次数且所述迭代时间未达到所述预设时间，则判定所述第二优化语音未满足所述迭代结束条件。

30、在一种实施例中，所述评估指标至少包括语音质量感知评估分数和/或语音相似度参数和/或语音增强指标；

31、根据所述第一优化语音的评估指标和所述初始处理参数利用预设优化算法确定下一处理参数之前，还包括：

32、对所述原始语音和所述第一优化语音的电平进行调整以达到标准电平；

33、对电平调整后的原始语音和所述第一优化语音进行时间对齐；

34、在对齐后，对所述原始语音和所述第一优化语音分别进行听觉变换计算；

35、比较所述原始语音和所述第一优化语音听觉变换计算后的计算结果，分别确定所述原始语音和所述第一优化语音的退化参数，所述退化参数用于表征语音在处理过程中的失真程度；

36、将所述原始语音的退化参数和所述第一优化语音的退化参数映射到平均意见得分中，得到所述语音质量感知评估分数；

37、和/或，分别提取所述原始语音和所述第一优化语音中的特征；

38、根据所述原始语音的特征和所述第一优化语音的特征计算对数似然比；

39、根据所述对数似然比确定所述原始语音和所述第一优化语音的语音相似度参数；

40、和/或，分别计算所述原始语音和所述第一优化语音的信号功率；

41、根据所述原始语音的信号功率和所述第二优化语音的信号功率计算信噪比，所述语音增强指标至少包括所述信噪比。

42、第二方面，本技术还提供了一种语音处理系统，包括：

43、第一优化单元，用于根据初始处理参数对原始语音进行优化处理，得到第一优化语音；

44、参数确定单元，用于根据所述第一优化语音的评估指标和所述初始处理参数利用预设优化算法确定下一处理参数；

45、第二优化单元，用于利用所述下一处理参数对所述第一优化语音进行优化处理，得到第二优化语音；

46、第一执行单元，用于在所述第二优化语音满足迭代结束条件时，输出所述第二优化语音和/或所述下一处理参数和/或所述第二优化语音的评估指标；

47、第二执行单元，用于在所述第二优化语音未满足所述迭代结束条件时，将所述第二优化语音作为所述第一优化语音、所述下一处理参数作为所述初始处理参数，进入根据所述第一优化语音的评估指标和所述初始处理参数利用预设优化算法确定下一处理参数的步骤。

48、第三方面，本技术还提供了一种语音处理装置，包括：

49、存储器，用于存储计算机程序；

50、处理器，用于在执行计算机程序时，实现上述所述的语音处理方法的步骤。

51、第四方面，本技术还提供了一种非易失性存储介质，所述非易失性存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述所述的语音处理方法的步骤。

52、本技术提供了一种语音处理方法、系统、装置及存储介质，涉及语音处理领域，用于解决人工调整语音处理参数效率慢及准确性低的问题。该方案的处语音处理方法为自动化的优化算法，该算法可以根据初始处理参数对原始语音进行优化处理，并根据评估指标和预设优化算法确定下一处理参数，最终输出优化后的语音和处理参数。本技术通过预设优化算法自动调整处理参数，不再依赖于人工操作，大大提高了处理效率，同时，由于算法是基于评估指标进行优化，而不是依赖于个人经验和直觉，因此具有更强的客观性和稳定性，可以保证在相同的语音和噪声样本下得到一致的处理结果，提高语音处理的效率和稳定性。