技术新讯 > 乐器声学设备的制造及制作,分析技术 > 基于语义的语音断句方法、系统、终端及存储介质与流程 > 正文

基于语义的语音断句方法、系统、终端及存储介质与流程

国知局
2024-06-21 11:46:36

本发明涉及语音识别，尤其涉及一种基于语义的语音断句方法、系统、终端及存储介质。

背景技术：

1、断句对于正确解析用户语音的语义非常重要，比如，“抱歉，没有找到可以播放的歌曲”的用户语音，可以明显的看到在不同的汉字之间存在一段间隔时间段，不同的断句方式，可能导致断句后的语义存在差异，因此，针对用户语音断句准确性的问题越来越受人们所重视。

2、现有的语音断句过程中，一般基于声音信号的声音强度、静默周期或固定时间间隔的方式进行语音断句，导致断句后语音的语义不连贯，降低了用户的使用体验。

技术实现思路

1、本发明实施例的目的在于提供一种基于语义的语音断句方法、系统、终端及存储介质，旨在解决现有的语音断句过程中，断句后语义不连贯的问题。

2、本发明实施例是这样实现的，一种基于语义的语音断句方法，所述方法包括：

3、获取用户语音，并对所述用户语音进行语音端点检测；

4、根据所述语音端点检测结果对所述用户语音进行断句，得到断句语音，并依序对各断句语音进行语义完整度检测；

5、若任一所述断句语音的语义完整度检测未合格，则对所述断句语音进行语音拼接，得到拼接语音，并对所述拼接语音进行语义完整度检测，所述语音拼接用于将未合格的所述断句语音与相邻的断句语音进行拼接；

6、若所述拼接语音的语义完整度检测未合格，则对所述拼接语音进行语音拼接，并返回执行对所述拼接语音进行语义完整度检测的步骤；

7、若所述拼接语音的语义完整度检测合格，则根据所述拼接语音对所述用户语音进行语音断句，并根据语音断句结果进行语音交互。

8、优选的，依序对各断句语音进行语义完整度检测，包括：

9、依序将各断句语音的语音文本与高频文本库进行匹配；

10、若任一所述断句语音的语音文本与所述高频文本库中的预设文本相匹配，则判定所述断句语音的语义完整度检测合格；

11、若任一所述断句语音的语音文本与所述高频文本库中的预设文本均未匹配，则对所述断句语音的语音文本进行正则匹配；

12、若所述断句语音的语音文本的正则匹配失败，则判定所述断句语音的语义完整度检测未合格。

13、优选的，对所述拼接语音进行语音拼接之后，还包括：

14、若所述拼接语音的语音拼接次数大于第一次数阈值，则将所述拼接语音中首位的断句语音进行删除。

15、优选的，对所述拼接语音进行语音拼接之后，还包括：

16、若所述拼接语音的语音拼接次数大于第二次数阈值，则删除所述拼接语音对应的未合格的所述断句语音，并返回执行依序对各断句语音进行语义完整度检测的步骤。

17、优选的，若所述拼接语音的语义完整度检测未合格之后，还包括：

18、对所述拼接语音进行语音重复检测；

19、若所述拼接语音的语音重复检测未合格，则根据语音重复检测结果确定重复语音；

20、对各重复语音分别进行语音相关度检测，并根据所述语音相关度检测结果确定所述重复语音中的异常语音；

21、在所述拼接语音中删除所述异常语音。

22、优选的，对所述重复语音分别进行语音相关度检测，并根据所述语音相关度检测结果确定所述重复语音中的异常语音，包括：

23、在所述拼接语音中，将各重复语音与相邻的断句语音进行组合，得到组合语音；

24、对各组合语音的语音文本进行分词，得到语音分词，并分别查询各语音分词之间的词汇相关度；

25、根据所述词汇相关度确定各组合语音的语音相关度，并将最小所述语音相关度对应的所述重复语音确定为所述异常语音。

26、优选的，若所述拼接语音的语音拼接次数大于第一次数阈值之后，还包括：

27、对所述拼接语音的语音文本进行实体识别，并根据实体识别结果确定所述拼接语音的实体结构；

28、若所述拼接语音的实体结构与预设实体结构未匹配，则将所述拼接语音中首位的断句语音进行删除。

29、本发明实施例的另一目的在于提供一种基于语义的语音断句系统，所述系统包括：

30、端点检测模块，用于获取用户语音，并对所述用户语音进行语音端点检测；

31、语义检测模块，用于根据所述语音端点检测结果对所述用户语音进行断句，得到断句语音，并依序对各断句语音进行语义完整度检测；

32、语音拼接模块，用于若任一所述断句语音的语义完整度检测未合格，则对所述断句语音进行语音拼接，得到拼接语音，并对所述拼接语音进行语义完整度检测，所述语音拼接用于将未合格的所述断句语音与相邻的断句语音进行拼接；

33、若所述拼接语音的语义完整度检测未合格，则对所述拼接语音进行语音拼接，并返回执行对所述拼接语音进行语义完整度检测的步骤；

34、语音交互模块，用于若所述拼接语音的语义完整度检测合格，则根据所述拼接语音对所述用户语音进行语音断句，并根据语音断句结果进行语音交互。

35、本发明实施例的另一目的在于提供一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述方法的步骤。

36、本发明实施例的另一目的在于提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述方法的步骤。

37、本发明实施例，通过对各断句语音进行语义完整度检测，能有效地判断各断句语音是否是语义完整的语音片段，若任一断句语音的语义完整度检测未合格，通过对断句语音进行语音拼接，得到拼接语音，能有效地将语义不连贯的语音进行拼接，保障了语音断句后语音语义的完整性，通过对拼接语音进行语义完整度检测，以检测拼接语音语义的完整性，本发明实施例，能够保持语音断句后语音语义的连贯性，避免将一个连贯的指令切分成多个语义不完整的片段，提高了语音指令的理解度和连贯性，提高了用户的使用体验。

技术特征：

1.一种基于语义的语音断句方法，其特征在于，所述方法包括：

2.如权利要求1所述的基于语义的语音断句方法，其特征在于，依序对各断句语音进行语义完整度检测，包括：

3.如权利要求1所述的基于语义的语音断句方法，其特征在于，对所述拼接语音进行语音拼接之后，还包括：

4.如权利要求1所述的基于语义的语音断句方法，其特征在于，对所述拼接语音进行语音拼接之后，还包括：

5.如权利要求1所述的基于语义的语音断句方法，其特征在于，若所述拼接语音的语义完整度检测未合格之后，还包括：

6.如权利要求5所述的基于语义的语音断句方法，其特征在于，对所述重复语音分别进行语音相关度检测，并根据所述语音相关度检测结果确定所述重复语音中的异常语音，包括：

7.如权利要求3所述的基于语义的语音断句方法，其特征在于，若所述拼接语音的语音拼接次数大于第一次数阈值之后，还包括：

8.一种基于语义的语音断句系统，其特征在于，所述系统包括：

9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

技术总结本发明提供了一种基于语义的语音断句方法、系统、终端及存储介质，该方法包括：对用户语音进行语音端点检测；根据语音端点检测结果对用户语音进行断句，得到断句语音，依序对各断句语音进行语义完整度检测；若任一断句语音的语义完整度检测未合格，则对断句语音进行语音拼接，得到拼接语音，对拼接语音进行语义完整度检测；若拼接语音的语义完整度检测未合格，则对拼接语音进行语音拼接，返回执行对拼接语音进行语义完整度检测的步骤；若拼接语音的语义完整度检测合格，则根据拼接语音对用户语音进行语义断句。本发明实施例，能够保持语音断句后语音语义的连贯性，避免将一个连贯的指令切分成多个语义不完整的片段，提高了用户的使用体验。技术研发人员：邱祎,张泽宇,陈吉胜受保护的技术使用者：云知声智能科技股份有限公司技术研发日：技术公布日：2024/4/24