技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种语义理解方法、装置及设备与流程 > 正文

一种语义理解方法、装置及设备与流程

国知局
2024-06-21 11:30:25

本发明涉及自然语言处理，尤其涉及一种语义理解方法、装置及设备。

背景技术：

1、语义理解是指，机器依据用户给出的自然语言，理解出用户的意图，进一步地，还可以做出相应的操作。语义理解通常包含实体识别、问题类型识别和意图识别等多个任务。

2、当对一句话进行语义理解时，通常会得到多种可能的语义理解，故需要从中进一步找到最优的语义理解作为最终结果。随着语义理解技术的发展，对文本的解析越来越细致，语义理解的数量呈指数级增长，而这些众多的语义理解中往往会包含较多不相关甚至无意义的语义理解，存在较多的冗余数据，很难从中快速找到最优的语义理解，影响了语义理解时的速度和效率。

3、因此，现有技术还有待于改进和发展。

技术实现思路

1、鉴于上述现有技术的不足，本发明的目的在于提供一种语义理解方法、装置及设备，旨在解决现有技术对文本的解析越来越细致，语义理解的数量呈指数级增长，而这些众多的语义理解中往往会包含较多不相关甚至无意义的语义理解，存在较多的冗余数据，很难从中快速找到最优的语义理解，影响了语义理解时的速度和效率的技术问题。

2、本发明的技术方案如下：

3、一种语义理解方法，所述方法包括：

4、采集语音通话数据，对所述语音通话数据进行预处理，得到语音训练样本；

5、基于所述语音训练样本对初始语音识别模型进行训练，得到目标语义理解模型；

6、获取待处理的语音通话数据，将所述语音通话数据输入所述目标语义理解模型，得到语义理解结果。

7、进一步地，所述采集语音通话数据，对所述语音通话数据进行预处理，得到语音训练样本；

8、基于所述语音训练样本对初始语音识别模型进行训练，得到目标语义理解模型；

9、获取待处理的语音通话数据，将所述语音通话数据输入所述目标语义理解模型，得到语义理解结果。

10、进一步优选地，所述基于所述语音训练样本对初始语音识别模型进行训练，得到目标语义理解模型前，包括：

11、预先构建深度学习模型；

12、获取标注后的语音数据；

13、根据标注后的语音数据对所述深度学习模型进行训练，得到初始语音识别模型。

14、进一步优选地，所述采集语音通话数据，对所述语音通话数据依次进行音频信号增强、标准化及降噪处理，并将处理后的所述语音通话数据转化为文本数据后，还包括：

15、将所述文本数据转化为向量表示。

16、优选地，所述获取待处理的语音通话数据，将所述语音通话数据输入所述目标语义理解模型，得到语义理解结果，包括：

17、获取待处理的语音通话数据，对所述语音通话数据依次进行音频信号增强、标准化及降噪处理；

18、将处理后的所述语音通话数据输入所述目标语义理解模型，得到语义理解结果。

19、进一步地，所述将所述文本数据转化为向量表示，包括：

20、基于词嵌入模型将所述文本数据转化为向量表示。

21、进一步地，所述对所述语音通话数据提取语音特征，包括:

22、对所述语音数据进行去除噪音和降低采样率操作，得到预处理后的语音数据；

23、将所述预处理后的语音数据进行分帧，将所述预处理后的语音数据分割为若干个短时的语音片段；

24、对所述短时的语音片段进行特征提取，得到初始语音特征；

25、对所述初始语音特征进行降维处理，得到降维语音特征；

26、根据特征选择算法对所述降维语音特征进行选择，得到语音特征。

27、本发明的另一实施例提供了一种语义理解装置，装置包括：

28、数据预处理模块，用于采集语音通话数据，对所述语音通话数据进行预处理，得到语音训练样本；

29、模型训练模块，用于基于所述语音训练样本对初始语音识别模型进行训练，得到目标语义理解模型；

30、语义理解模块，用于获取待处理的语音通话数据，将所述语音通话数据输入所述目标语义理解模型，得到语义理解结果。

31、本发明的另一实施例提供了一种语义理解设备，所述设备包括至少一个处理器；以及，

32、与所述至少一个处理器通信连接的存储器；其中，

33、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的语义理解方法。

34、本发明的另一实施例还提供了一种非易失性计算机可读存储介质，所述非易失性计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个处理器执行时，可使得所述一个或多个处理器执行上述的语义理解方法。

35、有益效果：本发明实施例可实现提取语音识别模型需要的语音素材，建立大语音识别模型库，实现对语句进行分析，提高了语义理解的效率。

技术特征：

1.一种语义理解方法,其特征在于,所述方法包括：

2.根据权利要求1所述的语义理解方法，其特征在于，所述采集语音通话数据，对所述语音通话数据进行预处理，得到语音训练样本，包括：

3.根据权利要求2所述的语义理解方法，其特征在于，所述基于所述语音训练样本对初始语音识别模型进行训练，得到目标语义理解模型前，包括：

4.根据权利要求3所述的语义理解方法，其特征在于，所述采集语音通话数据，对所述语音通话数据依次进行音频信号增强、标准化及降噪处理，并将处理后的所述语音通话数据转化为文本数据后，还包括：

5.根据权利要求4所述的语义理解方法，其特征在于，所述获取待处理的语音通话数据，将所述语音通话数据输入所述目标语义理解模型，得到语义理解结果，包括：

6.根据权利要求5所述的语义理解方法，其特征在于，所述将所述文本数据转化为向量表示，包括：

7.根据权利要求6所述的语义理解方法，其特征在于，所述对所述语音通话数据提取语音特征，包括:

8.一种语义理解装置，其特征在于，所述装置包括：

9.一种语义理解设备，其特征在于，所述设备包括至少一个处理器；以及，

10.一种非易失性计算机可读存储介质，其特征在于，所述非易失性计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个处理器执行时，可使得所述一个或多个处理器执行权利要求1-7任一项所述的语义理解方法。

技术总结本发明公开了一种语义理解方法、装置及设备，该方法包括：采集语音通话数据，对所述语音通话数据进行预处理，得到语音训练样本；基于所述语音训练样本对初始语音识别模型进行训练，得到目标语义理解模型；获取待处理的语音通话数据，将所述语音通话数据输入所述目标语义理解模型，得到语义理解结果。本发明实施例可实现提取语音识别模型需要的语音素材，建立大语音识别模型库，实现对语句进行分析，提高了语义理解的效率。技术研发人员：肖坚炜,谢朝霞,杨磊受保护的技术使用者：深圳市安络科技有限公司技术研发日：技术公布日：2024/2/25