技术新讯 > 乐器声学设备的制造及制作,分析技术 > 通话应答方法、装置、电子设备及存储介质与流程 > 正文

通话应答方法、装置、电子设备及存储介质与流程

国知局
2024-06-21 11:30:29

本申请涉及人工智能，尤其涉及一种通话应答方法、装置、电子设备及存储介质。

背景技术：

1、通过智能客服与用户进行交流，是提高服务提高效率和服务质量的一种重要方式。

2、目前，智能客服与用户进行交流大多基于播放事先人工录制好的录音文件或者直接通过市面上常见的语音合成技术进行大段文本的语音合成，使得用户听到的应答音频过于机械化，用户的体验较差。

技术实现思路

1、本申请实施例提供一种通话应答方法、装置、电子设备及存储介质，可以使智能客服的应答音频更加真实，提高用户的体验。

2、第一方面，本申请实施例提供一种通话应答方法，包括：获取用户的语音信息，以及，所述语音信息对应的文本信息；

3、将所述语音信息输入至用户语音情绪识别模型，得到用户的第一情绪结果，以及将所述文本信息输入至用户文本情绪识别模型，得到用户的第二情绪结果；

4、对所述第一情绪结果和第二情绪结果进行处理，得到所述用户的目标情绪标签；

5、根据所述目标情绪标签，以及，文本信息和/或语音信息，获取用于对用户进行交流的应答音频。

6、可选的，所述根据所述目标情绪标签，以及，文本信息和/或语音信息，获取用于用户进行交流的应答音频，包括：

7、获取所述目标情绪标签对应的应答情绪标签；

8、根据所述文本信息和/或语音信息，确定应答节点；

9、根据所述应答情绪标签和所述应答节点在预设的应答语音库中，获取对应的应答音频。

10、可选的，所述方法还包括：

11、若根据所述应答音频的标签，确定所述应答音频为包括关键字的应答音频，则将所述应答情绪标和所述关键字内容输入至语音合成模型，得到关键字音频；

12、将所述关键字音频与所述应答音频进行拼接，得到目标应答音频；其中，包括关键字标签的应答音频从所述关键字处截断。

13、可选的，所述对所述第一情绪结果和第二情绪结果进行处理，得到所述用户的目标情绪标签，包括：

14、获取所述用户语音情绪识别模型的第一权重，以及，所述用户文本情绪识别模型的第二权重；

15、根据所述第一权重和所述第二权重对所述第一情绪结果和第二情绪结果进行加权处理，得到所述目标情绪标签。

16、可选的，所述根据所述第一权重和所述第二权重对所述第一情绪结果和第二情绪结果进行加权处理，得到所述目标情绪标签，包括：

17、对所述第一情绪结果和第二情绪结果进行加权处理，确定多个情绪分值；

18、根据所述情绪分值对应的情绪类别，确定所述目标情绪标签。

19、可选的，所述获取所述目标情绪标签对应的应答情绪标签，包括：

20、根据所述目标情绪标签，从预设的情绪标签对应表中获取所述应答情绪标签；所述情绪标签对应表中包括所述目标情绪标签与所述应答情绪标签的映射关系。

21、可选的，所述根据所述文本信息和/或语音信息，确定应答节点，包括：

22、根据所述文本信息和/或语音信息对用户进行意图识别，根据意图识别结果确定所述应答节点。

23、第二方面，本申请实施例提供一种通话应答装置，包括：

24、获取模块，用于获取所述用户的语音信息，以及，所述语音信息对应的文本信息；

25、识别模块，用于将所述语音信息输入至用户语音情绪识别模型，得到用户的第一情绪结果，以及将所述文本信息输入至用户文本情绪识别模型，得到用户的第二情绪结果；

26、处理模块，用于对所述第一情绪结果和第二情绪结果进行处理，得到所述用户的目标情绪标签；

27、应答模块，用于根据所述目标情绪标签，以及，文本信息和/或语音信息，获取用于对用户进行应答的应答音频。

28、第三方面，本申请提供一种电子设备，包括：存储器和处理器；

29、存储器用于存储计算机指令；处理器用于运行存储器存储的计算机指令实现第一方面中任一项的方法。

30、第四方面，本申请提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行以实现第一方面中任一项的方法。

31、第五方面，本申请提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现第一方面中任一项的方法。

32、本申请实施例提供的通话应答方法、装置、电子设备及存储介质，通过获取用户的语音信息，以及，所述语音信息对应的文本信息；将所述语音信息输入至用户语音情绪识别模型，得到用户的第一情绪结果，以及将所述文本信息输入至用户文本情绪识别模型，得到用户的第二情绪结果；对所述第一情绪结果和第二情绪结果进行处理，得到所述用户的目标情绪标签；根据所述目标情绪标签，以及，文本信息和/或语音信息，获取用于对用户进行应答的应答音频。通过对用户的情绪进行识别，可以采用与用户情绪匹配的应答语音与用户进行交流，提升用户的使用体验。

技术特征：

1.一种通话应答方法，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标情绪标签，以及，文本信息和/或语音信息，获取用于用户进行交流的应答音频，包括：

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述对所述第一情绪结果和第二情绪结果进行处理，得到所述用户的目标情绪标签，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一权重和所述第二权重对所述第一情绪结果和第二情绪结果进行加权处理，得到所述目标情绪标签，包括：

6.根据权利要求2所述的方法，其特征在于，所述获取所述目标情绪标签对应的应答情绪标签，包括：

7.根据权利要求6所述的方法，其特征在于，所述根据所述文本信息和/或语音信息，确定应答节点，包括：

8.一种通话应答装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被处理器执行以实现权利要求1-7中任一项所述的方法。

技术总结本申请实施例提供一种通话应答方法、装置、电子设备及存储介质，涉及人工智能技术领域，方法包括：获取用户的语音信息，以及，语音信息对应的文本信息；将语音信息输入至用户语音情绪识别模型，得到用户的第一情绪结果，以及将文本信息输入至用户文本情绪识别模型，得到用户的第二情绪结果；对第一情绪结果和第二情绪结果进行处理，得到用户的目标情绪标签；根据目标情绪标签，以及，文本信息和/或语音信息，获取用于对用户进行应答的应答音频。通过对用户的情绪进行识别，可以采用与用户情绪匹配的应答语音与用户进行交流，提升用户的使用体验。技术研发人员：杨铭,陈杨君,刘设伟受保护的技术使用者：泰康在线健康科技（武汉）有限公司技术研发日：技术公布日：2024/2/29