技术新讯 > 乐器声学设备的制造及制作,分析技术 > 交互优化组件、方法和计算机可读存储介质与流程 > 正文

交互优化组件、方法和计算机可读存储介质与流程

国知局
2024-06-21 11:30:36

本发明涉及语音交互，特别是涉及一种交互优化组件、方法和计算机可读存储介质。

背景技术：

1、当前车载中的多模交互是语音功能中的一个亮点功能，也是当前汽车语音智能交互上一个必不可少的功能，车载多模语音技术，例如通过dms驾驶员监测摄像头将驾驶员的唇形和音频检测后判断当前是否要进行动作触发，该功能可以一定程度上提高用户驾驶的安全性以及便利性。但是，在现有的车载方案中，完全没有过滤是否为当前车辆或者项目需要的功能，或者是否只是简单的一次交互就可以完成的交互操作，完全不需要二次交互的操作做过滤和静默响应,只要满足多模的条件(有人脸、无遮挡、无口罩、有网络、是否为普通话)就能够召回语义，只要能召回都进行响应，打字机等交互都上屏，语音助手都会被触发拉起，都进入了后续的单模交互，也就导致后面说的话都被识别进去，导致误触发更多，也就导致更多的打扰用户或者其他干扰行车安全。

技术实现思路

1、本发明实施例针对现有技术中的不足，提供一种交互优化组件、方法和计算机可读存储介质。

2、本发明实施例提供一种交互优化组件，包括：

3、识别结果接收模块，用于接收来自语音助手的多模语义识别结果；

4、功能过滤模块，用于对所述多模语义识别结果进行功能过滤；

5、场景过滤模块，用于对功能过滤后的多模语义识别结果进行交互场景过滤，得到过滤结果；

6、静默匹配模块，用于对所述过滤结果进行确认整合，得到匹配结果；

7、静默结果分发模块，用于将所述匹配结果下发到所述语音助手。

8、作为优选方案，所述交互优化装置还包括功能规则表模块，所述功能规则表模块用于存储语义功能规则表；其中，所述语义功能规则表用于指示语义、功能以及功能是否被支持之间的对应关系；

9、则所述功能过滤模块，具体用于：

10、基于所述语义功能规则表，对所述多模语义识别结果进行匹配过滤。

11、作为优选方案，所述交互优化装置还包括场景加载模块，所述场景加载模块用于存储场景功能规则表；其中，所述场景功能规则表用于指示语义与交互场景之间的对应关系；

12、所述场景过滤模块，具体用于：

13、基于所述场景功能规则表，对功能过滤后的多模语义识别结果进行交互场景过滤，得到过滤结果。

14、作为优选方案，所述静默匹配模块，具体用于：

15、获取所述语义功能规则表和所述场景功能规则表；

16、基于所述语义功能规则表和所述场景功能规则表，对所述过滤结果进行最终确认，得到匹配结果；

17、将所述匹配结果进行整合，生成携带有匹配结果的数据结构体；

18、所述静默结果分发模块具体用于将所述携带有匹配结果的数据结构体下发到所述语音助手。

19、作为优选方案，所述交互优化装置还包括场景管理模块，所述场景管理模块用于：

20、从所述场景加载模块获取场景功能规则表，并将所述场景功能规则表发送到所述静默匹配模块；

21、从所述场景过滤模块获取过滤结果，并将所述过滤结果发送到所述静默匹配模块。

22、本发明实施例还提供一种交互优化方法，包括：

23、接收来自语音助手的多模语义识别结果；

24、对所述多模语义识别结果进行功能过滤；

25、对功能过滤后的多模语义识别结果进行交互场景过滤，得到过滤结果；

26、对所述过滤结果进行确认整合，得到匹配结果；

27、将所述匹配结果下发到所述语音助手。

28、作为优选方案，所述对所述多模语义识别结果进行功能过滤，具体包括：

29、基于预先配置的语义功能规则表，对所述多模语义识别结果进行匹配过滤；

30、其中，所述语义功能规则表用于指示语义、功能以及功能是否被支持之间的对应关系。

31、作为优选方案，所述对功能过滤后的多模语义识别结果进行交互场景过滤，得到过滤结果，具体包括：

32、基于预先配置的场景功能规则表，对功能过滤后的多模语义识别结果进行交互场景过滤，得到过滤结果；

33、其中，所述场景功能规则表用于指示语义与交互场景之间的对应关系。

34、作为优选方案，所述对所述过滤结果进行确认整合，得到匹配结果，具体包括：

35、获取所述语义功能规则表和所述场景功能规则表；

36、基于所述语义功能规则表和所述场景功能规则表，对所述过滤结果进行最终确认，得到匹配结果；

37、将所述匹配结果进行整合，生成携带有匹配结果的数据结构体；

38、将所述携带有匹配结果的数据结构体下发到所述语音助手。

39、本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行所述的交互优化方法。

40、相比于现有技术，本发明实施例通过将多模语义识别结果进行功能过滤和交互场景过滤，并对过滤结果进行确认整合，将匹配结果下发到语音助手，从而实现语义功能过滤、需要静默交互的单次交互的场景过滤，从而提高了多模交互的便利性和用户体验。

技术特征：

1.一种交互优化组件，其特征在于，包括：

2.如权利要求1所述的交互优化组件，其特征在于，所述交互优化装置还包括功能规则表模块，所述功能规则表模块用于存储语义功能规则表；其中，所述语义功能规则表用于指示语义、功能以及功能是否被支持之间的对应关系；

3.如权利要求2所述的交互优化组件，其特征在于，所述交互优化装置还包括场景加载模块，所述场景加载模块用于存储场景功能规则表；其中，所述场景功能规则表用于指示语义与交互场景之间的对应关系；

4.如权利要求3所述的交互优化组件，其特征在于，所述静默匹配模块，具体用于：

5.如权利要求4所述的交互优化组件，其特征在于，所述交互优化装置还包括场景管理模块，所述场景管理模块用于：

6.一种交互优化方法，其特征在于，包括：

7.如权利要求6所述的交互优化方法，其特征在于，所述对所述多模语义识别结果进行功能过滤，具体包括：

8.如权利要求7所述的交互优化方法，其特征在于，所述对功能过滤后的多模语义识别结果进行交互场景过滤，得到过滤结果，具体包括：

9.如权利要求8所述的交互优化方法，其特征在于，所述对所述过滤结果进行确认整合，得到匹配结果，具体包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求6至9中任意一项所述的交互优化方法。

技术总结本发明涉及语音交互技术领域，公开了一种交互优化组件、方法和计算机可读存储介质，通过将多模语义识别结果进行功能过滤和交互场景过滤，并对过滤结果进行确认整合，将匹配结果下发到语音助手，从而实现语义功能过滤、需要静默交互的单次交互的场景过滤，从而提高了多模交互的便利性和用户体验。技术研发人员：邱俊,刘俊峰,张莹,冉光伟,王岳东受保护的技术使用者：星河智联汽车科技有限公司技术研发日：技术公布日：2024/2/29