语音识别处理方法及电子设备与流程
- 国知局
- 2024-06-21 10:41:17
本技术涉及人机语音交互,特别涉及一种语音识别处理方法及电子设备。
背景技术:
1、随着科学技术的发展,越来越来的电子设备可以支持人机语音交互。并且电子设备基于用户语音可以识别出用户意图,并作出对应响应。当前,电子设备中提前设置有电子设备所支持的语音交互功能对应的功能指令,电子设备通过将接收到的用户语音指令与提前设置好的功能指令进行匹配的方式,来识别用户意图。
2、具体的,以汽车行业为例,随着新能源汽车的高速发展,汽车被加入了智能导航系统、智能娱乐系统等,并且随着车联网的发展,通过例如手机等移动终端来远程控制、查看和处理汽车相关的信息也变得越来越普及。现有技术中,在例如通过手机中的语音助手app对车辆进行远程控制的场景中,手机中的语音助手app中提前设置有车辆控制指令(即功能指令),用户需要对车辆进行控制时,通过语音助手app输入用户语音指令,手机将用户语音指令与语音助手app中提前设置好的车辆控制指令进行匹配,如果存在与用户语音指令一致的车辆控制指令,则认为识别出用户意图,将该车辆控制指令下发至车辆,以使车辆执行车辆控制指令。这种方式中,语音助手app中必须提前设置好车辆控制指令,并且用户输入的用户语音指令必须与提前设置好的车辆控制指令一致,手机才能识别出用户意图进行对应远程控制。因此,用户需要清楚记住提前设定好的车辆控制指令才能完成远程控制,用户一旦忘记或者说错车辆控制指令,手机将无法确定用户意图,并无法控制车辆做出对应响应,影响用户体验。
3、因此,现有技术中,电子设备通过将接收到的用户语音指令与提前设置好的功能指令进行匹配来识别用户意图的方式,只有用户说出的用户语音指令与提前设置好的功能指令一致的情况下,电子设备才能识别出用户意图。因此,用户需要清楚记住提前设定好的功能指令才能完成语音交互,用户一旦忘记或者说错功能指令,电子设备将无法确定用户意图,并无法做出对应响应,影响用户体验。因此,当前电子设备存在无法向用户提供更好地人机语音交互服务的问题。
技术实现思路
1、本技术实现方式提供了一种语音识别处理方法及电子设备,以解决现有技术中存在的用户需要清楚记住预先设定好的功能指令才能完成语音交互,用户一旦忘记或者说错功能指令,电子设备将无法确定用户意图,并无法进行对应处理,影响用户体验,即当前电子设备存在无法向用户提供更好地人机语音交互服务的问题。
2、为解决上述技术问题,第一方面,本技术实现方式提供了一种语音识别处理方法,该方法包括:确定第一用户的第一语音,并确定第一语音对应的第一语音内容信息;通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理,得到第一意图识别结果;基于第一意图识别结果若得到用户明确意图,则执行得到的用户明确意图;基于第一意图识别结果若无法得到用户明确意图,则生成意图确认信息,向第一用户呈现意图确认信息,以继续与第一用户的会话,并确定用户针对意图确认信息的响应情况信息,根据响应情况信息进行对应处理。
3、本技术实现方式中,在接收到用户的第一语音后,确定第一语音对应的第一语音内容信息,通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理,得到第一意图识别结果。如此,基于用户意图识别模型就可以方便、准确地进行用户意图识别处理,以确定用户意图,相比于现有技术中需要提前设置功能指令进行匹配的方式,用户意图的识别更为准确、全面,因此可以更好地提供人机语音交互服务,有效地提升了用户体验。进一步地,基于第一意图识别结果若得到用户明确意图,则直接执行得到的用户明确意图,即作出对应响应,以实现与用户的语音交互。基于第一意图识别结果若无法得到用户明确意图,则生成意图确认信息,向第一用户呈现意图确认信息,以继续与第一用户的会话,并确定用户针对意图确认信息的响应情况信息,根据响应情况信息进行对应处理。如此,即使基于用户意图识别模型无法得到用户明确意图,仍然能够通过意图确认信息和响应情况信息以进一步与用户进行人机交互以进一步明确用户意图,并进行相应处理,可以更好地提供人机语音交互服务,有效地提升了用户体验。
4、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理,得到第一意图识别结果,包括:将第一语音内容信息输入至用户意图识别模型,由用户意图识别模型进行用户意图识别处理,得到第一意图识别结果;或者将第一语音内容信息,以及第一语音内容信息的关联信息输入至用户意图识别模型,由用户意图识别模型进行用户意图识别处理,得到第一意图识别结果。
5、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,第一语音内容信息的关联信息包括以下信息中的至少一项:第一语音所属会话中第一语音之前的历史会话信息;第一用户的用户历史会话信息;第一用户的用户特征信息;第一用户的历史行为信息。
6、采用上述方案,基于用户意图识别模型进行用户意图识别处理,并且基于语音内容信息以及语音内容信息的关联信息进行用户意图识别处理,能够得到更为准确的意图识别结果,提升意图识别的准确度,使得即使用户语音不明确时,仍然能够基于语音内容信息的关联信息识别出明确的意图。
7、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,基于第一意图识别结果若无法得到用户明确意图,则生成意图确认信息,包括:若用户意图识别模型识别出至少两个用户意图,确定基于第一意图识别结果无法得到用户明确意图,根据至少两个用户意图生成意图确认信息,或者根据至少两个用户意图以及第一语音内容信息和/或第一语音内容信息的关联信息生成意图确认信息;若用户意图识别模型无法识别出用户意图,确定基于第一意图识别结果无法得到用户明确意图,根据第一语音内容信息生成意图确认信息,或者根据第一语音内容信息和第一语音内容信息的关联信息生成意图确认信息。
8、采用上述方案,若用户意图识别模型识别出两个以上的用户意图,根据至少两个用户意图以及第一语音内容信息和/或第一语音内容信息的关联信息生成意图确认信息,如此,能够生成更为准确的意图确认信息,并基于与用户的进一步交互确定用户真正意图。若未识别出用户意图,则根据第一语音内容信息和第一语音内容信息的关联信息生成意图确认信息,使得即使用户语音不明确,仍然能够生成更为准确的意图确认信息,并基于与用户的进一步交互确定用户真正意图,提升用户的语音交互体验。
9、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,根据响应情况信息进行对应处理,包括:在根据响应情况信息确定第一用户针对意图确认信息未作出响应的情况下,结束用户意图识别处理,或者生成第一信息,并向第一用户呈现第一信息,以继续与第一用户的会话;在根据响应情况信息确定第一用户针对意图确认信息作出响应的情况下,通过用户意图识别模型针对响应情况信息进行用户意图识别处理,得到第二意图识别结果,根据第二意图识别结果进行对应处理。
10、采用上述方案,基于用户对意图确认信息的响应情况信息,确定结束用户意图识别处理或者基于用户意图识别模型进一步进行用户意图识别处理,得到第二意图识别结果。如此,即使基于用户意图识别模型无法得到用户明确意图,仍然能够通过意图确认信息和响应情况信息以进一步与用户进行人机交互以进一步明确用户意图,并进行相应处理,可以更好地提供人机语音交互服务,有效地提升了用户体验。
11、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,根据第二意图识别结果进行对应处理,包括:基于第二意图识别结果若得到用户明确意图,执行得到的用户明确意图;基于第二意图识别结果若无法得到用户明确意图,结束用户意图识别处理。
12、采用上述方案,在语音识别不明确时,基于意图确认信息和用户进行交互,以在根据用户响应情况信息得到用户明确意图的情况下,执行得到的用户明确意图,以在未得到用户明确意图时,结束意图识别处理。如此,即使用户的语音为不清楚的,仍然能够通过语音进行识别处理得到用户明确意图,提高了语音识别的准确性。
13、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,在基于第二意图识别结果无法得到用户明确意图,结束用户意图识别处理的情况下,该方法还包括:基于第二意图识别结果若确定第一用户未给出新的用户意图,则通过用户意图识别模型生成第二信息,并向第一用户呈现第二信息,以继续与第一用户的会话;基于第二意图识别结果若确定第一用户给出新的用户意图,则基于第二意图识别结果确定是否得到对应的用户明确意图,以进行对应处理。
14、采用上述方案,若在基于意图确认信息进行意图确认过程中,用户给出新的意图,则对新的意图进行意图识别处理,如此,能够基于连续的语音交互对多个用户语音进行识别处理,提升用户体验。
15、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,执行得到的用户明确意图,包括:确定用户明确意图的意图类型;根据意图类型,执行得到的用户明确意图。
16、采用上述方案,对能够得到用户明确意图的语音,可以基于意图类型,进行不同方式的处理。如此,使得语音识别处理方式更多样化。
17、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,根据意图类型,执行得到的用户明确意图,包括:在用户明确意图的意图类型为查询意图的情况下,若确定第一用户满足查询条件,根据用户明确意图获取对应查询结果信息,并向第一用户呈现查询结果信息;在用户明确意图的意图类型为设置意图的情况下,若确定第一用户具备针对用户明确意图对应的目标设备的控制权限,并且目标设备具备执行用户明确意图的能力,控制目标设备执行用户明确意图;在用户明确意图的意图类型为场景意图的情况下,根据用户明确意图确定目标规划方案信息,并向第一用户呈现目标规划方案信息;在用户明确意图的意图类型为查询意图、设置意图、场景意图以外的意图类型的情况下,根据用户明确意图确定目标内容信息,并向第一用户呈现目标内容信息。
18、采用上述方案,在意图类型不同的情况下,处理方式不同。若涉及到针对目标设备的查询意图或者设置意图时,进行用户鉴权认证,在用户具备权限的情况下,再进行对应指令的执行。如此,在使得语音识别处理和执行多样化的同时,提升了指令下发和执行的安全性。
19、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,还包括通过语音播报的方式和/或界面显示的方式向第一用户呈现对应信息。如此,采用多种方式向用户呈现对应信息,提升用户体验。
20、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,该方法还包括:通过用户意图识别模型针对第一语音所属会话中的第一个用户语音进行用户意图识别处理的过程中,得到第一语音所属会话的会话标识信息,以用于标识同一会话。
21、采用上述方案,基于会话标识信息能够根据历史会话信息进行用户意图识别,使得识别出的结果更准确,更符合用户需求。
22、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,该方法还包括:在满足第一条件的情况下,生成会话显示信息,并通过界面显示的方式将会话显示信息呈现给第一用户。
23、采用上述方案,能够在会话内容满足第一条件时,生成会话结果内容呈现给用户。如此,方便用户对会话结果内容的查看。
24、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,用户意图识别模型通过以下信息进行模型训练得到:用户历史会话信息;用户特征信息;用户历史行为信息。
25、采用上述方案,基于用户历史会话信息、用户特征信息、用户历史行为信息,能够使得用户意图识别模型进行用户意图识别处理更加准确。
26、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,该方法还包括:在第一语音所属会话结束后,保存会话内容信息,并根据会话内容信息更新用户意图识别模型,或者更新第一用户的用户特征信息。
27、采用上述技术方案,基于会话内容信息更新用户意图识别模型,或者更新用户的用户特征信息,方便在接收到新的语音时,基于最新的用户意图识别模型,或者基于最新的用户特征信息进行后续处理,使得语音识别处理更符合用户需求。
28、第二方面,本技术的实现方式还公开了另一种语音识别处理方法,应用于语音识别处理系统,语音识别处理系统包括移动终端、云端和车端,该方法包括:移动终端接收第一用户的第一语音,确定第一语音对应的第一语音内容信息,将第一语音内容信息发送至云端,第一语音为与车端相关的用户语音;云端接收第一语音内容信息,通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理,得到第一意图识别结果;云端基于第一意图识别结果若得到用户明确意图,则通过移动终端和/或车端执行得到的用户明确意图;云端基于第一意图识别结果若无法得到用户明确意图,则生成意图确认信息,将意图确认信息发送至移动终端;移动终端接收意图确认信息,向第一用户呈现意图确认信息,以继续与第一用户的会话,并获取第一用户针对意图确认信息的响应情况信息,将响应情况信息发送至云端;云端接收响应情况信息,根据响应情况信息进行对应处理。
29、本技术实施方式中,移动终端接收到第一语音之后,将第一语音发送至云端,云端在基于用户意图识别模型生成的第一意图识别结果得到用户明确意图的情况下,通过移动终端和/或车端执行得到的用户明确意图。如此,基于用户意图识别模型就可以方便、准确地进行用户意图识别处理,以确定用户意图,相比于现有技术中需要提前设置功能指令进行匹配的方式,用户意图的识别更为准确、全面,因此可以更好地提供人机语音交互服务,有效地提升了用户体验。在无法得到用户明确意图的情况下,生成意图确认信息,将意图确认信息发送至移动终端;移动终端接收意图确认信息,确定用户针对意图确认信息的响应情况信息,将响应情况信息发送至云端,云端根据响应情况信息进行对应处理。也即,基于移动终端和云端服务器的通信交互,可以在无法得到用户明确意图的情况下,云端将意图确认信息发送至移动终端,移动终端和用户进行语音交互,得到用户的响应情况信息,云端根据响应情况信息进行对应处理。如此,如此,即使基于用户意图识别模型无法得到用户明确意图,仍然能够通过意图确认信息和响应情况信息以进一步与用户进行人机交互以进一步明确用户意图,并进行相应处理,以对车端进行控制,可以更好地提供基于人机语音交互控制车端的服务,有效地提升了用户体验。
30、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理,得到第一意图识别结果,包括:云端将第一语音内容信息输入至用户意图识别模型,由用户意图识别模型进行用户意图识别处理,得到第一意图识别结果;或者云端将第一语音内容信息,以及第一语音内容信息的关联信息输入至用户意图识别模型,由用户意图识别模型进行用户意图识别处理,得到第一意图识别结果。
31、采用上述方案,基于用户意图识别模型进行用户意图识别处理,并且基于语音内容信息以及语音内容信息的关联信息进行用户意图识别处理,能够得到更为准确的意图识别结果,提升意图识别的准确度,使得即使用户语音不明确时,仍然能够基于语音内容信息的关联信息识别出明确的意图。
32、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端基于第一意图识别结果若无法得到用户明确意图,则生成意图确认信息,包括:若用户意图识别模型识别出至少两个用户意图,云端确定基于第一意图识别结果无法得到用户明确意图,根据至少两个用户意图生成意图确认信息,或者根据至少两个用户意图以及第一语音内容信息和/或第一语音内容信息的关联信息生成意图确认信息;若用户意图识别模型无法识别出用户意图,云端确定基于第一意图识别结果无法得到用户明确意图,根据第一语音内容信息生成意图确认信息,或者根据第一语音内容信息和第一语音内容信息的关联信息生成意图确认信息。
33、采用上述方案,若用户意图识别模型识别出两个以上的用户意图,根据至少两个用户意图以及第一语音内容信息和/或第一语音内容信息的关联信息生成意图确认信息,如此,生成更为准确的意图确认信息,并基于与用户的进一步交互确定用户真正意图。若未识别出用户意图,则根据第一语音内容信息和第一语音内容信息的关联信息生成意图确认信息,使得即使用户语音不明确,仍然能够生成更为准确的意图确认信息,并基于与用户的进一步交互确定用户真正意图,提升用户的语音交互体验。
34、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端根据响应情况信息进行对应处理,包括:云端在根据响应情况信息确定第一用户针对意图确认信息未作出响应的情况下,结束用户意图识别处理,或者生成第一信息,将第一信息发送至移动终端,以使移动终端向第一用户呈现第一信息,以继续与第一用户的会话;云端在根据响应情况信息确定第一用户针对意图确认信息作出响应的情况下,通过用户意图识别模型针对响应情况信息进行用户意图识别处理,得到第二意图识别结果,根据第二意图识别结果进行对应处理。
35、采用上述方案,基于用户对意图确认信息的响应情况信息,确定结束用户意图识别处理或者基于用户意图识别模型进一步根据响应情况信息进行用户意图识别处理,得到第二意图识别结果。如此,即使基于用户意图识别模型无法得到用户明确意图,仍然能够通过意图确认信息和响应情况信息以进一步与用户进行人机交互以进一步明确用户意图,并进行相应处理,可以更好地提供人机语音交互服务,有效地提升了用户体验。
36、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端根据第二意图识别结果进行对应处理,包括:云端基于第二意图识别结果若得到用户明确意图,通过移动终端和/或车端执行得到的用户明确意图;云端基于第二意图识别结果若无法得到用户明确意图,结束用户意图识别处理。
37、采用上述方案,在语音识别不明确时,基于意图确认信息和用户进行交互,以在根据用户响应情况信息得到用户明确意图的情况下,执行得到的用户明确意图,以在未得到用户明确意图时,结束意图识别处理。如此,即使用户的语音为不清楚的,仍然能够通过语音进行识别处理得到用户明确意图,提高了语音识别的准确性。
38、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端在基于第二意图识别结果无法得到用户明确意图,结束用户意图识别处理情况下,该方法还包括:云端基于第二意图识别结果若确定第一用户未给出新的用户意图,则通过用户意图识别模型生成第二信息,并将第二信息发送至移动终端,以使移动终端向第一用户呈现第二信息,以继续与第一用户的会话;云端基于第二意图识别结果若确定第一用户给出新的用户意图,则基于第二意图识别结果确定是否得到对应的用户明确意图,以进行对应处理。
39、采用上述方案,若在基于意图确认信息进行意图确认过程中,用户给出新的意图,则对新的意图进行意图识别处理。若未给出新的意图,则返回第二信息,以继续与用户的会话。如此,即使未得到用户明确意图,仍然可以与用户进行语音交互,以得到新的意图,并进而得到用户明确意图,提升用户的语音交互体验。
40、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端通过移动终端和/或车端执行得到的用户明确意图,包括:云端确定用户明确意图的意图类型;云端根据意图类型,通过移动终端和/或车端执行得到的用户明确意图。
41、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端根据意图类型,通过移动终端和/或车端执行得到的用户明确意图,包括:云端在确定用户明确意图的意图类型为查询意图的情况下,若确定第一用户满足查询条件,则根据用户明确意图向车端发送用户明确意图对应的查询指令;车端接收查询指令,根据查询指令得到查询结果信息,并将查询结果信息发送至云端;云端接收查询结果信息,根据查询结果信息和模板信息生成第三信息,将第三信息发送给移动终端;移动终端接收第三信息,并向第一用户呈现第三信息,以继续与第一用户的会话。
42、采用上述方案,若为查询意图,则云端根据用户明确意图获取查询指令,并将查询指令发送至车端,车端反馈查询结果信息,云端将查询结果信息发送至移动终端,移动终端呈现目标信息。并且涉及到针对目标设备的查询指令时,进行用户鉴权认证,在用户具备权限的情况下,再控制目标设备进行指令的执行。如此,在使得语音识别处理和执行多样化的同时,提升了指令下发和执行的安全性。
43、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端根据意图类型,通过移动终端和/或车端执行得到的用户明确意图,包括:云端在确定用户明确意图的意图类型为设置意图的情况下,若确定第一用户具备车辆控制权限,并且车端具备执行用户明确意图的能力,向车端发送用户明确意图对应的控制指令;车端接收并执行控制指令,生成指令标识信息和指令执行结果信息,将指令标识信息和指令执行结果信息发送至云端;云端接收指令标识信息和指令执行结果信息,将指令标识信息发送至移动终端;移动终端接收指令标识信息,在确定查询指令执行结果的情况下,根据指令标识信息从云端获取对应的指令执行结果信息,并向第一用户呈现指令执行结果信息,以继续与第一用户的会话。
44、采用上述方案,若为设置意图,则云端根据用户明确意图确定控制指令,并在根据用户信息确定用户具备设置权限,且主动获取汽车状态信息,在根据汽车状态信息确定汽车具备执行该用户明确意图对应的控制指令的情况下,将对应的以对汽车设备进行控制的控制指令发送至车端。车端接收并执行控制指令,生成指令标识信息和指令执行结果信息,将指令标识信息和指令执行结果信息发送至云端。云端接收指令标识信息和指令执行结果信息,将指令标识信息发送至移动终端。移动终端接收指令标识信息,在确定查询指令执行结果的情况下,根据指令标识信息从云端获取对应的指令执行结果信息,并向第一用户呈现指令执行结果信息,以继续与第一用户的会话。如此,在使得语音识别处理和执行多样化的同时,提升了指令下发和执行的安全性。并且,移动终端基于指令执行结果信息获取指令执行结果信息,可以直接进行新的语音交互,无需等待执行结果,提升用户体验。
45、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,该方法还包括:云端若确定第一用户不具备车辆控制权限和/或车端不具备执行用户明确意图的能力,向移动终端发送控制指令执行失败的通知信息;移动终端接收通知信息,向第一用户呈现通知信息,以继续与第一用户的会话。
46、采用上述方案,云端若确定第一用户不具备车辆控制权限和/或车端不具备执行用户明确意图的能力,向移动终端发送控制指令执行失败的通知信息,移动终端接收通知信息,向第一用户呈现通知信息,以继续与第一用户的会话。确保了车端的安全性。
47、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端在确定用户明确意图的意图类型为设置意图的情况下,该方法还包括:移动终端若在预设时间内未接收到云端发送来的针对第一语音的响应信息,移动终端结束针对第一语音的语音识别处理,生成第四信息,并向第一用户呈现第四信息,以继续与第一用户的会话。
48、采用上述方案,如果超过移动终端的语音助手的等待时间,还未收到相应信息,则会提前终止此次语音对话。如此,无需作长时间的等待,影响用户体验。
49、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端根据意图类型,通过移动终端和/或车端执行得到的用户明确意图,包括:云端在确定用户明确意图的意图类型为场景意图的情况下,确定车端的状态信息,根据用户明确意图和状态信息确定目标规划方案信息,并将目标规划方案信息发送至移动终端;移动终端接收目标规划方案信息,向用户呈现目标规划方案信息,以继续与第一用户的会话。
50、采用上述方案,云端在基于第一意图识别结果确定第一语音为用户明确意图,并确定用户明确意图的意图类型为场景意图,主动获取车端状态信息,根据用户意图识别模型识别出的用户明确意图和状态信息确定目标规划方案信息,并将目标规划方案信息发送至移动终端。如此,能够为用户提供目标规划方案信息,方便用户基于语音的方式得到想要的结果。
51、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,云端根据意图类型,通过移动终端和/或车端执行得到的用户明确意图,包括:云端在确定用户明确意图的意图类型为查询意图、设置意图、场景意图以外的意图类型的情况下,将用户意图识别模型根据用户明确意图确定的目标内容信息进行合规性校验后发送至移动终端;移动终端接收目标内容信息,并向用户呈现目标内容信息,以继续与第一用户的会话。
52、采用上述方案,云端直接将用户意图识别模型返回的用户明确意图对应的目标内容信息进行合规性校验之后,返回至移动终端,移动终端向用户呈现目标内容信息,并等待与用户继续对话。如此,用户意图识别模型能够直接基于用户的语音内容信息得到目标内容信息。
53、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,还方法还包括:移动终端通过语音播报的方式和/或界面显示的方式向第一用户呈现对应信息。
54、如此,提供多种呈现方式,方便用户清楚知晓返回的内容。
55、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,该方法还包括:云端通过用户意图识别模型针对第一语音所属会话中的第一个用户语音进行用户意图识别处理的过程中,得到第一语音所属会话的会话标识信息,以用于标识同一会话;云端和移动终端在进行信息传输的过程中,携带会话标识信息。
56、采用上述方案,基于会话标识信息能够基于历史会话信息进行用户意图识别,使得识别出的结果更准确,更符合用户需求。
57、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,该方法还包括:移动终端在确定移动终端满足第一条件的情况下,生成会话显示信息,并通过界面显示的方式将会话显示信息呈现给第一用户。
58、采用上述方案,能够在会话内容满足第一条件时,生成会话结果内容呈现给用户。如此,方便用户对会话结果内容的查看。
59、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,该方法还包括:云端在第一语音所属会话结束后,保存会话内容信息,并根据会话内容信息更新用户意图识别模型,或者更新第一用户的用户特征信息。
60、采用上述技术方案,基于会话内容信息更新用户意图识别模型,或者更新用户的用户特征信息,方便在接收到新的语音时,基于最新的用户意图识别模型,或者基于最新的用户特征信息进行后续处理,使得语音识别处理更符合用户需求。
61、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,移动终端和车端通过移动终端对应的用户标识信息绑定。
62、采用上述方案,方便云端根据用户标识信息确定用户是否对车端具有控制权限,使得对车端的控制更为安全。
63、第三方面,本技术的实现方式还公开了另一种语音识别处理方法,应用于语音识别处理系统,语音识别处理系统包括移动终端和车端,该方法包括:移动终端接收第一用户的第一语音,确定第一语音对应的第一语音内容信息,并通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理,得到第一意图识别结果,第一语音为与车端相关的用户语音;移动终端基于第一意图识别结果若得到用户明确意图,则通过移动终端和/或车端执行得到的用户明确意图;移动终端基于第一意图识别结果若无法得到用户明确意图,则生成意图确认信息,并向第一用户呈现意图确认信息,以继续与第一用户的会话,并获取第一用户针对意图确认信息的响应情况信息,根据响应情况信息进行对应处理。
64、根据本技术的另一种具体实现方式,本技术的实现方式公开的一种语音识别处理方法,语音识别处理系统还包括云端,移动终端和车端之间通过云端进行信息传输。
65、本技术实现方式中,将用户意图识别模型设置在移动终端,移动终端在接收到用户的语音后,将语音转换为语音内容信息,并输入至用户意图识别模型进行用户意图识别处理,得到第一意图识别结果,并进行后续的语音识别处理。如此,移动终端能够直接进行语音识别处理,加快语音识别处理的效率。
66、第四方面,本技术的实现方式还公开了另一种语音识别处理方法,应用于语音识别处理系统,语音识别处理系统包括车端,方法包括:车端接收第一用户的第一语音,确定第一语音对应的第一语音内容信息,并通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理,得到第一意图识别结果,第一语音为与车端相关的用户语音;车端基于第一意图识别结果若得到用户明确意图,则通过车端执行得到的用户明确意图;车端基于第一意图识别结果若无法得到用户明确意图,则生成意图确认信息,并向第一用户呈现意图确认信息,以继续与第一用户的会话,并获取第一用户针对意图确认信息的响应情况信息,根据响应情况信息进行对应处理。
67、本技术实现方式中,若为车端进行语音识别处理,车端中存储预先训练好的用户意图识别模型,以进行语音识别处理。车端的语音助手接收用户的语音,并进行语音识别处理。如此,能够实现车端的语音识别处理。
68、第五方面,本技术的实现方式还公开了另一种语音识别处理方法,包括:确定第一语音;在根据第一语音得到第一语音对应的用户明确意图的情况下,根据第一语音对应的用户明确意图进行第一处理;在根据第一语音无法得到第一语音对应的用户明确意图的情况下,根据第一语音生成意图确认信息,并确定用户针对意图确认信息的响应情况信息,根据响应情况信息进行第二处理。
69、本技术实现方式中,在接收到第一语音后,在根据第一语音得到第一语音对应用户明确意图的情况下,例如在第一语音中包括预先设定好的语音指令的情况下,根据第一语音对应的用户明确意图进行第一处理,在根据第一语音无法得到第一语音对应的用户明确意图的情况下,例如在第一语音中不包括预先设定好的语音指令的情况下,根据第一语音生成意图确认信息,并确定用户针对意图确认信息的响应情况信息,根据响应情况信息进行第二处理。如此,即使用户提前未熟记用户指令,例如在用户的第一语音中未包括设定好的语音指令的情况下,也能够基于用户语音进一步与用户进行交互以获取用户响应,并根据用户响应情况进行第二处理,因此,即使用户的语音指令不明确,仍然能够进行后续语音识别处理,并进行相应处理,提升用户体验。
70、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,该方法还包括,通过以下方式确定根据第一语音是否得到第一语音对应的用户明确意图:确定第一语音的第一语音内容消息;将第一语音内容消息输入至用户意图识别模型进行意图识别处理;在用户意图识别模型识别出第一语音内容消息对应的用户意图的情况下,确定根据第一语音得到第一语音对应的用户明确意图;在用户意图识别模型未识别出第一语音内容消息对应的用户意图的情况下,确定根据第一语音无法得到第一语音对应的用户明确意图。
71、采用上述技术方案,基于用户意图识别模型确定能否识别出第一语音的第一语音内容消息对应的用户意图,以确定是否能够得到第一语音对应的用户明确意图,如此,能够对第一语音进行识别处理,以在得到用户明确意图的情况下进行第一处理,以在未得到用户明确意图的情况下,基于意图确认信息进行第二处理,因此,即使用户发出的语音不是预设的指令,仍然能够对语音进行识别,提升用户体验。
72、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,根据第一语音生成意图确认信息,包括:确定第一语音的第一语音内容消息,以及确定第一语音对应的第一特征信息;根据第一语音内容消息和第一特征信息生成意图确认信息。
73、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,第一特征信息包括第一语音对应用户的用户特征信息和/或第一交互信息,第一交互信息为第一语音所属语音会话中第一语音之前的会话交互信息。
74、采用上述技术方案,能够基于用户特征信息和上一次语音的会话交互信息确定意图确认信息,以使意图确认信息更符合用户特征,更贴合用户需求,提升用户通过语音助手实现某一指令的体验感。
75、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,用户特征信息基于用户对应的历史语音会话中的交互信息得到。
76、采用上述技术方案,可以基于语音的前后会话内容,确定用户特征信息,如此,使得对语音的识别处理操作更符合该用户特征,更贴合该用户需求。
77、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,根据响应情况信息进行第二处理,包括:在确定用户针对意图确认信息未作出响应的情况下,结束针对第一语音的意图识别处理;在确定用户针对意图确认信息作出响应的情况下,确定用户响应内容,并根据用户响应内容进行对应处理。
78、采用上述技术方案,若用户未对意图确认信息作出响应,则结束意图识别处理,等待新语音。若用户对意图确认信息作出响应,则确定用户响应内容,根据用户响应内容进行对应处理。如此,即便在语音不明确的情况下,仍然能够对语音进行处理。
79、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,根据用户响应内容进行对应处理,包括:在根据用户响应内容得到第一语音对应的用户明确意图的情况下,根据得到的用户明确意图进行第一处理;在根据用户响应内容无法得到第一语音对应的用户明确意图的情况下,结束针对第一语音的意图识别处理。
80、采用上述技术方案,在语音识别不明确时,基于指令确认信息和用户进行交互,以在根据用户响应内容得到用户明确意图的情况下,根据用户明确意图进行第一处理,以在未得到用户明确指令时,结束意图识别处理。如此,即使用户的语音为不清楚的,仍然能够通过语音进行识别处理得到用户明确意图,提高了语音识别的准确性。
81、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,在根据用户响应内容无法得到第一语音对应的用户明确意图的情况下,方法还包括:若确定用户响应内容中包括与意图确认信息不相关的第二语音,则开启针对第二语音的意图识别处理。
82、采用上述技术方案,若在进行意图确认信息的确认时,基于用户响应内容得到第二语音,则对第二语音进行意图识别处理。
83、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,根据第一语音对应的用户明确意图进行第一处理,包括:确定用户明确意图的意图类型;根据意图类型,进行对应处理。
84、采用上述技术方案,对能够得到用户明确意图的语音,可以基于意图类型,进行不同方式的处理。如此,使得语音识别处理方式更多样化。
85、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,根据意图类型,进行对应处理,包括:在用户明确意图的意图类型为查询意图的情况下,若用户具备查询权限,根据用户明确意图获取目标设备的目标信息,并向用户呈现目标信息;在用户明确指令的意图类型为设置意图的情况下,若用户具备查询权限,并且用户明确意图对应的目标设备具备执行用户明确意图的能力,控制目标设备执行用户明确意图;在用户明确意图的意图类型为场景意图的情况下,根据用户明确意图确定目标规划方案,并向用户呈现目标规划方案;在用户明确意图的意图类型为查询意图、手设置意图、场景意图以外的一天类型的情况下,根据用户明确意图确定目标内容,并向用户呈现目标内容。
86、采用上述技术方案,在意图类型不同的情况下,处理方式不同,并且涉及到针对目标设备的查询意图或者控制意图时,进行用户鉴权认证,在用户具备权限的情况下,再控制目标设备进行意图的执行。如此,在使得语音识别处理和执行多样化的同时,提升了指令下发和执行的安全性。
87、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,该方法还包括:在确定第一语音所属语音会话的会话内容满足第一条件的情况下,生成会话结果内容并呈现给用户。
88、采用上述技术方案,能够在会话内容满足第一条件时,生成会话结果内容呈现给用户。如此,方便用户对会话结果内容的查看。
89、根据本技术的另一种具体实施方式,本技术的实施方式公开的一种语音识别处理方法,该方法还包括:基于第一语音所属语音会话的会话内容更新用户的用户特征信息。
90、采用上述技术方案,基于会话内容更新用户的用户特征信息,方便在接收到新的语音时,基于用户特征信息进行后续处理,使得语音识别处理更符合用户需求。第六方面,本技术的实现方式还提供了一种语音识别处理装置,用于执行上述第一方面具体实现方式提供的语音识别处理方法,包括:第一处理模块,用于确定第一用户的第一语音,并确定第一语音对应的第一语音内容信息;第二处理模块,用于通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理,得到第一意图识别结果;第三处理模块,用于基于第一意图识别结果若得到用户明确意图,则执行得到的用户明确意图;第四处理模块,用于基于第一意图识别结果若无法得到用户明确意图,则生成意图确认信息,向第一用户呈现意图确认信息,以继续与第一用户的会话,并确定第一用户针对意图确认信息的响应情况信息,根据响应情况信息进行对应处理。
91、第七方面,本技术的实现方式还提供了一种电子设备,包括:存储器,用于存储计算机程序,计算机程序包括程序指令;处理器,用于执行程序指令,以使电子设备执行上述第一方面和/或第一面的任意一种可能的实现方式所提供的语音识别处理方法,或者执行上述第五方面和/或第五方面的任意一种可能的实现方式所提供的语音识别处理方法。
92、第八方面,本技术的实现方式还提供了一种计算机可读取存储介质,计算机可读取存储介质存储有计算机程序,计算机程序包括程序指令,程序指令被电子设备运行以使执行上述第一方面和/或第一方面的任意一种可能的实现方式所提供的语音识别处理方法,或者执行上述第五方面和/或第五方面的任意一种可能的实现方式所提供的语音识别处理方法。
93、第九方面,本技术的实现方式还提供了一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现上述第一方面和/或第一方面的任意一种可能的实现方式所提供的语音识别处理方法,或者执行上述第五方面和/或第五方面的任意一种可能的实现方式所提供的语音识别处理方法。
本文地址:https://www.jishuxx.com/zhuanli/20240618/21215.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。