技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于语法的人机交互方法及系统与流程  >  正文

基于语法的人机交互方法及系统与流程

  • 国知局
  • 2024-08-30 14:31:04

本发明涉及人机交互技术,尤其涉及一种基于语法的人机交互方法及系统。

背景技术:

1、以目前普遍的车载语音交互系统为例,其交互领域主要包含:导航、电话、音乐、车体控制、电影、新闻、股票、天气、火车票、飞机票等,这些领域涉及到不同的页面,每个页面中有特定的页面布局,包括:按钮、图标、文字等信息,同一个指令在不同的页面下可能表达的意图不同,且不同的页面下能够进行交互的意图也不同,具体体现在以下几点:

2、一、页面布局的差异。比如:有些页面下可以进行“翻页”操作,有些页面则不能;有些页面下“下拉菜单”是音乐列表,有些则是网络电台;

3、二、个性化数据的差异。个性化数据包含两类,一类是静态的keyword,如:标题栏、菜单栏、音乐流派等;另一类则是随着网络信息不断在更新变化的,如:热门电影、热门歌曲、热门新闻等;

4、三、不同的应用页面可能对同样的文本请求存在符合自己业务逻辑的不同理解,因此应用层也需要自己能够自定义一些理解意图。

5、目前基于领域的识别和理解需要结合具体的应用做深度的领域定制,来解决上述问题,尤其是一些应用页面功能较多且复杂的场景,而这种深度的定制需要花费较多的人力去研发,以及后期的维护,因此需要一种通用的技术手段,能够准确地识别并理解用户在当前可见的交互页面下的合理交互,以提高人机交互的成功率,让交互更加自然、流畅,不用做深度的领域定制。

技术实现思路

1、本发明实施例提供一种基于语法的人机交互方法及系统,至少能够解决现有技术中部分问题,也即解决不同应用、不同领域交互界面下,不需要对识别、理解引擎做深度定制,能够准确地识别并理解出当前页面下可以看到以及想到的交互。

2、本发明实施例的第一方面,

3、提供一种基于语法的人机交互方法,包括:

4、获取目标用户的语音信息,根据每个应用页面的业务逻辑定义与所述业务逻辑对应的语法规则,获取所述语法规则中所有的句子和命令,确定所述应用页面的交互语法;

5、确定所述交互语法中的语法元素,其中,所述语法元素包括词汇、短语以及句式中至少一种,基于所述语法元素定义交互状态,当所述交互状态转换时,为每种交互状态设定转换权重并设置转换规则,根据所述交互状态和所述转换规则设定交互状态机;

6、基于所述交互状态机,对所述语音信息进行解析得到解析信息,通过所述交互状态机映射所述解析信息对应的意图信息。

7、在一种可选的实施方式中,

8、根据每个应用页面的业务逻辑定义与所述业务逻辑对应的语法规则,获取所述语法规则中所有的句子和命令,确定所述应用页面的交互语法包括:

9、分析每个应用页面的目的和功能,确定目标用户在所述应用页面的潜在操作信息,其中,所述潜在操作信息包括查询信息、播放娱乐信息以及导航中至少一种;

10、为每项业务逻辑定义一套语法规则,所述语法规则用于描述目标用户的自然语言输入和系统命令语句;获取所述语法规则中所有的句子和命令,将所述句子和命令进行组合,形成完整的交互语法。

11、在一种可选的实施方式中,

12、确定所述交互语法中的语法元素,其中,所述语法元素包括词汇、短语以及句式中至少一种,基于所述语法元素定义交互状态,当所述交互状态转换时,为每种交互状态设定转换权重并设置转换规则,根据所述交互状态和所述转换规则设定交互状态机包括:

13、分析所述交互语法,从所述交互语法中提取语法元素,其中,所述语法元素包括词汇、短语以及句式中至少一种,并对所述语法元素进行分类,建立所述语法元素对应的索引;

14、基于所述语法元素定义交互状态,其中,所述交互状态包括初始状态、中间状态以及接受状态中至少一种,当所述交互状态转换时,为每种交互状态设定转换权重,其中,所述转换权重用于指示从一种交互状态转换到另一种交互状态的优先级;

15、获取目标用户的历史交互信息,并对所述历史交互信息进行聚类分析,确定所述历史交互信息对应的历史交互模式,确定所述交互模式与所述交互状态的匹配度,

16、若所述匹配度高于预设匹配阈值,则基于预设的映射关系确定与所述历史交互模式对应的转换规则;若所述匹配度低于或等于预设匹配阈值,则根据所述交互状态随机生成新的转换规则;

17、根据所述交互状态和所述转换规则设定交互状态机。

18、在一种可选的实施方式中,

19、当所述交互状态转换时,为每种交互状态设定转换权重包括:

20、w(si,sj)=f(ci,tij,hij);

21、其中,w(si,sj)表示由第i种交互状态si转换到第j种交互状态sj的转换权重,f()表示转换函数,ci表示第i种交互状态对应的上下文信息,tij表示由第i种交互状态转换到第j种交互状态的转换类型,hij表示由第i种交互状态转换到第j种交互状态对应的历史交互信息。

22、在一种可选的实施方式中,

23、基于所述交互状态机,对所述语音信息进行解析得到解析信息,通过所述交互状态机映射所述解析信息对应的意图信息包括:

24、基于自然语言处理技术对所述语音信息进行解析,结合所述交互状态机中的交互状态,确定所述语音信息对应的上下文信息,结合所述语音信息和所述上下文信息确定解析信息;

25、根据所述目标用户对应的当前状态、所述解析信息以及所述当前状态对应的转换权重,确定最优状态转换路径;

26、基于所述交互状态机中预设的规则引擎,结合所述最优状态转换路径,映射所述解析信息对应的意图信息。

27、在一种可选的实施方式中,

28、根据所述目标用户对应的当前状态、所述解析信息以及所述当前状态对应的转换权重,确定最优状态转换路径包括:

29、

30、其中,p*表示最优状态转换路径,p表示状态转换路径集合,si表示第i种交互状态,sj表示第j种交互状态,w(si,sj)表示由第i种交互状态si转换到第j种交互状态sj的转换权重,c(sj,i)表示第j种交互状态与解析信息i的匹配程度。

31、本发明实施例的第二方面,

32、提供一种基于语法的人机交互系统,包括:

33、第一单元,用于获取目标用户的语音信息,根据每个应用页面的业务逻辑定义与所述业务逻辑对应的语法规则,获取所述语法规则中所有的句子和命令,确定所述应用页面的交互语法;

34、第二单元,用于确定所述交互语法中的语法元素,其中,所述语法元素包括词汇、短语以及句式中至少一种,基于所述语法元素定义交互状态,当所述交互状态转换时,为每种交互状态设定转换权重并设置转换规则,根据所述交互状态和所述转换规则设定交互状态机;

35、第三单元,用于基于所述交互状态机,对所述语音信息进行解析得到解析信息,通过所述交互状态机映射所述解析信息对应的意图信息。

36、本发明实施例的第三方面,

37、提供一种电子设备,包括:

38、处理器;

39、用于存储处理器可执行指令的存储器;

40、其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。

41、本发明实施例的第四方面,

42、提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。

43、本技术通过为每项业务逻辑定义一套语法规则,系统能够更准确地理解用户的自然语言输入,使得用户与系统的交互更加自然流畅,这减少了用户在交互过程中的认知负担,提高了用户的满意度。通过获取并应用语法规则中的所有句子和命令,系统能够覆盖更广泛的用户表达方式,准确理解用户的意图,即使面对复杂或多变的用户输入;随着不同应用页面和业务逻辑的不断扩展,系统可以灵活地为新的业务逻辑添加相应的语法规则,从而适应各种新的用户需求和行为模式。通过明确的交互语法指导,用户可以更直观地理解如何与系统交互,减少了试错的次数,使得用户能够通过更少的步骤完成所需操作。

本文地址:https://www.jishuxx.com/zhuanli/20240830/282426.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。