技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于语义理解的离线语音命令词存储方法与流程  >  正文

一种基于语义理解的离线语音命令词存储方法与流程

  • 国知局
  • 2024-06-21 11:49:21

本发明属于语音识别,具体涉及一种基于语义理解的离线语音命令词存储方法。

背景技术:

1、基于语音识别设备本地离线命令词的语音识别,因受本地资源的限制,通常仅支持1000条以下命令词的识别,而在做语言模型时,语音的输入和文本的输出是一一对应的,如表1:

2、表1 现有技术命令词输入输出表

3、 语义标签 输入 输出 命令词类型 1 智能管家 智能管家 唤醒词 2 打开风扇 打开风扇 命令词 2 开启风扇 开启风扇 命令词 3 关闭风扇 关闭风扇 命令词 3 关掉风扇 关掉风扇 命令词

4、随着识别算法的迭代更新,基于语义理解的离线识别模型可支持的词条更多,通常比离线命令词模型多出数量级,可以轻松识别数万或数十万的命令词,离线识别模型增加命令词识别的好处在于:对同一个语义的命令词,可以做更多的说法;如,“打开风扇”有如下多种说法:打开风扇、开启风扇、启动风扇、开下风扇、请打开风扇、请开启风扇、请启动风扇、请开下风扇、帮我打开风扇、帮我开启风扇、帮我启动风扇、帮我开下风扇等。但同时也引入了新的问题:可识别命令词的增加,对应命令词的输出也会增加,从而使内存的消耗增加,一定程度上又影响了命令词的持续增加。

技术实现思路

1、针对上述现有技术存在的缺陷,本发明公开了一种基于语义理解的离线语音命令词存储方法。

2、本发明所述基于语义理解的离线语音命令词存储方法,包括如下步骤:

3、步骤1:对命令词库中的每一命令词,设置最小功能词文本和最小功能词文本对应的语义标签,标记命令词的类型;命令词的类型包括唤醒词和常规命令词;

4、步骤2:对每一最小功能词文本,根据预设的罗列规则罗列全部功能泛化词,

5、功能泛化词,是表达形式与最小功能词文本可能不同,但含义完全相同的词;

6、每个功能泛化词,划分为一个或多个分词的组合形式;

7、罗列规则包括:

8、规则1:对唤醒词,设置唯一的与最小功能词文本完全相同的功能泛化词;

9、规则2:设置组合符号,表示一个完整的分词组合,组合符号内可定义有输出分词,以输出分词作为最小功能词的部分文本输出,一般选择第一个分词;

10、规则3:设置“或”符号,表示可替换词,在分词组合内部使用时表示相互可替换的分词;

11、规则4:设置前后缀符号,表示可忽略的分词;

12、步骤3:对每一个最小功能词文本,利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储。

13、步骤4:语音设备在听到用户发出的语音命令时,识别出语音命令文本后,与功能泛化词比对,完全相同的则找到对应的最小功能词文本,执行该最小功能词文本对应的语音命令。

14、优选的,所述步骤1中,命令词的类型还包括负性词;

15、所述步骤2中,设置规则5:对于负性词,设置负性词定义符号。

16、优选的,所述步骤2中,设置规则6:设置特别定义符号,定义特殊功能泛化词。

17、优选的,所述设置组合符号为“[]”,“或”符号为“/”,前后缀符号为“<>”。

18、优选的,所述步骤3中,单独利用或符号罗列出功能泛化词。

19、本发明所述提升基于语义理解的离线语音命令词存储方法,采用规则对命令词进行枚举,根据不同的句型或局式对输出进行归一,实现所有命令词对应唯一的文本,利用组合方式降低了命令词存储空间和对应文本的存储空间,从而降低了语音设备端侧的存储空间要求。

技术特征:

1.一种基于语义理解的离线语音命令词存储方法,其特征在于,包括如下步骤:

2.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述步骤1中,命令词的类型还包括负性词;所述步骤2中,设置规则5:对于负性词,设置负性词定义符号。

3.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述步骤2中,设置规则6:设置特别定义符号,定义特殊功能泛化词。

4.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述设置组合符号为“[]”,“或”符号为“/”,前后缀符号为“<>”。

5.如权利要求4所述的离线语音命令词存储方法,其特征在于,所述步骤3中,单独利用或符号罗列出功能泛化词。

技术总结一种基于语义理解的离线语音命令词存储方法,属于语音识别技术领域,包括如下步骤。步骤1:对命令词库中的每一命令词,设置最小功能词文本和最小功能词对应的语义标签,标记命令词的类型;步骤2:对每一最小功能词文本,罗列全部功能泛化词;步骤3:对每一个最小功能词文本,利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储,步骤4:语音设备识别出功能泛化词,执行最小功能词文本对应的语音命令。本发明所述提升基于语义理解的离线语音命令词存储方法,采用规则对命令词进行枚举,实现所有命令词对应唯一的文本,利用组合方式降低了命令词存储空间和对应文本的存储空间,从而降低了语音设备端侧的存储空间要求。技术研发人员:陈思应,何云鹏受保护的技术使用者:成都启英泰伦科技有限公司技术研发日:技术公布日:2024/5/6

本文地址:https://www.jishuxx.com/zhuanli/20240618/23761.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。