技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于语义理解的离线语音命令词存储方法与流程 > 正文

一种基于语义理解的离线语音命令词存储方法与流程

国知局
2024-06-21 11:49:21

本发明属于语音识别，具体涉及一种基于语义理解的离线语音命令词存储方法。

背景技术：

1、基于语音识别设备本地离线命令词的语音识别，因受本地资源的限制，通常仅支持1000条以下命令词的识别，而在做语言模型时，语音的输入和文本的输出是一一对应的，如表1：

2、表1 现有技术命令词输入输出表

3、语义标签输入输出命令词类型 1 智能管家智能管家唤醒词 2 打开风扇打开风扇命令词 2 开启风扇开启风扇命令词 3 关闭风扇关闭风扇命令词 3 关掉风扇关掉风扇命令词

4、随着识别算法的迭代更新，基于语义理解的离线识别模型可支持的词条更多，通常比离线命令词模型多出数量级，可以轻松识别数万或数十万的命令词，离线识别模型增加命令词识别的好处在于：对同一个语义的命令词，可以做更多的说法；如，“打开风扇”有如下多种说法：打开风扇、开启风扇、启动风扇、开下风扇、请打开风扇、请开启风扇、请启动风扇、请开下风扇、帮我打开风扇、帮我开启风扇、帮我启动风扇、帮我开下风扇等。但同时也引入了新的问题：可识别命令词的增加，对应命令词的输出也会增加，从而使内存的消耗增加，一定程度上又影响了命令词的持续增加。

技术实现思路

1、针对上述现有技术存在的缺陷，本发明公开了一种基于语义理解的离线语音命令词存储方法。

2、本发明所述基于语义理解的离线语音命令词存储方法，包括如下步骤：

3、步骤1：对命令词库中的每一命令词，设置最小功能词文本和最小功能词文本对应的语义标签，标记命令词的类型；命令词的类型包括唤醒词和常规命令词；

4、步骤2：对每一最小功能词文本，根据预设的罗列规则罗列全部功能泛化词，

5、功能泛化词，是表达形式与最小功能词文本可能不同，但含义完全相同的词；

6、每个功能泛化词，划分为一个或多个分词的组合形式；

7、罗列规则包括：

8、规则1：对唤醒词，设置唯一的与最小功能词文本完全相同的功能泛化词；

9、规则2：设置组合符号，表示一个完整的分词组合，组合符号内可定义有输出分词，以输出分词作为最小功能词的部分文本输出，一般选择第一个分词；

10、规则3：设置“或”符号，表示可替换词，在分词组合内部使用时表示相互可替换的分词；

11、规则4：设置前后缀符号，表示可忽略的分词；

12、步骤3：对每一个最小功能词文本，利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储。

13、步骤4：语音设备在听到用户发出的语音命令时，识别出语音命令文本后，与功能泛化词比对，完全相同的则找到对应的最小功能词文本，执行该最小功能词文本对应的语音命令。

14、优选的，所述步骤1中，命令词的类型还包括负性词；

15、所述步骤2中，设置规则5：对于负性词，设置负性词定义符号。

16、优选的，所述步骤2中，设置规则6：设置特别定义符号，定义特殊功能泛化词。

17、优选的，所述设置组合符号为“[]”,“或”符号为“/”,前后缀符号为“<>”。

18、优选的，所述步骤3中，单独利用或符号罗列出功能泛化词。

19、本发明所述提升基于语义理解的离线语音命令词存储方法，采用规则对命令词进行枚举，根据不同的句型或局式对输出进行归一，实现所有命令词对应唯一的文本，利用组合方式降低了命令词存储空间和对应文本的存储空间，从而降低了语音设备端侧的存储空间要求。

技术特征：

1.一种基于语义理解的离线语音命令词存储方法，其特征在于，包括如下步骤：

2.如权利要求1所述的离线语音命令词存储方法，其特征在于，所述步骤1中，命令词的类型还包括负性词；所述步骤2中，设置规则5：对于负性词，设置负性词定义符号。

3.如权利要求1所述的离线语音命令词存储方法，其特征在于，所述步骤2中，设置规则6：设置特别定义符号，定义特殊功能泛化词。

4.如权利要求1所述的离线语音命令词存储方法，其特征在于，所述设置组合符号为“[]”,“或”符号为“/”,前后缀符号为“<>”。

5.如权利要求4所述的离线语音命令词存储方法，其特征在于，所述步骤3中，单独利用或符号罗列出功能泛化词。

技术总结一种基于语义理解的离线语音命令词存储方法，属于语音识别技术领域，包括如下步骤。步骤1：对命令词库中的每一命令词，设置最小功能词文本和最小功能词对应的语义标签，标记命令词的类型；步骤2：对每一最小功能词文本，罗列全部功能泛化词；步骤3：对每一个最小功能词文本，利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储，步骤4：语音设备识别出功能泛化词，执行最小功能词文本对应的语音命令。本发明所述提升基于语义理解的离线语音命令词存储方法，采用规则对命令词进行枚举，实现所有命令词对应唯一的文本，利用组合方式降低了命令词存储空间和对应文本的存储空间，从而降低了语音设备端侧的存储空间要求。技术研发人员：陈思应,何云鹏受保护的技术使用者：成都启英泰伦科技有限公司技术研发日：技术公布日：2024/5/6