技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频识别方法、装置、电子设备和存储介质与流程  >  正文

音频识别方法、装置、电子设备和存储介质与流程

  • 国知局
  • 2024-06-21 10:41:59

本申请涉及计算机,尤其涉及应用于智能可穿戴设备的音频识别方法、装置、电子设备、存储介质和计算机程序产品。

背景技术:

1、随着智能可穿戴设备的发展,音频识别技术在智能可穿戴设备例如智能眼镜、智能手表等设备中的应用越来越普遍,为用户提供了更为方便的人机交互方式,也提高了用户使用智能可穿戴设备的体验。

2、在智能可穿戴设备中,音频识别技术多采用的是识别音频中是否命中了离线命令词,若命中了某一个离线命令词,则结束识别并执行该离线命令词所对应的操作。但是目前的识别方案的音频识别结果的不准确;若要提高音频识别结果的准确性,则需要对音频中的同一帧(或者多帧)音频进行多次的重复计算,使得计算量较大,导致智能可穿戴设备的待机时间较长。因此,如何提高在智能可穿戴设备中音频识别结果的准确性以及如何节省算力十分重要。

技术实现思路

1、本申请实施例提供了应用于智能可穿戴设备的音频识别方法、装置、电子设备、存储介质和计算机程序产品,以解决上述一个或多个技术问题。

2、第一方面,本申请实施例提供了应用于智能可穿戴设备的音频识别方法,包括:执行语音端点检测,获取包括完整语句的待识别的音频数据;使用语音模型识别所述待识别的音频数据对应的文本内容;使用命令词库匹配所述文本内容,确定对应的目标命令词,在匹配到所述命令词库中多个命令词的情况下,所述目标命令词为匹配到的所述多个命令词中最长的命令词。

3、第二方面,本申请实施例提供了应用于智能可穿戴设备的音频识别装置,包括:音频数据获取模块,用于执行语音端点检测,获取包括完整语句的待识别的音频数据;文本内容识别模块,用于使用语音模型识别所述待识别的音频数据对应的文本内容;命令词匹配模块,用于使用命令词库匹配所述文本内容,确定对应的目标命令词,在匹配到所述命令词库中多个命令词的情况下,所述目标命令词为匹配到的所述多个命令词中最长的命令词。

4、第三方面,本申请实施例提供了电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的方法。

5、第四方面,本申请实施例提供了计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。

6、第五方面,本申请实施例提供了计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述任一项所述的方法。

7、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。

技术特征:

1.应用于智能可穿戴设备的音频识别方法,包括:

2.根据权利要求1所述的方法,其中,所述命令词库包括第一类命令词和第二类命令词,其中,所述第一类命令词为所述命令词库中至少一个其他命令词中的前缀词,所述第二类命令词为所述命令词库中不作为任意命令词的前缀词的命令词;

3.根据权利要求1所述的方法,其中,所述执行语音端点检测,获取包括完整语句的待识别的音频数据,包括:

4.根据权利要求3所述的方法,其中,所述执行语音端点检测,包括:

5.根据权利要求1所述的方法,其中,所述使用语音模型识别所述待识别的音频数据对应的文本内容,包括:

6.根据权利要求5所述的方法,其中,所述执行语音端点检测,获取包括完整语句的待识别的音频数据,包括:

7.根据权利要求5所述的方法,其中,所述提取所述待识别的音频数据的音频特征数据,包括:

8.根据权利要求5所述的方法,其中,所述统一解码所述待识别的音频数据对应的候选字符及其概率,得到所述待识别的音频数据对应的文本内容包括:

9.电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现权利要求1-8中任一项所述的方法。

10.计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法。

11.计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现权利要求1-8中任一项所述的方法。

技术总结本申请提供了应用于智能可穿戴设备的音频识别方法、装置、电子设备、存储介质和计算机程序产品,依据本申请实施例,先执行语音端点检测,获取包括完整语句的待识别的音频数据,再使用语音模型识别待识别的音频数据对应的文本内容,最后使用命令词库匹配文本内容,确定对应的目标命令词,在匹配到命令词库中多个命令词的情况下,目标命令词为匹配到的多个命令词中最长的命令词。上述音频识别的方法实现了对包括完整语句的音频数据的一次识别、精准匹配,提高了音频识别结果的准确性,节省了算力。技术研发人员:李林峰,黄海荣,彭文超,夏杰受保护的技术使用者:湖北星纪魅族集团有限公司技术研发日:技术公布日:2024/2/1

本文地址:https://www.jishuxx.com/zhuanli/20240618/21304.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。