技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于智能外设的大屏语音识别方法与流程  >  正文

一种基于智能外设的大屏语音识别方法与流程

  • 国知局
  • 2024-06-21 11:33:35

本发明涉及一种语音识别方法,具体为基于智能外设的大屏语音识别方法,属于语音识别。

背景技术:

1、语音识别技术,也被称为自动语音识别,就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。

2、随着科技和社会的发展,智能电视已普及大众家庭。智能电视成为家庭娱乐的中心,并且改变了家庭娱乐的方式。传统电视只能提供有限的节目选择,而智能电视拥有广泛的内容资源,用户可以根据自己的兴趣和喜好选择观看的节目。智能电视在市场上的需求不断增加。随着消费者对互联网体验和流媒体的需求不断增加,智能电视已经成为刚需。随着智能技术的不断提升和应用丰富性的不断增加。而传统的电视操控方式已渐渐凸显缺陷。

3、传统的智能电视在进行操控时,通常需要电视用户利用电视遥控器来操控电视应用,对于应用操作性较强的功能,存在操作不便的问题;而电视厂商或者电视机顶盒的厂商配置具备语音功能的遥控器,存在只能适配本机产品的局限性,而这类功能通常需要软硬件结合的支持才能进行使用,为此,提出一种基于智能外设的大屏语音识别方法。

技术实现思路

1、有鉴于此,本发明提供一种基于智能外设的大屏语音识别方法,以解决或缓解现有技术中存在的技术问题,至少提供有益的选择。

2、本发明实施例的技术方案是这样实现的:一种基于智能外设的大屏语音识别方法,包括以下步骤:

3、s1、采集用户语音数据,并传输至服务器中台;

4、s2、中台通过第三方语音识别接口进行数据识别,获取原始的文字结果;

5、s3、将文字结果转化为中文拼音数据;

6、s4、通过sokect网络连接中台和大屏系统,获取大屏系统场景信息;

7、s5、将拼音数据与场景信息结合,增强识别精度;

8、s6、中台反馈指令至大屏系统。

9、进一步优选的,所述s1中,通过利用智能外设配合内置程序采集用户语音数据,智能外设通过socket网络链接服务器中台,用于进行数据传输;

10、其中,智能外设为手机、笔记本电脑或语音遥控器;

11、其中,内置程序为手机小程序、电脑程序或烧录程序,用于对采集的语音数据进行优化及修正处理。

12、进一步优选的,所述s2中,第三方语音识别接口为百度、腾讯、阿里或讯飞开放式语音识别接口,用于对数据进行识别。

13、进一步优选的,所述s3中,通过将文字结果转化为中文拼音数据,用于进行中文拼音增强。

14、进一步优选的,所述s4中,通过利用sokect网络,将服务器中台与大屏系统,用以实时接收大屏系统的场景信息;

15、其中,大屏系统为智能电视系统、tv娱乐互动系统、数字电视系统或投影系统。

16、进一步优选的,所述s5中还包括以下步骤:

17、s51、中文拼音分支适配;

18、s52、根据场景配置适配热词;

19、s53、文字断句及关键词校验。

20、进一步优选的,所述s51中,通过易混淆的翘舌音、后鼻音进行分组,划分成近音字,提高识别精度。

21、进一步优选的,所述s52中,根据不同的场景,添加对应的热词,提高识别精度。

22、进一步优选的,所述s53中,通过对功能内容,进行断句和关键字校验,快速完成语料适配。

23、进一步优选的,所述s6中,通过服务器中台利用sokect网络将最终识别的指令反馈至大屏系统进行操控。

24、本发明实施例由于采用以上技术方案,其具有以下优点:本发明通过利用智能外设对用户语音进行采集,然后利用服务器中台配合内置程序及第三方语音识别接口对语音进行识别,从而无需特定的硬件进行支持,使语音遥控具有普适性,且可以利用内置程序结合场景信息辅助增强识别精度,提高了电视用户的便捷性和操控的友好度,大大降低了电视用户使用语音操控的门槛,即使没有特定语音遥控设备,也能进行语音识别操控。

25、上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。

技术特征:

1.一种基于智能外设的大屏语音识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于智能外设的大屏语音识别方法,其特征在于:所述s1中,通过利用智能外设配合内置程序采集用户语音数据,智能外设通过socket网络链接服务器中台,用于进行数据传输;

3.根据权利要求1所述的基于智能外设的大屏语音识别方法,其特征在于:所述s2中,第三方语音识别接口为百度、腾讯、阿里或讯飞开放式语音识别接口,用于对数据进行识别。

4.根据权利要求1所述的基于智能外设的大屏语音识别方法,其特征在于:所述s3中,通过将文字结果转化为中文拼音数据,用于进行中文拼音增强。

5.根据权利要求1所述的基于智能外设的大屏语音识别方法,其特征在于:所述s4中,通过利用sokect网络,将服务器中台与大屏系统,用以实时接收大屏系统的场景信息;

6.根据权利要求1所述的基于智能外设的大屏语音识别方法,其特征在于:所述s5中还包括以下步骤:

7.根据权利要求6所述的基于智能外设的大屏语音识别方法,其特征在于:所述s51中,通过易混淆的翘舌音、后鼻音进行分组,划分成近音字,提高识别精度。

8.根据权利要求6所述的基于智能外设的大屏语音识别方法,其特征在于:所述s52中,根据不同的场景,添加对应的热词,提高识别精度。

9.根据权利要求6所述的基于智能外设的大屏语音识别方法,其特征在于:所述s53中,通过对功能内容,进行断句和关键字校验,快速完成语料适配。

10.根据权利要求1所述的基于智能外设的大屏语音识别方法,其特征在于:所述s6中,通过服务器中台利用sokect网络将最终识别的指令反馈至大屏系统进行操控。

技术总结本发明提供了一种基于智能外设的大屏语音识别方法,包括以下步骤:S1、采集用户语音数据,并传输至服务器中台;S2、中台通过第三方语音识别接口进行数据识别,获取原始的文字结果;S3、将文字结果转化为中文拼音数据;S4、通过sokect网络连接中台和大屏系统;本发明通过利用智能外设对用户语音进行采集,然后利用服务器中台配合内置程序及第三方语音识别接口对语音进行识别,从而无需特定的硬件进行支持,使语音遥控具有普适性,且可以利用内置程序结合场景信息辅助增强识别精度,提高了电视用户的便捷性和操控的友好度,大大降低了电视用户使用语音操控的门槛,即使没有特定语音遥控设备,也能进行语音识别操控。技术研发人员:邱敬毅,陈俊龙受保护的技术使用者:上海阜腾科技股份有限公司技术研发日:技术公布日:2024/3/11

本文地址:https://www.jishuxx.com/zhuanli/20240618/22240.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。