技术新讯 > 乐器声学设备的制造及制作,分析技术 > 数据处理方法、装置、电子设备及存储介质与流程  >  正文

数据处理方法、装置、电子设备及存储介质与流程

  • 国知局
  • 2024-06-21 11:26:10

本发明涉及语音识别,尤其涉及一种数据处理方法、装置、电子设备及存储介质。

背景技术:

1、在人工智能不断发展的今天,尤其是chatgpt(聊天式生成式预训练模型,chatgenerative pre-trained transformer)类似的大模型不断迭代更新,语音交互助手已经很自然发展成为首选方式,我们在接触到的语音类助手中,都在无形中面临着一个问题,就是使用场景特别复杂,比如公交车站、地铁站、饭店、人流等等,语音助手都会收录很多嘈杂声音,包含噪声,人声,这些声音对于主要交互人来说,都属于无效的交互,这些无效交互会直接影响用户的体验,间接导致用户对于使用语音助手的满意度及使用频次,目前主要语音助手厂家都在无效交互拒识上投入很大精力,着力提升用户体验。

2、目前主流无效拒识方法或是从语音、文本两个单独方面去考虑,或者语音与文本组合的方式,无论是语音、文本或者语音与文本组合的方式,都没有在整个语音交互过程做全链路拒识,容易导致某个环节缺失,拒识效果不好,或者带来额外的计算开销。

3、因此,如何提高语音助手的无效交互拒识效果是目前亟需解决的技术问题。

技术实现思路

1、本发明实施例的目的是提供一种数据处理方法、装置、电子设备及存储介质,以解决现有的语音助手的无效交互拒识效果差的技术问题。

2、第一方面,本发明实施例提供了一种数据处理方法,包括:

3、获取语音交互场景下待处理的语音数据;

4、对所述语音数据进行第一拒识判断处理,以确定所述语音数据是否为噪声;

5、在所述语音数据不为噪声的情况下,通过目标拒识策略对所述语音数据进行第二拒识判断处理,以确定所述语音数据的目标无效概率,所述目标拒识策略包括部署在云端的第一拒识策略和第二拒识策略中的至少一个,所述目标无效概率用于表征所述语音数据为不可进行语音交互的语音数据的概率;

6、根据所述目标无效概率,确定所述语音交互场景下所述语音数据的识别结果。

7、第二方面,本发明实施例提供了一种数据处理装置,包括:

8、获取模块,用于获取语音交互场景下待识别的语音数据;

9、第一拒识模块,用于对所述语音数据进行第一拒识判断处理,以确定所述语音数据是否为噪声;

10、第二拒识模块,用于在所述语音数据不为噪声的情况下,通过目标拒识策略对所述语音数据进行第二拒识判断处理,以确定所述语音数据的目标无效概率,所述目标拒识策略包括部署在云端的第一拒识策略和第二拒识策略中的至少一个,所述目标无效概率用于表征所述语音数据为不可进行语音交互的语音数据的概率;

11、确定模块,用于根据所述目标无效概率,确定所述语音交互场景下所述语音数据的识别结果。

12、第三方面,本发明实施例提供了一种电子设备,电子设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的数据处理方法中的步骤。

13、第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的数据处理方法中的步骤。

14、本发明实施例提供了一种数据处理方法、装置、电子设备及存储介质,该方法通过将本地端与云端的拒识判断处理相结合,能够实现多层协同的拒识机制,采用该拒识机制对待处理的语音数据进行拒识判断,能够有效提高拒识效率和准确性。

技术特征:

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述目标无效概率,确定所述语音交互场景下所述语音数据的识别结果的步骤,包括:

3.根据权利要求2所述的方法,其特征在于,所述目标拒识策略为所述第一拒识策略;

4.根据权利要求3所述的方法,其特征在于,所述根据所述目标无效概率,生成拒识判断结果的步骤,包括:

5.根据权利要求2所述的方法,其特征在于,所述目标拒识策略为所述第一拒识策略和所述第二拒识策略;

6.根据权利要求5所述的方法,其特征在于,所述根据所述目标无效概率,生成拒识判断结果的步骤,包括:

7.根据权利要求1所述的方法,其特征在于,所述对所述语音数据进行第一拒识判断处理,以确定所述语音数据是否为噪声的步骤,包括:

8.一种数据处理装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法中的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法中的步骤。

技术总结本发明公开了一种数据处理方法、装置、电子设备及存储介质,该方法包括获取语音交互场景下待处理的语音数据,对语音数据进行第一拒识判断处理,以确定语音数据是否为噪声,在语音数据不为噪声的情况下,通过目标拒识策略对语音数据进行第二拒识判断处理,以确定语音数据的目标无效概率,目标拒识策略包括部署在云端的第一拒识策略和第二拒识策略中的至少一个,目标无效概率用于表征语音数据为不可进行语音交互的语音数据的概率,根据目标无效概率,确定语音交互场景下语音数据的识别结果。采用本发明实施例,通过将本地端与云端的拒识判断处理相结合,以通过多层协同的拒识机制对待处理的语音数据进行拒识判断,能够提高拒识效率和准确性。技术研发人员:解传栋受保护的技术使用者:OPPO广东移动通信有限公司技术研发日:技术公布日:2024/2/6

本文地址:https://www.jishuxx.com/zhuanli/20240618/21511.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。