技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音数据处理方法及相关装置与流程  >  正文

语音数据处理方法及相关装置与流程

  • 国知局
  • 2024-06-21 11:29:33

本申请属于互联网产业的一般数据处理,具体涉及一种语音数据处理方法及相关装置。

背景技术:

1、当前在进行语音数据处理时,需要先收集大量语料,然后根据收集的大量语料进行模型训练,以得到可以进行数据处理,得到语音数据包含的用户需求的模型,但由于收集到的用于训练的语料来源较少,且用于训练的语料的质量也无法保证,就会使得训练出的模型在语音数据处理时得到的用户需求不够准确。

技术实现思路

1、本申请实施例提供了一种语音数据处理方法及相关装置,以期实现不用搜集大量语料,且同时可以提高对用户语音数据处理的效率,和获取的用户意图的准确性。

2、第一方面,本申请实施例提供了一种语音数据处理方法,应用于电子设备,所述电子设备设置有语音服务引擎,所述方法包括:

3、根据用户输入的语音信息获取待处理文本;

4、确定所述语音服务引擎对应的目标服务类型;

5、根据所述目标服务类型从第一数据库中确定参考文本集合,所述参考文本集合中包括的所有参考文本均为所述目标服务类型对应的参考文本;

6、将所述待处理文本与所述参考文本集合中的参考文本进行相似度匹配,得到每个参考文本的第一匹配值;

7、确定所述参考文本集合中是否存在所述第一匹配值高于第一预设值的第一目标参考文本;

8、若是,则从第二数据库中确定所述第一目标参考文本对应的第一目标含义,确定所述第一目标含义为所述待处理文本对应的主要含义,所述第二数据库中包括所述参考文本集合中的参考文本和每个参考文本对应的含义;

9、若否,则对所述待处理文本进行文本替换,得到目标替换文本,并将所述目标替换文本与所述参考文本集合中的参考文本进行相似度匹配,得到所述每个参考文本的第二匹配值,确定所述第二匹配值高于第二预设值的参考文本为第二目标参考文本,从所述第二数据库中确定所述第二目标参考文本对应的第二目标含义,确定所述第二目标含义为所述待处理文本对应的主要含义;

10、根据所述主要含义和所述待处理文本确定所述待处理文本的最终含义,所述最终含义用于指示用户需求的服务内容。

11、第二方面,本申请实施例提供了一种语音数据处理装置,应用于电子设备,所述电子设备设置有语音服务引擎,所述装置包括:

12、第一获取单元,用于根据用户输入的语音信息获取待处理文本;

13、第一确定单元,用于确定所述语音服务引擎对应的目标服务类型;

14、第二确定单元,用于根据所述目标服务类型从第一数据库中确定参考文本集合,所述参考文本集合中包括的所有参考文本均为所述目标服务类型对应的参考文本;

15、第一匹配单元,用于将所述待处理文本与所述参考文本集合中的参考文本进行相似度匹配,得到每个参考文本的第一匹配值;

16、第三确定单元,用于确定所述参考文本集合中是否存在所述第一匹配值高于第一预设值的第一目标参考文本;

17、第四确定单元,用于若是,则从第二数据库中确定所述第一目标参考文本对应的第一目标含义,确定所述第一目标含义为所述待处理文本对应的主要含义,所述第二数据库中包括所述参考文本集合中的参考文本和每个参考文本对应的含义;

18、第五确定单元,用于若否,则对所述待处理文本进行文本替换,得到目标替换文本,并将所述目标替换文本与所述参考文本集合中的参考文本进行相似度匹配,得到所述每个参考文本的第二匹配值,确定所述第二匹配值高于第二预设值的参考文本为第二目标参考文本,从所述第二数据库中确定所述第二目标参考文本对应的第二目标含义,确定所述第二目标含义为所述待处理文本对应的主要含义;

19、第六确定单元,用于根据所述主要含义和所述待处理文本确定所述待处理文本的最终含义,所述最终含义用于指示用户需求的服务内容。

20、第三方面,本申请实施例供了一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行本申请实施例第一方面中的步骤的指令。

21、第四方面,本申请实施例提供了一种计算机存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如本实施例第一方面中所描述的部分或全部步骤。

22、第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

23、可见,本实例中,电子设备首先根据用户输入的语音信息获取待处理文本,然后确定所述语音服务引擎对应的目标服务类型,然后根据所述目标服务类型从第一数据库中确定参考文本集合,所述参考文本集合中包括的所有参考文本均为所述目标服务类型对应的参考文本,再然后将所述待处理文本与所述参考文本集合中的参考文本进行相似度匹配,得到每个参考文本的第一匹配值,再然后确定所述参考文本集合中是否存在所述第一匹配值高于第一预设值的第一目标参考文本,若是,则从第二数据库中确定所述第一目标参考文本对应的第一目标含义,确定所述目标含义为所述待处理文本对应的主要含义,所述第二数据库中包括所述参考文本集合中的参考文本和每个参考文本对应的含义,若否,则对所述待处理文本进行文本替换,得到目标替换文本,并将所述目标替换文本与所述参考文本集合中的参考文本进行相似度匹配,得到所述每个参考文本的第二匹配值,确定所述第二匹配值高于第二预设值的参考文本为第二目标参考文本,从所述第二数据库中确定所述第二目标参考文本对应的第二目标含义,确定所述第二目标含义为所述待处理文本对应的主要含义,最后根据所述主要含义和所述待处理文本的最终含义。这样可以通过相似度匹配将待处理文本转换为有明确含义的参考文本,以参考文本的含义来确定待处理文本的主要含义,然后在根据待处理文本共同确定最终的含义,这样可以提高对用户需求的确定的准确度,且也不用搜集大量语料来进行语音数据处理模型的训练,可以简化工作量,提高数据处理效率,降低开发难度。

技术特征:

1.一种语音数据处理方法,其特征在于,应用于电子设备,所述电子设备设置有语音服务引擎,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述待处理文本进行文本替换,得到目标替换文本,包括:

3.根据权要求2所述的方法,其特征在于,所述根据所述词库将所述第一替换文本中的可替换词替换为对应的参考词之后,所述方法包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一关键词将所述第二替换文本进行句型转换,得到所述目标替换文本,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述目标替换文本与所述参考文本集合中的参考文本进行相似度匹配,包括:

6.根据权利要求5所述的方法,其特征在于,所述第二关键词包括多个,所述根据所述最终重合率确定所述待处理文本与所述每个参考文本的匹配值,包括:

7.根据权利要求6所述的方法,其特征在于,所述确定所述备选参考文本包括的多个第二关键词之间的位置关系是否会影响所述备选参考文本的含义,包括:

8.一种语音数据处理装置,其特征在于,应用于电子设备,所述电子设备设置有语音服务引擎,所述装置包括:

9.一种电子设备,其特征在于,包括处理器、存储器,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。

10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行实现权利要求1-7任一项所述方法的步骤。

技术总结本申请提供了一种语音数据处理方法及相关装置,应用于电子设备,电子设备设置有语音服务引擎,包括:将待处理文本与根据语音服务引擎对应的目标服务类型从第一数据库中确定参考文本集合中的参考文本进行相似度匹配,根据匹配值确定目标含义,通过第二数据库确定目标含义对应的含义为待处理文本的主要含义,然后根据主要含义和待处理文本确定待处理文本的最终含义。这样可以通过相似度匹配将待处理文本转换为有明确含义的参考文本,提高对用户语音数据处理的效率,和获取的用户意图的准确度。技术研发人员:杨强受保护的技术使用者:厦门市齐悟智能科技有限公司技术研发日:技术公布日:2024/2/21

本文地址:https://www.jishuxx.com/zhuanli/20240618/21818.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。