技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音数据分析方法、装置、存储介质及电子设备与流程  >  正文

语音数据分析方法、装置、存储介质及电子设备与流程

  • 国知局
  • 2024-06-21 10:40:41

本申请涉及计算机,具体涉及一种语音数据分析方法、装置、存储介质及电子设备。

背景技术:

1、随着人工智能语音(ai语音)交互的不断发展,ai语音处理过程是由客户端到云端一系列查询(query)事件组成的链路,这些链路中产生的数据即源头的待分析的人工智能语音数据,相关企业面对的人工智能语音(ai语音)数据的量越来越大,数据变化也更加频繁,实时计算分析的需求日益增强。

2、目前,人工智能语音(ai语音)处理数据的分析方式,主要是获取语音数据,然后将语音数据存入数据仓库,然后从数据仓库同步到业务分析用到的数据库以进行分析,一方面,处理链路较长,另一方面,实时性较差,整体上导致语音数据分析时效性较低,企业等用户的体验较差。

技术实现思路

1、本申请实施例提供一种方案,可以有效提升语音数据分析时效性,提升用户体验。

2、本申请实施例提供以下技术方案:

3、根据本申请的一个实施例,一种语音数据分析方法,其包括:基于流式处理引擎中第一流式消费对象从客户端日志服务中实时读取变动数据,得到第一语音数据流;基于所述流式处理引擎中第二流式消费对象从云端日志服务中实时读取变动数据,得到第二语音数据流;将所述第一语音数据流和所述第二语音数据流分别按照对应的数据分析需求进行预处理,得到待分析数据流;通过所述流式处理引擎中流表转换方法将所述待分析数据流转换为临时表,并通过数据库对接方法将所述临时表中数据写入目标数据库,以用于实时进行语音数据分析。

4、在本申请的一些实施例中,所述通过数据库对接方法将所述临时表中数据写入目标数据库之后,所述方法还包括:通过指标计算查询语句对所述目标数据库中数据进行指标实时计算分析,得到语音数据分析结果,所述指标计算查询语句为预先连接到所述目标数据库的,所述目标数据库中数据发生变动时触发执行所述指标计算查询语句;通过指定图表可视化展示所述语音数据分析结果。

5、在本申请的一些实施例中,所述基于流式处理引擎中第一流式消费对象从客户端日志服务中实时读取变动数据,得到第一语音数据流,包括:在所述流式处理引擎中创建第一流执行环境对象,并通过所述第一流执行环境对象添加消费数据源,所述消费数据源包括所述客户端日志服务;创建基于所述第一流执行环境对象的第一消费者对象,得到所述第一流式消费对象,并设定第一数据消费配置信息;触发所述第一流式消费对象根据所述第一数据消费配置信息从客户端日志服务中实时读取变动数据,得到第一语音数据流。

6、在本申请的一些实施例中,所述在所述流式处理引擎中创建流执行环境对象之前,所述方法还包括:在所述流式处理引擎中添加第一数据处理依赖,所述第一数据处理依赖至少包括客户端日志服务连接器;所述创建基于所述第一流执行环境对象的第一消费者对象,包括:通过所述客户端日志服务连接器创建基于所述第一流执行环境对象的所述第一消费者对象。

7、在本申请的一些实施例中,所述基于所述流式处理引擎中第二流式消费对象从云端日志服务中实时读取变动数据,得到第二语音数据流,包括:在所述流式处理引擎中创建第二流执行环境对象,并通过所述第二流执行环境对象添加消费数据源,所述消费数据源包括所述云端日志服务;创建基于所述第二流执行环境对象的第二消费者对象,得到所述第二流式消费对象,并传入反序列化对象和第二数据消费配置信息;触发所述第二流式消费对象根据所述第二数据消费配置信息,利用所述反序列化对象从云端日志服务中实时读取变动数据,得到第二语音数据流。

8、在本申请的一些实施例中,所述在所述流式处理引擎中创建第二流执行环境对象之前,所述方法还包括:在所述流式处理引擎中添加第二数据处理依赖,所述第二数据处理依赖至少包括云端日志服务连接器;所述创建基于第二流执行环境对象的第二消费者对象,可以包括:通过所述云端日志服务连接器创建基于所述第二流执行环境对象的所述第二消费者对象。

9、在本申请的一些实施例中,所述通过所述流式处理引擎中流表转换方法将所述待分析数据流转换为临时表,并通过数据库对接方法将所述临时表中数据写入目标数据库,包括:通过所述流式处理引擎中流表转换方法将所述待分析数据流转换为临时表;通过数据库建表语句在所述目标数据库中创建存储表,并通过字段获取方法从所述临时表中获取数据后写入所述存储表。

10、根据本申请的一个实施例,一种语音数据分析装置,所述装置包括:第一读取模块,用于基于流式处理引擎中第一流式消费对象从客户端日志服务中实时读取变动数据,得到第一语音数据流;第二读取模块,用于基于所述流式处理引擎中第二流式消费对象从云端日志服务中实时读取变动数据,得到第二语音数据流;预处理模块,用于将所述第一语音数据流和所述第二语音数据流分别按照对应的数据分析需求进行预处理,得到待分析数据流;数据写入模块,用于通过所述流式处理引擎中流表转换方法将所述待分析数据流转换为临时表,并通过数据库对接方法将所述临时表中数据写入目标数据库,以用于实时进行语音数据分析。

11、根据本申请的另一实施例,一种存储介质,其上存储有计算机程序,当所述计算机程序被计算机的处理器执行时,使计算机执行本申请实施例所述的方法。

12、根据本申请的另一实施例,一种电子设备可以包括:存储器,存储有计算机程序;处理器,读取存储器存储的计算机程序,以执行本申请实施例所述的方法。

13、根据本申请的另一实施例,一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例所述的各种可选实现方式中提供的方法。

14、本申请实施例中,基于流式处理引擎中第一流式消费对象从客户端日志服务中实时读取变动数据,得到第一语音数据流;基于所述流式处理引擎中第二流式消费对象从云端日志服务中实时读取变动数据,得到第二语音数据流;将所述第一语音数据流和所述第二语音数据流分别按照对应的数据分析需求进行预处理,得到待分析数据流;通过所述流式处理引擎中流表转换方法将所述待分析数据流转换为临时表,并通过数据库对接方法将所述临时表中数据写入目标数据库,以用于实时进行语音数据分析。

15、以这种方式,基于流式处理引擎中第一流式消费对象和第二流式消费对象,可以通过流式处理的方式分别从客户端日志服务和云端日志服务实时读取变动数据,数据获取实时性良好,进一步的,通过预处理得到待分析数据后,通过流式处理引擎中流表转换方法和数据库对接方法直接将待分析数据写入数据库以供分析,可以可靠降低整体处理链路,进而,整体上有效提升语音数据分析时效性,提升用户体验。

技术特征:

1.一种语音数据分析方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述通过数据库对接方法将所述临时表中数据写入目标数据库之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述基于流式处理引擎中第一流式消费对象从客户端日志服务中实时读取变动数据,得到第一语音数据流,包括:

4.根据权利要求3所述的方法,其特征在于,所述在所述流式处理引擎中创建流执行环境对象之前,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述流式处理引擎中第二流式消费对象从云端日志服务中实时读取变动数据,得到第二语音数据流,包括:

6.根据权利要求5所述的方法,其特征在于,所述在所述流式处理引擎中创建第二流执行环境对象之前,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述通过所述流式处理引擎中流表转换方法将所述待分析数据流转换为临时表,并通过数据库对接方法将所述临时表中数据写入目标数据库,包括:

8.一种语音数据分析装置,其特征在于,包括:

9.一种存储介质,其特征在于,其上存储有计算机程序,当所述计算机程序被计算机的处理器执行时,使计算机执行权利要求1至7任一项所述的方法。

10.一种电子设备,其特征在于,包括:存储器,存储有计算机程序;处理器,读取存储器存储的计算机程序,以执行权利要求1至7任一项所述的方法。

技术总结本申请公开了一种语音数据分析方法、装置、存储介质及电子设备,涉及计算机技术领域,该方法包括:基于流式处理引擎中第一流式消费对象从客户端日志服务中实时读取变动数据,得到第一语音数据流;基于所述流式处理引擎中第二流式消费对象从云端日志服务中实时读取变动数据,得到第二语音数据流;将所述第一语音数据流和所述第二语音数据流分别按照对应的数据分析需求进行预处理,得到待分析数据流;通过所述流式处理引擎中流表转换方法将所述待分析数据流转换为临时表,并通过数据库对接方法将所述临时表中数据写入目标数据库,以用于实时进行语音数据分析。本申请可以提升语音数据分析时效性,提升用户体验。技术研发人员:王蓝军受保护的技术使用者:深圳TCL新技术有限公司技术研发日:技术公布日:2024/1/22

本文地址:https://www.jishuxx.com/zhuanli/20240618/21137.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。