技术新讯 > 乐器声学设备的制造及制作,分析技术 > 测试数据生成方法、服务器及存储介质与流程  >  正文

测试数据生成方法、服务器及存储介质与流程

  • 国知局
  • 2024-06-21 11:37:08

本申请涉及车载语音处理,具体涉及一种测试数据生成方法、服务器及计算机可读存储介质。

背景技术:

1、在目前的相关技术中,对车辆进行功能测试的语音请求测试集当中的各条测试数据,一般是根据由人工编写的正则表达式生成的。但随着正则表达式复杂度的提高,人工编写出现错误的概率变大,测试数据中容易隐匿异常数据。同时,正则表达式生成的结果体现的是编写者对测试数据的认知,与真实用户实际应用的情景可能存在较大的差异,且除了正则表达式自身的更新外测试数据几乎无法更新迭代,很难满足快速变化的用户需求。

技术实现思路

1、本申请提供了一种测试数据生成方法、服务器及计算机可读存储介质。

2、本申请实施方式涉及的测试数据生成方法,包括:

3、根据历史语音请求以及所述历史语音请求的统计数据,确定所述历史语音请求对应的意图槽位点;

4、根据所述意图槽位点的内容与数量,确定每个意图槽位点对应的测试数据。

5、如此,本申请能够根据历史语音请求的内容与统计结果,将历史语音请求中的语音内容进行归类组合得到历史语音请求对应的意图槽位点,并进一步通过对意图槽位点的内容与数量进行修正,最终确定出测试集中包括的测试数据,也即从用户实际使用的数据出发,确定实际进行测试的测试数据,并随着真实用户使用数据的变化而实时更新迭代,从真实用户的应用角度出发,有效提高了测试集相对于真实场景的准确度与更新速度。

6、在某些实施方式中,所述根据历史语音请求以及所述历史语音请求的统计数据,确定所述历史语音请求对应的意图槽位点,包括:

7、根据所述历史语音请求以及预设的大语言模型,确定所述对应的意图、以及所述历史语音请求包括的槽位信息;

8、根据所述意图、所述槽位信息以及所述历史语音请求的频次统计数据,确定与所述历史语音请求对应的意图槽位点。

9、如此,本申请能够根据大语言模型的处理,根据历史语音请求所述的功能领域、意图以及识别出的槽位信息,结合历史语音请求的使用频次,组合得到多个意图槽位点数据,为测试数据的生成做数据准备。

10、在某些实施方式中,所述根据所述意图槽位点的内容与数量,确定每个意图槽位点对应的测试数据,包括:

11、根据所述历史语音请求的独立访客数,确定与所述意图槽位点对应的测试数据的个数。

12、如此,本申请能够根据历史语音请求的独立访客数,通过车辆用户的使用范围来确定各个意图槽位点在测试集中对应的测试数据个数。

13、在某些实施方式中,所述根据所述历史语音请求的独立访客数,确定与所述意图槽位点对应的测试数据的个数,还包括:

14、根据所述历史语音请求的独立访客数,确定与所述历史语音请求对应的意图槽位点的独立访客数;

15、根据所述意图槽位点的独立访客数占全部意图槽位点的独立访客数之和的比率,确定所述意图槽位点对应的测试数据个数。

16、如此,本申请提供了根据历史语音请求的独立访客数确定意图槽位点在测试集中对应的测试数据个数的方式。

17、在某些实施方式中,所述根据所述历史语音请求的独立访客数,确定与所述意图槽位点对应的测试数据的个数,还包括:

18、在所述意图槽位点对应的测试数据个数大于预设上限阈值的情况下,将所述意图槽位点对应的测试数据个数确定为所述预设上限阈值。

19、如此,本申请能够对数量较多的测试数据进行削峰处理,避免测试数据丰富度受到频率差异的不良影响。

20、在某些实施方式中,所述根据所述历史语音请求的独立访客数,确定与所述意图槽位点对应的测试数据的个数,还包括:

21、在所述意图槽位点对应的测试数据个数小于预设下限阈值的情况下,将所述意图槽位点对应的测试数据个数确定为所述预设下限阈值。

22、如此,本申请能够对数量较少的测试数据进行兜底处理,避免测试数据丰富度受到频率差异的不良影响。

23、在某些实施方式中,所述方法还包括:

24、根据所述历史语音请求、所述意图槽位点以及预设的关键词筛选算法,确定每个所述意图槽位点对应的多个关键词;

25、根据多个所述关键词,确定所述意图槽位点对应的测试数据。

26、如此,本申请还能够根据历史语音请求进行关键词筛选,通过关键词的挖掘与组合确定出用于对测试集内容进行补充的测试内容,以避免测试集对部分应用场景产生遗漏,同时提高对多槽位的语音请求进行适配的效果。

27、在某些实施方式中,所述根据所述多个关键词,确定所述意图槽位点对应的测试数据,还包括:

28、在多个所述关键词中,将频次数据符合预设条件的所述关键词确定为候选关键词;

29、根据所述候选关键词,确定所述意图槽位点对应的测试数据。

30、如此,本申请还提供了对筛选到的关键词进行筛选,并进一步组合确定测试数据的方式。

31、本申请实施方式中的服务器包括存储器与处理器,所述存储器存储有计算机程序,在所述计算机程序被所述处理器执行的情况下,实现上述的方法。

32、本申请实施方式中的计算机可读存储介质存储有计算机程序,在所述计算机程序被一个或多个处理器执行的情况下,实现上述的方法。

33、本申请的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实施方式的实践了解到。

技术特征:

1.一种测试数据生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据历史语音请求以及所述历史语音请求的统计数据,确定所述历史语音请求对应的意图槽位点,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述意图槽位点的内容与数量,确定每个意图槽位点对应的测试数据,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述历史语音请求的独立访客数,确定与所述意图槽位点对应的测试数据的个数,还包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述历史语音请求的独立访客数,确定与所述意图槽位点对应的测试数据的个数,还包括:

6.根据权利要求4所述的方法,其特征在于,所述根据所述历史语音请求的独立访客数,确定与所述意图槽位点对应的测试数据的个数,还包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的方法,其特征在于,所述根据所述多个关键词,确定所述意图槽位点对应的测试数据,还包括:

9.一种服务器,其特征在于,所述服务器包括存储器与处理器,所述存储器存储有计算机程序,在所述计算机程序被所述处理器执行的情况下,实现权利要求1-8任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,在所述计算机程序被一个或多个处理器执行的情况下,实现权利要求1-8任一项所述的方法。

技术总结本申请公开了一种测试数据生成方法,包括:根据历史语音请求以及历史语音请求的统计数据,确定历史语音请求对应的意图槽位点;根据意图槽位点的内容与数量,确定每个意图槽位点对应的测试数据。本申请能够根据历史语音请求的内容与统计结果,将历史语音请求中的语音内容进行归类组合得到历史语音请求对应的意图槽位点,并进一步通过对意图槽位点的内容与数量进行修正,最终确定出测试集中包括的测试数据,也即从用户实际使用的数据出发,确定实际进行测试的测试数据,并随着真实用户使用数据的变化而实时更新迭代,从真实用户的应用角度出发,有效提高了测试集相对于真实场景的准确度与更新速度。技术研发人员:孙亮,曹川受保护的技术使用者:广州小鹏汽车科技有限公司技术研发日:技术公布日:2024/3/17

本文地址:https://www.jishuxx.com/zhuanli/20240618/22474.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。