一种数仓测试用例生成方法及相关装置与流程
- 国知局
- 2024-08-22 14:58:08
本申请涉及人工智能,尤其涉及一种数仓测试用例生成方法及相关装置。
背景技术:
1、数据仓库作为一种高效集成的数据管理技术,能够帮助决策者提高金融决策水平,在复杂的经济局势和商业环境中做出精确的判断。数据仓库中的数据集成了多个源系统,从源表到目标表一般都会经过多层次的加工,业务逻辑较为复杂。为了确保数据的准确性和可靠性,数仓测试成为了不可或缺的一环。
2、数仓测试需要针对不同的层次,进行不同测试场景和测试点的覆盖。目前在进行测试时,测试人员通过开发提供的技术口径和相关文档,手动编写测试案例,导入测试平台并开展测试。不仅速度慢、效率低。而且对于一些复杂的任务,通常涉及到多个表和字段的关联和转化,测试人员在手动编写测试案例的过程中可能会忽略某些关键的测试场景,或者在测试用例中出现遗漏、重复或不一致的情况,从而降低测试的准确性和全面性。
技术实现思路
1、鉴于上述问题,本申请提供了一种数仓测试用例生成方法及相关装置,以实现数仓测试用例的自动生成的目的。具体方案如下:
2、本申请第一方面提供一种数仓测试用例生成方法,包括:
3、响应于目标数仓测试用例生成请求,从请求文本中提取出所述目标数仓测试用例的提示关键词;
4、基于所述提示关键词以及嵌入向量间的相似度,从预设测试用例向量库中提取出第一预设数量的测试用例向量;
5、基于所述第一预设数量的测试用例向量,得到相应数量的测试用例文本块;
6、将所述相应数量的测试用例文本块输入至预先训练完成的自然语言模型中,生成数仓测试用例并展示在交互界面中。
7、在一种可能的实现中,在基于所述第一预设数量的测试用例向量,得到相应数量的测试用例文本块后,还包括:
8、基于预设文本块窗口对得到的每个测试用例文本块进行上下文扩展,得到第二预设数量的测试用例文本块;
9、将所述第二预设数量的测试用例文本块输入至预先训练的自然语言模型中,生成所述数仓测试用例。
10、在一种可能的实现中,所述数仓测试用例生成方法还包括:
11、获取用户对所述数仓测试用例的评价结果和相关联的提示内容;
12、基于预设提示工程和所述提示内容,在所述评价结果为不满意时,对所述提示关键词进行优化,得到候选提示词集;
13、将所述用户从所述候选提示词集中选取出的目标提示关键词,作为新的提示关键词。
14、在一种可能的实现中,所述基于预设提示工程和所述提示内容,在所述评价结果为不满意时,对所述提示关键词进行优化,得到候选提示词集,包括:
15、基于预先生成的梯度模型,确定出所述提示关键词所存在的缺陷;
16、基于所述提示内容对所述提示关键词的缺陷进行修复;
17、基于集束搜索对修复后的提示关键词进行扩充,得到所述候选提示词集。
18、在一种可能的实现中,所述预设测试用例向量库的构建过程包括:
19、基于预设切分算法对数据集中的文本数据进行切分,得到所述数据集中每篇文档的文本块;
20、基于预设词向量模型,将所述数据集的文本块转换为相应的嵌入向量保存至数据库,得到所述预设测试用例向量库。
21、在一种可能的实现中,在基于预设切分算法对数据集中的文本数据进行切分,得到所述数据集中每篇文档的文本块前,还包括:
22、调用文本提取工具对所述数据集中的原始文档进行文本内容提取,得到所述文本数据。
23、在一种可能的实现中,所述基于所述提示关键词以及嵌入向量间的相似度,从预设测试用例向量库中提取出第一预设数量的测试用例向量,包括:
24、将所述提示关键词转换为对应的提示关键词向量;
25、基于所述提示关键词向量和所述预设测试用例向量库中的嵌入向量之间的距离,确定出所述第一预设数量的测试用例向量。
26、本申请第二方面提供一种数仓测试用例生成装置,包括:
27、提示词生成模块,用于响应于目标数仓测试用例生成请求,从请求文本中提取出所述目标数仓测试用例的提示关键词;
28、嵌入向量提取模块,用于基于所述提示关键词以及嵌入向量间的相似度,从预设测试用例向量库中提取出第一预设数量的测试用例向量;
29、文本块确定模块,用于基于所述第一预设数量的测试用例向量,得到相应数量的测试用例文本块;以及
30、测试用例生成模块,用于将所述相应数量的测试用例文本块输入至预先训练完成的自然语言模型中,生成数仓测试用例并展示在交互界面中。
31、本申请第三方面提供一种电子设备,包括至少一个处理器和与所述处理器连接的存储器,其中:
32、所述存储器用于存储计算机程序;
33、所述处理器用于执行所述计算机程序,以使所述电子设备能够实现如第一方面所述的数仓测试用例生成方法。
34、本申请第四方面提供一种计算机存储介质,所述存储介质承载有一个或多个计算机程序,当所述一个或多个计算机程序被电子设备执行时,能够使所述电子设备实现如第一方面所述的数仓测试用例生成方法。
35、借由上述技术方案,本申请提供的数仓测试用例生成方法,可以响应于目标数仓测试用例生成请求,从请求文本中提取出目标数仓测试用例的提示关键词。基于提示关键词以及嵌入向量间的相似度,从预设测试用例向量库中提取出第一预设数量的测试用例向量。基于第一预设数量的测试用例向量,得到相应数量的测试用例文本块。将相应数量的测试用例输入至预先训练完成的自然语言模型中,生成数仓测试用例并展示在交互界面中。该数仓测试用例生成方法,基于自然语言模型和测试用例向量库,实现更快速准确的案例生成,节省时间和人力资源,降低人为错误的风险,进而提升测试质量和效率。
技术特征:1.一种数仓测试用例生成方法,其特征在于,包括:
2.根据权利要求1所述的数仓测试用例生成方法,其特征在于,在基于所述第一预设数量的测试用例向量,得到相应数量的测试用例文本块后,还包括:
3.根据权利要求1所述的数仓测试用例生成方法,其特征在于,还包括:
4.根据权利要求3所述的数仓测试用例生成方法,其特征在于,所述基于预设提示工程和所述提示内容,在所述评价结果为不满意时,对所述提示关键词进行优化,得到候选提示词集,包括:
5.根据权利要求1所述的数仓测试用例生成方法,其特征在于,所述预设测试用例向量库的构建过程包括:
6.根据权利要求5所述的数仓测试用例生成方法,其特征在于,在基于预设切分算法对数据集中的文本数据进行切分,得到所述数据集中每篇文档的文本块前,还包括:
7.根据权利要求1所述的数仓测试用例生成方法,其特征在于,所述基于所述提示关键词以及嵌入向量间的相似度,从预设测试用例向量库中提取出第一预设数量的测试用例向量,包括:
8.一种数仓测试用例生成装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括至少一个处理器和与所述处理器连接的存储器,其中:
10.一种计算机存储介质,其特征在于,所述存储介质承载有一个或多个计算机程序,当所述一个或多个计算机程序被电子设备执行时,能够使所述电子设备实现如权利要求1至7中任意一项所述的数仓测试用例生成方法。
技术总结本申请公开了一种数仓测试用例生成方法及相关装置,涉及人工智能领域或金融领域,可以响应于目标数仓测试用例生成请求,从请求文本中提取出目标数仓测试用例的提示关键词。基于提示关键词以及嵌入向量间的相似度,从预设测试用例向量库中提取出第一预设数量的测试用例向量。基于第一预设数量的测试用例向量,得到相应数量的测试用例文本块。将相应数量的测试用例输入至预先训练完成的自然语言模型中,生成数仓测试用例并展示在交互界面中。该数仓测试用例生成方法,基于自然语言模型和测试用例向量库,实现更快速准确的案例生成,节省时间和人力资源,降低人为错误的风险,进而提升测试质量和效率。技术研发人员:王欣怡受保护的技术使用者:中国银行股份有限公司技术研发日:技术公布日:2024/8/20本文地址:https://www.jishuxx.com/zhuanli/20240822/280621.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表