一种金融业务下的数据处理方法及装置与流程
- 国知局
- 2024-11-21 12:06:47
本申请涉及计算机,尤其涉及一种金融业务下的数据处理方法及装置。
背景技术:
1、金融业务下的诸多业务处理(如营销策略的制定)通常需要基于随机实验来完成,但受到法律法规与社会影响等维度的限制,难以直接从金融业务中采集到随机性较强的样本集,进而无法确保实验组与对照组之间的等价性,使得数据处理结果的准确度与可信度受到影响。
2、当前,为了增强样本随机性,通常会采用回归模型预测出样本集中各个样本的倾向性得分,再选取倾向性得分相近的各个样本作为数据处理时采用的样本。由于此方式仅仅基于倾向性得分进行样本筛选,因而十分依赖于倾向性得分模型的模型处理精度,当模型处理精度较差时,选取出的样本的随机性也会大幅下降。有鉴于此,如何在金融业务下降低模型处理精度对样本随机性的影响,并有效实现样本随机性的增强,便成了当前的一项重要研究课题。
技术实现思路
1、本申请实施例提供了一种金融业务下的数据处理方法及装置,可在金融业务下降低模型处理精度对样本随机性的影响,并有效实现样本随机性的增强。
2、一方面,本申请实施例提供了一种金融业务下的数据处理方法,包括:
3、获取样本集,所述样本集包含目标金融业务下的多个业务对象,所述业务对象存在参考特征维度下的特征值,且每个业务对象为实验对象或对照对象;
4、根据所述样本集中每个业务对象在所述目标金融业务下的历史交易额,对所述样本集进行样本分桶,得到多个样本桶,不同样本桶中的业务对象所对应的历史交易额不同;
5、分别将每个参考特征维度作为目标特征维度,并根据所述样本集中每个业务对象在目标特征维度下的特征值,对所述样本集进行子集划分,得到基于所述目标特征维度划分出的多个样本子集,不同样本子集中的业务对象所对应的特征值不同;
6、根据每个样本子集中的实验对象在所述多个样本桶中的第一数量分布,以及,所述每个样本子集中的对照对象在所述多个样本桶中的第二数量分布,计算基于所述目标特征维度划分出的多个样本子集的样本差异度;
7、若所述样本差异度大于或等于预设差异度,则将基于所述目标特征维度划分出的每个样本子集分别作为参考样本集,并基于所述参考样本集中的业务对象进行对象匹配,得到目标样本集,以基于所述目标样本集进行所述目标金融业务下的业务处理;其中,所述目标样本集包含匹配成功的各个样本对,一个样本对包含一个实验对象与一个对照对象。
8、再一方面,本申请实施例提供了一种金融业务下的数据处理装置,包括:
9、样本获取单元,用于获取样本集,所述样本集包含目标金融业务下的多个业务对象,所述业务对象存在参考特征维度下的特征值,且每个业务对象为实验对象或对照对象;
10、样本分桶单元,用于根据所述样本集中每个业务对象在所述目标金融业务下的历史交易额,对所述样本集进行样本分桶,得到多个样本桶,不同样本桶中的业务对象所对应的历史交易额不同;
11、子集划分单元,用于分别将每个参考特征维度作为目标特征维度,并根据所述样本集中每个业务对象在目标特征维度下的特征值,对所述样本集进行子集划分,得到在所述目标特征维度下划分出的多个样本子集,不同样本子集中的业务对象所对应的特征值不同;
12、差异度计算单元,用于根据每个样本子集中的实验对象在所述多个样本桶中的第一数量分布,以及,所述每个样本子集中的对照对象在所述多个样本桶中的第二数量分布,计算基于所述目标特征维度进行子集划分后的样本差异度;
13、样本筛选单元,用于若所述样本差异度大于或等于预设差异度,则将在所述目标特征维度下划分出的多个样本子集作为参考样本集,并基于所述参考样本集中的业务对象进行对象匹配,得到目标样本集,以基于所述目标样本集进行所述目标金融业务下的业务处理;其中,所述目标样本集包含匹配成功的各个业务对象。
14、再一方面,本申请实施例提供了一种计算机设备,包括:
15、处理器,所述处理器适于实现一条或多条计算机程序;
16、存储介质,所述存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由所述处理器加载并执行如第一方面的方法。
17、再一方面,本申请实施例提供了一种存储介质,所述存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由处理器加载并执行如第一方面的方法。
18、再一方面,本申请实施例提出了一种程序产品,该程序产品包括计算机程序,所述计算机程序适于由处理器加载并执行如第一方面的方法。
19、在本申请实施例中,计算机设备基于历史交易额对样本集进行了样本分桶得到了多个样本桶,并基于目标特征维度对样本集进行了子集划分得到了多个样本子集,然后基于样本子集中实验对象与对照对象在各个样本桶中的数量分布,来确定计算机设备基于目标特征维度区分对照对象与实验对象的能力,并采用样本子集的样本差异度来表征该能力。其中,样本差异度越大表明区分能力越强,该目标特征维度对应的特征也就可以被作为分辨对照对象与实验对象的关键性特征。但同一样本子集中的实验对象与对照对象在目标特征维度下具有相近或相同的特征值是显而易见的,那么,在样本差异度大的样本子集内进行实验对象与对照对象的匹配,以构建出目标样本集,可以使得目标样本集中各个样本对包含的实验对象与对照对象在关键性特征上具有相似性,从而混淆计算机设备对实验对象与对照对象的分辨,有效增强目标样本集的样本随机性。
技术特征:1.一种金融业务下的数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,确定任一样本子集对应的第一数量分布的方式包括:
3.根据权利要求2所述的方法,其特征在于,所述第二数量分布包含所述每个样本桶对应的对照对象占比;所述根据每个样本子集中的实验对象在所述多个样本桶中的第一数量分布,以及,所述每个样本子集中的对照对象在所述多个样本桶中的第二数量分布,计算基于所述目标特征维度划分出的多个样本子集的样本差异度,包括:
4.根据权利要求1-3任一项所述的方法,其特征在于,所述参考特征维度的数量为目标数量;所述方法还包括:
5.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述业务处理包括对目标对象的增益预测,所述增益预测用于预测目标对象在接收到推广信息后产生的增益交易额;所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述每棵决策树的一个叶子节点用于存储相应目标样本子集中同一类别的各个业务对象;所述基于所述目标对象的对象特征、所述目标样本集中各个业务对象的历史交易额,以及在构建所述第n批决策树时所述各个业务对象的权重,对所述目标对象进行增益预测,得到所述目标对象的增益交易额,包括:
8.根据权利要求7所述的方法,其特征在于,计算所述目标样本集中任一业务对象的参考权重的方式包括:
9.根据权利要求6所述的方法,其特征在于,所述每棵决策树的一个叶子节点用于存储相应目标样本子集中同一类别的各个业务对象;基于所述预设数量棵决策树,对所述目标样本集中任一业务对象的倾向性得分进行更新的方式包括:
10.根据权利要求6-9任一项所述的方法,其特征在于,所述业务处理还包括信息推广处理;所述方法还包括:
11.一种金融业务下的数据处理装置,其特征在于,包括:
12.根据权利要求11所述的装置,其特征在于,所述业务处理包括对目标对象的增益预测,所述增益预测用于预测目标对象在接收到推广信息后产生的增益交易额;所述装置还包括:
技术总结本申请公开了一种金融业务下的数据处理方法及装置,方法包括获取样本集,样本集中业务对象为实验对象或对照对象;根据每个业务对象在目标金融业务下的历史交易额进行样本分桶,得到多个样本桶,再根据样本集中每个业务对象在目标特征维度下的特征值,对样本集进行子集划分,得到基于目标特征维度划分出的多个样本子集;根据每个样本子集中实验对象在多个样本桶中的数量分布与对照对象在多个样本桶中的数量分布,计算基于目标特征维度划分出的多个样本子集的样本差异度,当样本差异度大于或等于预设差异度,在基于目标特征维度划分出的每个样本子集内进行对象匹配,得到目标样本集,可以提升样本随机性。技术研发人员:邹京甫,黄煜鲲,殷凇,钟皓明,张海川,吴嫒博受保护的技术使用者:深圳前海微众银行股份有限公司技术研发日:技术公布日:2024/11/18本文地址:https://www.jishuxx.com/zhuanli/20241120/334372.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表