技术新讯 > 计算推算,计数设备的制造及其应用技术 > 数据处理方法、装置、存储介质及电子设备与流程  >  正文

数据处理方法、装置、存储介质及电子设备与流程

  • 国知局
  • 2024-08-05 12:19:54

本发明涉及人工智能,具体而言,涉及一种数据处理方法、装置、存储介质及电子设备。

背景技术:

1、由于深度学习模型本质是一种高度复杂的非线性函数,其输入变量(即特征变量)和输出结果(即模型推理结果)之间的关系无法直观得出,因此,深度学习模型存在“模型黑盒”现象。即,无法知道哪些输入变量如何以及为什么会得到和影响该输出结果。因为其黑盒性质,这与“需要说明决策原因”的应用需求存在一定差距。

2、在相关技术中,采用深度学习模型进行欺诈行为检测时,模型只输出了结果,无法告知风控人员得出该结论的原因。即,如果模型预测出该用户存在问题,却无法告知风控人员是因为哪些输入模型的特征变量影响了预测结果,导致难以对用户的欺诈行为风险进行准确评估。并且深度学习模型需要较高的人工智能专业知识,一般用户无法建立相关侦测模型。并且全人工化线下操作,存在效率低、时效性差。

3、针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

1、本发明实施例提供了一种数据处理方法、装置、存储介质及电子设备,以至少解决相关技术中仅仅依据欺诈行为检测模型的输出结果对用户的欺诈风险进行评估,评估结果的准确率低的技术问题。

2、根据本发明实施例的一个方面,提供了一种数据处理方法,包括:获取待评估对象的第一特征数据,其中,所述待评估对象的第一特征数据中至少记录有所述待评估对象的金融交易数据的特征;将所述待评估对象的第一特征数据输入目标求解器,得到所述待评估对象的第二特征数据,其中,所述目标求解器用于反向求解使目标检测模型的检测结果发生改变的特征数据,所述目标检测模型用于预测所述待评估对象的对象类型,所述对象类型包括下述其中之一:存在欺诈行为的对象、不存在欺诈行为的对象;基于所述待评估对象的第一特征数据和所述待评估对象的第二特征数据,对所述待评估对象进行欺诈风险评估。

3、进一步地,将所述待评估对象的第一特征数据输入目标求解器,得到所述待评估对象的第二特征数据,包括:将所述待评估对象的第一特征数据输入目标编码器,输出第三特征数据,其中,所述目标编码器用于对指定的特征数据进行降维;将所述第三特征数据输入所述目标求解器,输出第四特征数据,并将所述第四特征数据输入目标解码器,输出所述待评估对象的第二特征数据,其中,所述目标解码器用于将所述第四特征数据的维度提升至与该第一特征数据的维度相同。

4、进一步地,所述目标求解器通过以下方式得到:获取m个第一训练样本,其中,每个所述第一训练样本中包括:第一历史时间段的金融交易数据的特征、原始检测结果,所述原始检测结果用于指示所述第一训练样本是否为存在所述欺诈行为的样本,m为正整数;基于所述目标编码器、目标解码器和所述目标检测模型,利用每个所述第一训练样本对初始求解器进行n轮模型训练,并在模型训练过程中,基于预设奖励机制调整所述初始求解器的模型参数,得到所述目标求解器,其中,所述初始求解器包括:深度神经网络模型,所述预设奖励机制用于计算每个所述第一训练样本对所述初始求解器进行n轮模型训练的奖励得分,所述奖励得分用于确定调整所述模型参数的调整方式,n为正整数。

5、进一步地,基于所述目标编码器、目标解码器和所述目标检测模型,利用每个所述第一训练样本对初始求解器进行n轮模型训练,包括:在利用每个所述第一训练样本对初始求解器进行第一轮模型训练过程中,将每个所述第一训练样本输入所述目标编码器进行降维,输出第五特征数据,并将所述第五特征数据输入所述初始求解器,输出第六特征数据;将所述第六特征数据输入所述目标解码器进行升维,输出第七特征数据,并将所述第七特征数据输入所述目标检测模型,输出目标检测结果;基于所述目标检测结果和第一轮模型训练所使用的第一训练样本,确定第一轮模型训练的奖励得分;在利用每个所述第一训练样本对初始求解器进行第2轮至第n轮模型训练过程中,将每轮模型训练过程中所述初始求解器的输出作为下一轮模型训练的输入,并累计n轮模型训练的奖励得分,得到每个所述第一训练样本的n轮模型训练的奖励得分。

6、进一步地,基于所述待评估对象的第一特征数据和所述待评估对象的第二特征数据,对所述待评估对象进行欺诈风险评估,包括:比较所述待评估对象的第一特征数据和所述待评估对象的第二特征数据,得到第一比较结果;在所述待评估对象为存在欺诈行为的对象的情况下,基于所述第一比较结果,确定所述目标检测模型将所述待评估对象判定为存在所述欺诈行为的特征。

7、进一步地,在基于所述待评估对象的第一特征数据和所述待评估对象的第二特征数据,对所述待评估对象进行欺诈风险评估之前,还包括:获取所述待评估对象的基本信息和所述待评估对象的金融交易数据,并基于所述待评估对象的金融交易数据和所述基本信息,确定所述待评估对象的第一特征数据,其中,所述基本信息至少包括:账户信息;将所述待评估对象的第一特征数据输入所述目标检测模型,输出所述待评估对象的对象类型。

8、进一步地,在基于所述待评估对象的第一特征数据和所述待评估对象的第二特征数据,对所述待评估对象进行欺诈风险评估之后,还包括:获取t个目标对象的第一特征数据和t个所述目标对象的第二特征数据,其中,所述目标对象的第一特征数据中至少记录有所述目标对象的金融交易数据的特征,所述目标对象的第一特征数据和该目标对象的第二特征数据输入所说目标检测模型后,所输出的检测结果不同,t个所述目标对象包括所述待评估对象,t为大于1的整数;比较每个所述目标对象的第一特征数据和该目标对象的第二特征数据,得到第二比较结果;基于每个所述目标对象的对象类型和所述第二比较结果,对所述欺诈行为的影响因素进行评估。

9、进一步地,所述目标编码器和所述目标解码器通过以下方式得到:获取s个第二训练样本,其中,所述第二训练样本包括:第二历史时间段的金融交易数据,s为正整数;基于s个所述第二训练样本对初始编码器和初始解码器进行模型训练,直至所述初始解码器输出的特征数据与所述初始编码器输入的特征数据之间的目标距离小于预设距离阈值,得到所述目标编码器和所述目标解码器,其中,所述初始编码器为未经训练的所述目标编码器,所述初始解码器为未经模型训练的所述目标解码器,所述目标距离用于表示所述初始解码器输出的特征数据与所述初始编码器输入的特征数据之间的差异程度。

10、根据本发明实施例的另一方面,还提供了一种数据处理装置,包括:第一获取单元,用于获取待评估对象的第一特征数据,其中,所述待评估对象的第一特征数据中至少记录有所述待评估对象的金融交易数据的特征;第一处理单元,用于将所述待评估对象的第一特征数据输入目标求解器,得到所述待评估对象的第二特征数据,其中,所述目标求解器用于反向求解使目标检测模型的检测结果发生改变的特征数据,所述目标检测模型用于预测所述待评估对象的对象类型,所述对象类型包括下述其中之一:存在欺诈行为的对象、不存在欺诈行为的对象;第一评估单元,用于基于所述待评估对象的第一特征数据和所述待评估对象的第二特征数据,对所述待评估对象进行欺诈风险评估。

11、进一步地,第一处理单元包括:第一处理子单元,用于将所述待评估对象的第一特征数据输入目标编码器,输出第三特征数据,其中,所述目标编码器用于对指定的特征数据进行降维;第二处理子单元,用于将所述第三特征数据输入所述目标求解器,输出第四特征数据,并将所述第四特征数据输入目标解码器,输出所述待评估对象的第二特征数据,其中,所述目标解码器用于将所述第四特征数据的维度提升至与该第一特征数据的维度相同。

12、进一步地,所述目标求解器通过以下子单元得到:第一获取子单元,用于获取m个第一训练样本,其中,每个所述第一训练样本中包括:第一历史时间段的金融交易数据的特征、原始检测结果,所述原始检测结果用于指示所述第一训练样本是否为存在所述欺诈行为的样本,m为正整数;第一训练子单元,用于基于所述目标编码器、目标解码器和所述目标检测模型,利用每个所述第一训练样本对初始求解器进行n轮模型训练,并在模型训练过程中,基于预设奖励机制调整所述初始求解器的模型参数,得到所述目标求解器,其中,所述初始求解器包括:深度神经网络模型,所述预设奖励机制用于计算每个所述第一训练样本对所述初始求解器进行n轮模型训练的奖励得分,所述奖励得分用于确定调整所述模型参数的调整方式,n为正整数。

13、进一步地,第一训练子单元包括:第一处理模块,用于在利用每个所述第一训练样本对初始求解器进行第一轮模型训练过程中,将每个所述第一训练样本输入所述目标编码器进行降维,输出第五特征数据,并将所述第五特征数据输入所述初始求解器,输出第六特征数据;第二处理模块,用于将所述第六特征数据输入所述目标解码器进行升维,输出第七特征数据,并将所述第七特征数据输入所述目标检测模型,输出目标检测结果;第三处理模块,用于基于所述目标检测结果和第一轮模型训练所使用的第一训练样本,确定第一轮模型训练的奖励得分;第四处理模块,用于在利用每个所述第一训练样本对初始求解器进行第2轮至第n轮模型训练过程中,将每轮模型训练过程中所述初始求解器的输出作为下一轮模型训练的输入,并累计n轮模型训练的奖励得分,得到每个所述第一训练样本的n轮模型训练的奖励得分。

14、进一步地,第一评估单元包括:比较子单元,用于比较所述待评估对象的第一特征数据和所述待评估对象的第二特征数据,得到第一比较结果;确定子单元,用于在所述待评估对象为存在欺诈行为的对象的情况下,基于所述第一比较结果,确定所述目标检测模型将所述待评估对象判定为存在所述欺诈行为的特征。

15、进一步地,数据处理装置还包括:在基于所述待评估对象的第一特征数据和所述待评估对象的第二特征数据,对所述待评估对象进行欺诈风险评估之前,还包括:第二处理单元,用于获取所述待评估对象的基本信息和所述待评估对象的金融交易数据,并基于所述待评估对象的金融交易数据和所述基本信息,确定所述待评估对象的第一特征数据,其中,所述基本信息至少包括:账户信息;第三处理单元,用于将所述待评估对象的第一特征数据输入所述目标检测模型,输出所述待评估对象的对象类型。

16、进一步地,数据处理装置还包括:第二获取单元,用于在基于所述待评估对象的第一特征数据和所述待评估对象的第二特征数据,对所述待评估对象进行欺诈风险评估之后,获取t个目标对象的第一特征数据和t个所述目标对象的第二特征数据,其中,所述目标对象的第一特征数据中至少记录有所述目标对象的金融交易数据的特征,所述目标对象的第一特征数据和该目标对象的第二特征数据输入所说目标检测模型后,所输出的检测结果不同,t个所述目标对象包括所述待评估对象,t为大于1的整数;比较单元,用于比较每个所述目标对象的第一特征数据和该目标对象的第二特征数据,得到第二比较结果;第二评估单元,用于基于每个所述目标对象的对象类型和所述第二比较结果,对所述欺诈行为的影响因素进行评估。

17、进一步地,所述目标编码器和所述目标解码器通过以下子单元得到:第二获取子单元,用于获取s个第二训练样本,其中,所述第二训练样本包括:第二历史时间段的金融交易数据,s为正整数;第二训练子单元,用于基于s个所述第二训练样本对初始编码器和初始解码器进行模型训练,直至所述初始解码器输出的特征数据与所述初始编码器输入的特征数据之间的目标距离小于预设距离阈值,得到所述目标编码器和所述目标解码器,其中,所述初始编码器为未经训练的所述目标编码器,所述初始解码器为未经模型训练的所述目标解码器,所述目标距离用于表示所述初始解码器输出的特征数据与所述初始编码器输入的特征数据之间的差异程度。

18、根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的数据处理方法。

19、根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项的数据处理方法。

20、在本发明中,获取待评估对象的第一特征数据,其中,待评估对象的第一特征数据中至少记录有待评估对象的金融交易数据的特征;将待评估对象的第一特征数据输入目标求解器,得到待评估对象的第二特征数据,其中,目标求解器用于反向求解使目标检测模型的检测结果发生改变的特征数据,目标检测模型用于预测待评估对象的对象类型,对象类型包括下述其中之一:存在欺诈行为的对象、不存在欺诈行为的对象;基于待评估对象的第一特征数据和待评估对象的第二特征数据,对待评估对象进行欺诈风险评估。进而解决了相关技术中仅仅依据欺诈行为检测模型的输出结果对用户的欺诈风险进行评估,评估结果的准确率低的技术问题。在本发明中,通过目标求解器对待评估对象的特征数据进行反向分析,得到使目标检测模型对待评估对象的检测结果发生改变的特征数据,以确定使目标检测模型产生相应检测结果的特征,避免了相关技术中难以分析欺诈行为检测模型输出结果产生的原因,并根据该原因进一步确定风险评估结果,导致欺诈风险评估的准确率低的情况,从而实现了提高欺诈风险评估的准确率的技术效果。

本文地址:https://www.jishuxx.com/zhuanli/20240802/262209.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。