技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于评分卡模型的金融交易风险评估方法及装置与流程  >  正文

基于评分卡模型的金融交易风险评估方法及装置与流程

  • 国知局
  • 2024-10-09 15:48:10

本发明涉及人工智能,具体而言,涉及一种基于评分卡模型的金融交易风险评估方法及装置。

背景技术:

1、金融风险控制是金融机构非常重要的工作,而信用评分卡模型在金融风控中扮演着重要的角色,通过对客户提交的个人信息和数据来预测违约的可能性。

2、对客户进行信用评分是一个常见的分类问题,在相关技术中,主要使用逻辑回归作为建立评分卡模型,但是基于逻辑回归无法解决非线性问题且准确度不高,导致预测违约的可能性的预测结果的准确率低。

3、针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

1、本发明实施例提供了一种基于评分卡模型的金融交易风险评估方法及装置,以至少解决相关技术中采用逻辑回归的方式建立的评分卡模型,无法解决线性问题,导致预测违约率的预测结果不准确的技术问题。

2、根据本发明实施例的一个方面,提供了一种基于评分卡模型的金融交易风险评估方法,包括:获取目标对象的特征数据,得到目标特征数据,其中,所述特征数据至少包括:金融账户在指定时间段产生的与还款行为相关的交易数据;将所述目标特征数据输入目标评分卡模型,输出风险评估结果,其中,所述目标评分卡模型分为n层,每层部署一种类型的机器学习模型,所述机器学习模型的类型包括:基于梯度提升决策树构建的模型,每层部署的所述机器学习模型的输出包括:由所述机器学习模型预测的违约风险,所述风险评估结果用于表征所述目标对象的违约概率是否大于预设阈值,n为大于2的整数。

3、进一步地,将所述目标特征数据输入目标评分卡模型,输出风险评估结果,包括:将所述目标特征数据输入所述目标评分卡模型的第一层,输出第一评估结果,其中,所述第一评估结果用于表征所述目标评分卡模型的第一层预测的所述目标对象的违约概率是否大于所述预设阈值;将所述第一评估结果和所述目标特征数据输入所述目标评分卡模型的第二层,输出第二评估结果,所述第二评估结果用于表征所述目标评分卡模型的第二层预测的所述目标对象的违约概率是否大于所述预设阈值;执行将所述第二评估结果和所述目标特征数据输入所述目标评分卡模型后续的n-2层,直至最后一层输出第三评估结果,其中,所述第三评估结果用于表征所述目标评分卡模型的最后一层预测的所述目标对象的违约概率是否大于所述预设阈值;基于所述第二评估结果和所述第三评估结果,确定所述风险评估结果。

4、进一步地,所述目标评分卡模型分为三层,其中,第一层和第三层部署的机器学习模型包括:极端梯度提升决策树,第二层部署的机器学习模型包括:基于轻量级梯度提升机构建的模型。

5、进一步地,所述目标评分卡模型通过以下方式得到:获取m个用户在s个时间段产生的特征数据,并基于滚动分析策略标记每个所述用户的训练标签,得到第一数据集合,其中,每个所述用户的训练标签用于表征该用户的违约概率是否大于所述预设阈值,m和s为正整数;对所述第一数据集合中的数据进行预处理,得到第二数据集合,其中,所述预处理的处理方式包括下述至少之一:对每个所述用户的特征数据中缺失数据的数量小于预设数量阈值的变量进行填充处理,对每个所述用户的特征数据中的异常值进行删除处理;基于所述第二数据集合,对初始评分卡模型进行模型训练,得到所述目标评分卡模型,其中,所述初始评分卡模型是指未经训练的所述目标评分卡模型,为所述目标评分卡模型的初始形态。

6、进一步地,基于所述第二数据集合,对初始评分卡模型进行模型训练,得到所述目标评分卡模型,包括:对所述第二数据集合中数值型的特征数据进行特征交叉处理,并对所述第二数据集合中字符型的特征数据进行分箱处理和编码处理,得到第三数据集合;基于所述第三数据集合中每个特征数据携带的信息量和所述第三数据集合中特征数据之间的相关性,对所述第三数据集合中的特征数据进行筛选,得到第四数据集合;基于所述第四数据集合,对初始评分卡模型进行模型训练,得到所述目标评分卡模型。

7、进一步地,所述第四数据集合至少包括:训练集和验证集,基于所述第四数据集合,对初始评分卡模型进行模型训练,得到所述目标评分卡模型,包括:基于所述训练集和所述验证集,采用交叉验证策略对初始评分卡模型进行模型训练,并在模型训练过程中采用贝叶斯优化策略调整所述初始评分卡模型的超参数,在经过模型训练的所述初始评分卡模型符合预设条件的情况下,得到所述目标评分卡模型。

8、进一步地,在基于所述第四数据集合,对初始评分卡模型进行模型训练的过程中,包括:将所述训练集输入所述初始评分卡模型的第一层,输出第一预测结果,其中,所述第一预测结果用于表征所述初始评分卡模型的第一层预测的违约概率是否大于所述预设阈值;将所述第一预测结果和所述训练集输入所述初始评分卡模型的第二层,输出第二预测结果,其中,所述第二预测结果用于表征所述初始评分卡模型的第二层预测的违约概率是否大于所述预设阈值;将所述第二预测结果和所述训练集输入所述初始评分卡模型后续的n-2层,直至最后一层输出第三预测结果,其中,所述第三预测结果用于表征所述初始评分卡模型的最后一层预测的违约概率是否大于所述预设阈值;基于所述第二预测结果和所述第三预测结果,确定目标预测结果,其中,所述目标预测结果用于表征所述初始评分卡模型预测的违约概率是否大于所述预设阈值。

9、根据本发明实施例的另一方面,还提供了一种基于评分卡模型的金融交易风险评估装置,包括:获取单元,用于获取目标对象的特征数据,得到目标特征数据,其中,所述特征数据至少包括:金融账户在指定时间段产生的与还款行为相关的交易数据;处理单元,用于将所述目标特征数据输入目标评分卡模型,输出风险评估结果,其中,所述目标评分卡模型分为n层,每层部署一种类型的机器学习模型,所述机器学习模型的类型包括:基于梯度提升决策树构建的模型,每层部署的所述机器学习模型的输出包括:由所述机器学习模型预测的违约风险,所述风险评估结果用于表征所述目标对象的违约概率是否大于预设阈值,n为大于2的整数。

10、进一步地,处理单元包括:第一处理子单元,用于将所述目标特征数据输入所述目标评分卡模型的第一层,输出第一评估结果,其中,所述第一评估结果用于表征所述目标评分卡模型的第一层预测的所述目标对象的违约概率是否大于所述预设阈值;第二处理子单元,用于将所述第一评估结果和所述目标特征数据输入所述目标评分卡模型的第二层,输出第二评估结果,所述第二评估结果用于表征所述目标评分卡模型的第二层预测的所述目标对象的违约概率是否大于所述预设阈值;第三处理子单元,用于执行将所述第二评估结果和所述目标特征数据输入所述目标评分卡模型后续的n-2层,直至最后一层输出第三评估结果,其中,所述第三评估结果用于表征所述目标评分卡模型的最后一层预测的所述目标对象的违约概率是否大于所述预设阈值;确定子单元,用于基于所述第二评估结果和所述第三评估结果,确定所述风险评估结果。

11、进一步地,所述目标评分卡模型分为三层,其中,第一层和第三层部署的机器学习模型包括:极端梯度提升决策树,第二层部署的机器学习模型包括:基于轻量级梯度提升机构建的模型。

12、进一步地,所述目标评分卡模型通过以下子单元得到:第四处理子单元,用于获取m个用户在s个时间段产生的特征数据,并基于滚动分析策略标记每个所述用户的训练标签,得到第一数据集合,其中,每个所述用户的训练标签用于表征该用户的违约概率是否大于所述预设阈值,m和s为正整数;预处理子单元,用于对所述第一数据集合中的数据进行预处理,得到第二数据集合,其中,所述预处理的处理方式包括下述至少之一:对每个所述用户的特征数据中缺失数据的数量小于预设数量阈值的变量进行填充处理,对每个所述用户的特征数据中的异常值进行删除处理;训练子单元,用于基于所述第二数据集合,对初始评分卡模型进行模型训练,得到所述目标评分卡模型,其中,所述初始评分卡模型是指未经训练的所述目标评分卡模型,为所述目标评分卡模型的初始形态。

13、进一步地,训练子单元包括:处理模块,用于对所述第二数据集合中数值型的特征数据进行特征交叉处理,并对所述第二数据集合中字符型的特征数据进行分箱处理和编码处理,得到第三数据集合;筛选模块,用于基于所述第三数据集合中每个特征数据携带的信息量和所述第三数据集合中特征数据之间的相关性,对所述第三数据集合中的特征数据进行筛选,得到第四数据集合;训练模块,用于基于所述第四数据集合,对初始评分卡模型进行模型训练,得到所述目标评分卡模型。

14、进一步地,所述第四数据集合至少包括:训练集和验证集,训练模块包括:第一处理子模块,用于基于所述训练集和所述验证集,采用交叉验证策略对初始评分卡模型进行模型训练,并在模型训练过程中采用贝叶斯优化策略调整所述初始评分卡模型的超参数,在经过模型训练的所述初始评分卡模型符合预设条件的情况下,得到所述目标评分卡模型。

15、进一步地,训练子单元还包括:第二处理模块,用于在基于所述第四数据集合,对初始评分卡模型进行模型训练的过程中,将所述训练集输入所述初始评分卡模型的第一层,输出第一预测结果,其中,所述第一预测结果用于表征所述初始评分卡模型的第一层预测的违约概率是否大于所述预设阈值;第三处理模块,用于将所述第一预测结果和所述训练集输入所述初始评分卡模型的第二层,输出第二预测结果,其中,所述第二预测结果用于表征所述初始评分卡模型的第二层预测的违约概率是否大于所述预设阈值;第四处理模块,用于将所述第二预测结果和所述训练集输入所述初始评分卡模型后续的n-2层,直至最后一层输出第三预测结果,其中,所述第三预测结果用于表征所述初始评分卡模型的最后一层预测的违约概率是否大于所述预设阈值;确定模块,用于基于所述第二预测结果和所述第三预测结果,确定目标预测结果,其中,所述目标预测结果用于表征所述初始评分卡模型预测的违约概率是否大于所述预设阈值。

16、根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的基于评分卡模型的金融交易风险评估方法。

17、根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项的基于评分卡模型的金融交易风险评估方法。

18、在本发明中,获取目标对象的特征数据,得到目标特征数据,其中,特征数据至少包括:金融账户在指定时间段产生的与还款行为相关的交易数据;将目标特征数据输入目标评分卡模型,输出风险评估结果,其中,目标评分卡模型分为n层,每层部署一种类型的机器学习模型,机器学习模型的类型包括:基于梯度提升决策树构建的模型,每层部署的机器学习模型的输出包括:由机器学习模型预测的违约风险,风险评估结果用于表征目标对象的违约概率是否大于预设阈值,n为大于2的整数。进而解决了相关技术中采用逻辑回归的方式建立的评分卡模型,无法解决线性问题,导致预测违约率的预测结果不准确的技术问题。在本发明中,通过基于梯度提升决策树构建的目标评分卡模型预测目标对象的违约风险,避免了相关技术中采用逻辑回归的方式建立的评分卡模型,无法解决线性问题的情况,从而实现了提高评分卡模型预测违约概率的预测结果的准确性的技术效果。

本文地址:https://www.jishuxx.com/zhuanli/20240929/310184.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。