基于XGBoost模型的消费贷信用计算方法、装置及存储介质与流程
- 国知局
- 2024-11-18 18:20:39
本发明涉及金融风控,具体涉及基于xgboost模型的消费贷信用计算方法、装置及存储介质。
背景技术:
1、在金融借贷领域,金融公司通常需要根据用户的资质评估用户的借款金额,如果超出用户的还款范围或能力的话,就存在借出去的账款不能及时收回的问题;
2、随着大模型的兴起,各个领域都对模型进行了开发和应用,但在金融风控领域,绝大多数金融机构的模型为纯数理模型,虽具有业务可解释性,但放到特定场景下可能存在与业务相悖的情况,这是因为机器学习模型本身无法理解数据背后的业务含义,仅从数理维度和大数据概率维度更加准确贴合正确的数字规律的表现(比如年龄特征,树模型可能将年龄切分为‘≥17岁’和‘<17岁’,这个划分明显与公知相悖,因此纯粹的数理模型可能不适用特定的业务风控模型场景;且即使尽管金融风控领域存在通用的建模方法论和工作流程,数据驱动的机器学习模型复用性依然得不到很好地解决,从数据源到特征,从算法到参数,即使是同类场景也必须投入人力和时间来处理通用步骤中的个性问题,也就是没有统一的根据业务场景的不同来建立模型的方法。
技术实现思路
1、有鉴于此,本发明的目的在于提供基于xgboost模型的消费贷信用计算方法、装置及存储介质,以解决现有技术中,金融风控领域所使用的纯数理模型虽具有业务可解释性,但放到特定场景下可能存在与业务相悖的情况,以及没有统一的根据业务场景的不同来建立模型的方法的问题。
2、根据本发明实施例的第一方面,提供基于xgboost模型的消费贷信用计算方法,所述方法包括:
3、获取待检测用户的多维度金融风控数据,将所述待检测用户的多维度金融风控数据的多维度特征输入到预搭建好的xgboost模型框架中;
4、所述预搭建好的xgboost模型框架输出每个特征对于目标函数的重要度,将重要度大于或等于预设的重要度阈值的特征作为第一输入特征集;
5、将重要度小于预设的重要度阈值的特征作为第二输入特征集;对所述第二输入特征集引用tree包训练生成决策树;
6、将所述第二输入特征集中的多条特征组合成一条规则,对每条规则在决策树中对应的坏客率进行排序,选取坏客率最高的多条规则对应的特征添加到所述第一输入特征集中,直到满足预设的终止条件;
7、将所述第一输入特征集中的所有特征输入到决策树中,对所述决策树进行超参数的迭代优化,直到满足预设的迭代次数,获得最终的决策树;
8、将所述第一输入特征集输入到xgboost模型的每颗决策树中,得到最终预测结果;
9、根据所述最终预测结果获取待检测用户的消费贷信用额度。
10、优选地,
11、所述根据所述最终预测结果获取待检测用户的消费贷信用额度包括:
12、将所述最终预测结果的概率分映射成标准评分,通过标准评分获取待检测用户的信用等级;
13、根据待检测用户的信用等级获取待检测用户的净月收入偿债比;
14、获取待检测用户的净月收入,根据所述待检测用户的净月收入获取待检测用户的净月收入等级;
15、根据待检测用户的信用等级以及净月收入等级获取待检测用户的授信系数;
16、设置所述待检测用户的授信期限;根据待检测用户的净月收入、净月收入偿债比、授信系数以及授信期限获取待检测用户的消费贷信用额度。
17、优选地;
18、所述待检测用户的多维度金融风控数据包括:人行征信数据、支付数据以及多头数据。
19、优选地,
20、所述将所述第一输入特征集输入到xgboost模型的每颗决策树中,得到最终预测结果包括:
21、将所述第一输入特征集中的所有特征分别输入到xgboost模型的每颗决策树中,每颗决策树分别生成每个特征在相应节点的预测权值,将每颗决策树所有节点的预测权值相加,得到每颗决策树关于输入特征的预测权值,选择所有决策树的最大预测权值作为输入特征的预测结果,将所述第一输入特征集中所有特征的预测结果相加,得到最终预测结果。
22、优选地,
23、所述预设的终止条件包括:
24、所述第二输入特征集中的特征减少10%,且决策树输出的整体坏客率降低3倍。
25、优选地,
26、所述将所述第二输入特征集中的多条特征组合成一条规则,对每条规则在决策树中对应的坏客率进行排序,选取坏客率最高的多条规则对应的特征添加到所述第一输入特征集中,直到满足预设的终止条件包括:
27、根据决策树的可视化信息对所述第二输入特征集进行组合规则的获取以构建规则组合提取函数,得到规则数据集,所述规则数据集中包含多条规则,每条规则由多个第二输入特征集中的特征组合而成;
28、通过所述规则组合提取函数获取所述规则数据集中在决策树中最多坏客率的第一条规则,将第一条规则从规则数据集中删除,并将第一条规则对应的多个特征添加到所述第一输入特征集中;
29、引用所述规则组合提取函数在所述规则数据集中获取在决策树中最多坏客率的第二条规则,将第二条规则从规则数据集中删除,并将第二条规则对应的多个特征添加到所述第一输入特征集中;
30、循环引用所述规则组合提取函数,直到满足预设的终止条件。
31、优选地,
32、所述决策树的可视化信息包括:
33、对所述生成的决策树使用graphviz进行可视化,得到可视化信息。
34、优选地,还包括:
35、根据所述待检测用户的信用等级获取待检测用户的消费贷信用额度上限;
36、若获取的待检测用户的消费贷信用额度大于该用户的消费贷信用额度上限,则将待检测用户的消费贷信用额度上限作用待检测用户此次的消费贷信用额度。
37、根据本发明实施例的第二方面,提供基于xgboost模型的消费贷信用计算装置,所述装置包括:
38、多维度数据获取模块:用于获取待检测用户的多维度金融风控数据,将所述待检测用户的多维度金融风控数据的多维度特征输入到预搭建好的xgboost模型框架中;
39、第一输入特征获取模块:用于所述预搭建好的xgboost模型框架输出每个特征对于目标函数的重要度,将重要度大于或等于预设的重要度阈值的特征作为第一输入特征集;
40、决策树生成模块:用于将重要度小于预设的重要度阈值的特征作为第二输入特征集;对所述第二输入特征集引用tree包训练生成决策树;
41、第一输入特征添加模块:用于将所述第二输入特征集中的多条特征组合成一条规则,对每条规则在决策树中对应的坏客率进行排序,选取坏客率最高的多条规则对应的特征添加到所述第一输入特征集中,直到满足预设的终止条件;
42、模型优化模块:用于将所述第一输入特征集中的所有特征输入到决策树中,对所述决策树进行超参数的迭代优化,直到满足预设的迭代次数,获得最终的决策树;
43、预测模块:用于将所述第一输入特征集输入到xgboost模型的每颗决策树中,得到最终预测结果;
44、信用额度获取模块:用于根据所述最终预测结果获取待检测用户的消费贷信用额度。
45、根据本发明实施例的第三方面,提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被主控器执行时,实现上述方法中的各个步骤。
46、本发明的实施例提供的技术方案可以包括以下有益效果:
47、本技术通过获取多维度业务场景的金融风控数据作为xgboost模型的输入,根据各个维度的特征对于xgboost模型的目标函数的贡献筛选第一输入特征,对于没有筛选上的特征进行合并从而生成规则,分别计算规则对于决策树的坏客率的影响,将没有筛选上的部分特征进行回捞添加到第一输入特征中,在这一过程中,规则对于坏客率的影响体现了业务经验对于模型输出的影响,也就是在纯数理模型中添加专家模型的思想,更适配精确场景下的业务,让模型在规则使用中具有更强的准确性,提升业务可解释性,最后利用筛选出的特征进行模型调参,通过调参后的模型进行用户信用等级的判断,提供了此类场景的标准模型模板,后续应用于相同场景上时,只需根据模型的约束进行数据etl和特征计算,而跨平台的模型文件也可以快速部署和应用。
48、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本文地址:https://www.jishuxx.com/zhuanli/20241118/328313.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表