一种逾期概率的预测方法和装置与流程
- 国知局
- 2024-09-11 14:19:53
本公开涉及数据处理,尤其涉及一种逾期概率的预测方法和装置。
背景技术:
1、信贷风控也称信贷风险管理、或者信贷风险控制,是指通过风险识别、计量、监测和控制等方法,对用户的风险进行评级、分类、报告和管理,保持风险和效益的平衡发展,贯穿于贷前信用分析、贷时审查控制、贷后监控管理直至贷款安全收回的整个流程。
2、现有的信贷风险评估过程中,通过对表格数据、图数据等多种样式的数据进行分析,基于数据特点分别利用不同模型进行处理以识别用户的逾期概率。表格数据为结构化数据,输入树模型进行识别;图数据为非结构化数据,输入图模型进行识别。
3、表格数据具有各个属性字段的字段数量、字段值类型等相同的特点,可以分别基于每个用户的特征预测其逾期概率;图数据表征了用户与其他用户之间的关系特征,可以基于其它用户的逾期情况推测用户的逾期概率,然而,现有的树模型和图模型只能对表格数据或者图数据进行分析,无法综合表格数据和图数据的双重优点和特征推测用户的逾期概率,使得现有的逾期概率准确性较低,与实际的用户情况差别较大。
技术实现思路
1、有鉴于此,本公开实施例提供一种逾期概率的预测方法和装置,能够解决现有的树模型和图模型只能单独对表格数据或者图数据进行分析,无法综合表格数据和图数据的双重优点和特征推测用户的逾期概率,树模型对图数据使用不足、图模型对表格数据使用不足,使得树模型的决策对图数据的表达效果欠佳、图模型的决策对表格数据的表达效果欠佳,进而导致现有的逾期概率准确性较低,与实际的用户情况差别较大的问题。
2、为实现上述目的,根据本公开的一方面,提供了一种逾期概率的预测方法,包括:
3、获取各个用户的用户数据;
4、对所述用户数据进行预处理,得到用户特征和关系特征;
5、将所述用户特征和所述关系特征输入逾期概率模型;其中,所述逾期概率模型包括训练好的树模型和训练好的图模型,所述训练好的树模型的输入为所述用户特征,所述训练好的图模型的输入为所述树模型的输出和所述关系特征;
6、根据所述逾期概率模型的输出,确定各个所述用户的逾期概率。
7、根据本公开的另一方面,提供了一种逾期概率的预测装置,包括:
8、获取模块,用于获取各个用户的用户数据;
9、预处理模块,用于对所述用户数据进行预处理,得到用户特征和关系特征;
10、输入模块,用于将所述用户特征和所述关系特征输入逾期概率模型;其中,所述逾期概率模型包括训练好的树模型和训练好的图模型,所述训练好的树模型的输入为所述用户特征,所述训练好的图模型的输入为所述树模型的输出和所述关系特征;
11、输出模块,用于根据所述逾期概率模型的输出,确定各个所述用户的逾期概率。
12、根据本公开的再一方面,提供了一种电子设备,包括:
13、处理器;以及
14、存储程序的存储器,
15、其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行所述逾期概率的预测方法。
16、根据本公开实施例的还一个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行所述逾期概率的预测方法。
17、本申请实施例中提供的一个或多个技术方案,通过先将表格数据输入逾期概率模型中的树模型,对各个用户节点的表格数据进行处理,得到高维稀疏的独热编码向量;逾期概率模型再计算独热编码向量与学习矩阵的乘积,得到低维稠密的低维向量,作为各个用户节点的表征向量;最后将低维向量、表征各个用户节点与邻居节点的关系特征的图数据输入逾期概率模型中的图模型共同学习,确定各个用户节点的逾期概率,可以实现先准确学习各个用户的用户特征,再充分学习用户之间的关系特征、以及其它用户的用户特征,综合用户的个人特征、用户与其他用户之间的关系特征、其他用户的个人特征对用户的影响等,以准确地确定用户的逾期概率,提高用户判别的准确信,为实际业务(比如,信贷风控场景的金融数据)处理提供较高的参考价值的技术效果。
技术特征:1.一种逾期概率的预测方法,其特征在于,包括:
2.如权利要求1所述的逾期概率的预测方法,其特征在于,所述将所述用户特征和所述关系特征输入逾期概率模型,根据所述逾期概率模型的输出,确定各个所述用户的逾期概率,包括:
3.如权利要求1所述的逾期概率的预测方法,其特征在于,所述逾期概率模型的确定,包括:
4.如权利要求3所述的逾期概率的预测方法,其特征在于,所述逾期概率待训练模型包括待训练树模型;所述将所述样本用户特征和所述样本关系特征作为逾期概率待训练模型的输入、样本逾期概率作为所述逾期概率待训练模型的输出,对所述逾期概率待训练模型进行迭代训练,包括:
5.如权利要求4所述的逾期概率的预测方法,其特征在于,所述逾期概率待训练模型包括待训练图模型;所述将所述样本用户特征和所述样本关系特征作为逾期概率待训练模型的输入、样本逾期概率作为所述逾期概率待训练模型的输出,对所述逾期概率待训练模型进行迭代训练,包括:
6.如权利要求1所述的逾期概率的预测方法,其特征在于,所述对所述用户数据进行预处理,得到用户特征和关系特征,包括:
7.如权利要求1所述的逾期概率的预测方法,其特征在于,所述归一化处理的处理方法为最大最小值标准化法或者z-score标准化法,所述邻接矩阵为对称矩阵或者非对称矩阵。
8.一种逾期概率的预测装置,其特征在于,包括:
9.一种电子设备,包括:
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的逾期概率的预测方法。
技术总结本公开实施例提供一种逾期概率的预测方法和装置,涉及数据处理技术领域。该方法的具体实施方式包括:获取各个用户的用户数据;对用户数据进行预处理,得到用户特征和关系特征;将用户特征和关系特征输入逾期概率模型;其中,逾期概率模型包括训练好的树模型和训练好的图模型,训练好的树模型的输入为用户特征,训练好的图模型的输入为树模型的输出和关系特征;根据逾期概率模型的输出,确定各个用户的逾期概率。该实施方式能够综合表格数据和图数据的双重优点和特征推测用户的逾期概率,弥补树模型对图数据使用不足、图模型对表格数据使用不足的缺点,同时获得表格数据和图数据的最佳表达,进而准确预测逾期概率,为实际业务提供较高的参考价值。技术研发人员:陈浩,林熙东,杨青受保护的技术使用者:度小满科技(北京)有限公司技术研发日:技术公布日:2024/9/9本文地址:https://www.jishuxx.com/zhuanli/20240911/290219.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表