用户信用预测方法、装置、设备及可读存储介质与流程
- 国知局
- 2024-10-09 14:36:18
本发明涉及机器学习,尤其涉及一种用户信用预测方法、装置、设备及可读存储介质。
背景技术:
1、随着互联网的普及,上网已成为常态,随着网络数据(包括用户上网行为、通信记录和消费习惯等)的积累,通过这些网络数据,可以为用户信用的风险预测提供很好的辅助。然而现有的用户信用风险预测的方案多是基于个人经验的预测,或者,通过简单的预测模型对用户信用进行预测。而前者依赖人工经验,人力成本高且预测准确率难以控制;后者则是预测准确率较低。
技术实现思路
1、本发明提供一种用户信用预测方法、装置、设备及可读存储介质,用以解决现有用户信用的风险预测方案存在的人力成本高且预测准确率低的技术问题。
2、本发明提供一种用户信用预测方法,包括:
3、基于预处理特征变量调整分类提升catboost模型的参数,得到调整后的catboost模型;所述预处理特征变量是基于历史用户信息得到的;
4、将待预测的用户信息输入所述调整后的catboost模型,得到用户信用预测结果。
5、根据本发明提供的一种用户信用预测方法,所述基于预处理得到的特征变量调整分类提升catboost模型的参数,得到目标catboost模型,之前包括:
6、对收集到的历史用户信息进行指标衍生,得到历史特征变量;
7、对所述历史特征变量进行分箱处理,基于每个分箱中的历史特征变量确定每个分箱的信息值;
8、基于所述信息值对所述历史特征变量进行预处理,得到预处理特征变量。
9、根据本发明提供的一种用户信用预测方法,所述对收集到的历史用户信息进行指标衍生,得到历史特征变量包括:
10、确定历史用户信息中相互关联的信息,将所述相互关联的信息作为原始指标;
11、对所述相互关联的信息进行指标衍生,得到衍生指标;
12、对所述原始指标和所述衍生指标进行合并处理,得到历史特征变量。
13、根据本发明提供的一种用户信用预测方法,所述对所述历史特征变量进行分箱处理,基于每个分箱中的历史特征变量确定每个分箱的信息值包括:
14、将所述历史特征变量切分为多个变量区间,确定相邻的变量区间的方值和预设最大分箱数;
15、在所述变量区间的数量大于所述预设最大分箱数的情况下,基于所述方值对所述相邻的变量区间进行合并,得到多个分箱;
16、基于每个分箱中的历史特征变量的信用风险值,确定每个分箱的信息值。
17、根据本发明提供的一种用户信用预测方法,所述基于每个分箱中的历史特征变量的信用风险值,确定每个分箱的信息值包括:
18、基于每个分箱中的历史特征变量的信用风险值,确定每个分箱的证据权重值;
19、基于每个分箱中的历史特征变量的信用风险值,以及每个分箱的证据权重值,确定每个分箱的信息值。
20、根据本发明提供的一种用户信用预测方法,所述基于预处理特征变量调整分类提升catboost模型的参数,得到调整后的catboost模型包括:
21、确定每个预处理特征变量的信用分类值,以及所述信用分类值对应的标签值的和;
22、基于所述信用分类值和所述标签值的和,对catboost模型的参数进行调整,得到调整后的catboost模型。
23、根据本发明提供的一种用户信用预测方法,所述catboost模型的参数包括迭代次数、学习率和特征分割数。
24、本发明还提供一种用户信用预测装置,包括:
25、参数调整模块,用于基于预处理特征变量调整分类提升catboost模型的参数,得到调整后的catboost模型;所述预处理特征变量是基于历史用户信息得到的;
26、用户信用预测模块,用于将待预测的用户信息输入所述调整后的catboost模型,得到用户信用预测结果。
27、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述用户信用预测方法。
28、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述用户信用预测方法。
29、本发明提供的用户信用预测方法、装置、设备及可读存储介质,通过对历史用户信息进行预处理得到预处理特征变量,通过贴合用户真实信息的预处理特征变量,对catboost分类提升模型的参数进行调整,得到调整参数后的catboost分类提升模型,将待预测的用户信息输入到调整参数后的catboost分类提升模型,得到用户信用预测结果。通过贴合用户真实信息的预处理特征变量,对catboost分类提升模型进行调参,提高了用户信用预测的准确性。
技术特征:1.一种用户信用预测方法,其特征在于,包括:
2.根据权利要求1所述的用户信用预测方法,其特征在于,所述基于预处理得到的特征变量调整分类提升catboost模型的参数,得到目标catboost模型,之前包括:
3.根据权利要求2所述的用户信用预测方法,其特征在于,所述对收集到的历史用户信息进行指标衍生,得到历史特征变量包括:
4.根据权利要求2所述的用户信用预测方法,其特征在于,所述对所述历史特征变量进行分箱处理,基于每个分箱中的历史特征变量确定每个分箱的信息值包括:
5.根据权利要求4所述的用户信用预测方法,其特征在于,所述基于每个分箱中的历史特征变量的信用风险值,确定每个分箱的信息值包括:
6.根据权利要求1所述的用户信用预测方法,其特征在于,所述基于预处理特征变量调整分类提升catboost模型的参数,得到调整后的catboost模型包括:
7.根据权利要求6所述的用户信用预测方法,其特征在于,所述catboost模型的参数包括迭代次数、学习率和特征分割数。
8.一种用户信用预测装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述用户信用预测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述用户信用预测方法。
技术总结本发明涉及机器学习技术领域,本发明提供一种用户信用预测方法、装置、设备及可读存储介质,该方法包括:基于预处理特征变量调整分类提升catboost模型的参数,得到调整后的catboost模型;所述预处理特征变量是基于历史用户信息得到的;将待预测的用户信息输入所述调整后的catboost模型,得到用户信用预测结果。本发明通过贴合用户信息的预处理特征变量,对catboost分类提升模型进行调参,提高了用户信用预测的准确性。技术研发人员:郑才华,杨弋鋆受保护的技术使用者:浪潮通信信息系统有限公司技术研发日:技术公布日:2024/9/29本文地址:https://www.jishuxx.com/zhuanli/20241009/305821.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。