技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于直推式半监督学习的风控决策方法及系统与流程  >  正文

一种基于直推式半监督学习的风控决策方法及系统与流程

  • 国知局
  • 2024-12-26 14:51:49

本发明涉及智慧银行,更具体地说,涉及一种基于直推式半监督学习的风控决策方法及系统。

背景技术:

1、信用评分模型是近年来兴起的一种为了保障银行和其他金融部门的金融安全而设立的一种关于人身金融权限的划定模型。该模型指根据客户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数,根据客户的信用分数,来决定客户所可以持有的金额权限,从而保证还款等业务的安全性。而随着在现代社会和公司中,贷款,信用卡的作用日渐突出,信用评分模型的发展前景不可估量。

2、目前,在信贷风控流程中,训练信用评分卡模型的样本大都基于已标记的数据,但是该种已标记数据所占的量在重量中比例十分稀少而且获取的难度也非常大,最终使得信用评分卡模型会存在较大的局限性,需要一种能够较为合理解决上述缺陷的基于直推式半监督学习的风控决策方法及系统。

技术实现思路

1、本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于直推式半监督学习的风控决策方法,还提供了一种基于直推式半监督学习的风控决策系统。

2、本发明解决其技术问题所采用的技术方案是:

3、构造一种基于直推式半监督学习的风控决策方法,其中,方法包括以下步骤:

4、收集有标签的用户数据作为第一数据样本,收集未标记用户数据作为基础数据库;

5、依据信用评分模型用途,设定多项数据属性指标并对多项数据属性指标赋予不同权重;

6、依据多项数据属性指标获取第一数据样本中用户数据的多项数据属性,按照设定策略生成筛选条件;

7、依据筛选条件在基础数据库中进行筛选,并依据数据属性指标的权重调整筛选结果数量,最终获得第二数据样本;

8、以第一数据样本作为有类标签的样本,第二数据样本为无类标签的样例,通过直推式半监督学习算法计算,预测第二数据样本的类标签。

9、本发明所述的基于直推式半监督学习的风控决策方法,其中,所述方法还包括步骤:

10、以第一数据样本和预测后的第二数据样本作为有标记的样本,训练信用评分卡模型。

11、本发明所述的基于直推式半监督学习的风控决策方法,其中,所述依据多项数据属性指标获取第一数据样本中用户数据的多项数据属性,按照设定策略生成筛选条件采用方法:

12、依据每一项数据属性指标,匹配第一数据样本中用户数据的数据属性,并对匹配合格的用户数据进行建立数据属性集合;

13、分别对数据属性集合进行分段,每一段对应增加相应标签信息并存入用户数据的标签中,并统计各段数据占总数据的百分比;

14、以各段数据占总数据的百分比为参考,调整数据属性取值范围并作为筛选条件。

15、本发明所述的基于直推式半监督学习的风控决策方法,其中,所述依据筛选条件在基础数据库中进行筛选,并依据数据属性指标的权重调整筛选结果数量,最终获得第二数据样本采用方法:

16、依据数据属性遍历基础数据库中数据,获得具有该数据的数据集;

17、依据数据属性的取值范围筛除数据集中不符合要求的部分;

18、依据多个数据属性指标的权重的比值,进一步调整数据集中数据数量;

19、将最终得到的多个数据集所对应的用户数据的集合作为第二数据样本。

20、本发明所述的基于直推式半监督学习的风控决策方法,其中,所述依据多个数据属性指标的权重的比值,进一步调整数据集中数据数量采用方法:

21、以多个数据属性指标的权重中最小的一个为基准,确定与基准对应的数据集的基准数量;

22、以其他数据属性指标的权重的值与基准的值的比值以及基准数量,确定其他数据属性指标对应的数据集的数量;

23、依据其他数据属性指标对应的数据集的数量进行增加或减少调整相应数据集的数据。

24、一种基于直推式半监督学习的风控决策系统,其中,所述系统包括:数据收集单元、数据存储单元、数据预处理单元和数据处理单元;

25、所述数据收集单元,用于收集有标签的用户数据作为第一数据样本,收集未标记用户数据作为基础数据库,并在数据存储单元中存储;

26、所述数据预处理单元,用于依据信用评分模型用途,设定多项数据属性指标并对多项数据属性指标赋予不同权重;依据多项数据属性指标获取第一数据样本中用户数据的多项数据属性,按照设定策略生成筛选条件;依据筛选条件在基础数据库中进行筛选,并依据数据属性指标的权重调整筛选结果数量,最终获得第二数据样本;

27、所述数据处理单元,用于以第一数据样本作为有类标签的样本,第二数据样本为无类标签的样例,通过直推式半监督学习算法计算,预测第二数据样本的类标签。

28、本发明所述的基于直推式半监督学习的风控决策系统,其中,所述系统还包括模型训练单元;

29、所述模型训练单元,用于以第一数据样本和预测后的第二数据样本作为有标记的样本,训练信用评分卡模型。

30、本发明所述的基于直推式半监督学习的风控决策系统,其中,所述依据多项数据属性指标获取第一数据样本中用户数据的多项数据属性,按照设定策略生成筛选条件采用方法:

31、依据每一项数据属性指标,匹配第一数据样本中用户数据的数据属性,并对匹配合格的用户数据进行建立数据属性集合;

32、分别对数据属性集合进行分段,每一段对应增加相应标签信息并存入用户数据的标签中,并统计各段数据占总数据的百分比;

33、以各段数据占总数据的百分比为参考,调整数据属性取值范围并作为筛选条件。

34、本发明所述的基于直推式半监督学习的风控决策系统,其中,所述依据筛选条件在基础数据库中进行筛选,并依据数据属性指标的权重调整筛选结果数量,最终获得第二数据样本采用方法:

35、依据数据属性遍历基础数据库中数据,获得具有该数据的数据集;

36、依据数据属性的取值范围筛除数据集中不符合要求的部分;

37、依据多个数据属性指标的权重的比值,进一步调整数据集中数据数量;

38、将最终得到的多个数据集所对应的用户数据的集合作为第二数据样本。

39、本发明所述的基于直推式半监督学习的风控决策系统,其中,所述依据多个数据属性指标的权重的比值,进一步调整数据集中数据数量采用方法:

40、以多个数据属性指标的权重中最小的一个为基准,确定与基准对应的数据集的基准数量;

41、以其他数据属性指标的权重的值与基准的值的比值以及基准数量,确定其他数据属性指标对应的数据集的数量;

42、依据其他数据属性指标对应的数据集的数量进行增加或减少调整相应数据集的数据。

43、本发明的有益效果在于:应用本技术的方式方法,以信用评分模型用途为导向,增加了更加符合实际应用场景的数据筛选机制,来对未标记用户数据进行基于条件权重的预处理,并对预处理后数据结合已标记数据通过直推式半监督学习方法处理,最终得到优化后的训练样本数据,能够有效的提高数据处理效率,以及训练样本数据的数量和质量,提升信用评分模型的可靠性。

本文地址:https://www.jishuxx.com/zhuanli/20241226/343701.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。