基于金融行为数据进行风险特征自动挖掘的方法和装置与流程
- 国知局
- 2024-09-11 14:32:11
本发明涉及银行智能风控,尤其涉及一种基于金融行为数据进行风险特征自动挖掘的方法和装置。
背景技术:
1、目前,银行业大数据智能风控主要包含模型、特征和策略三部分。其中,对于特征变量的生成,一般基于采集特定领域的数据进行挖掘和高维衍生。一般由人工方式基于业务逻辑生成,依赖开发者经验,效率低、内在逻辑性过强;另外,传统方式生成的特征数量少,可拓展性低;而且,由于银行业务数据比较封闭、不共享,无法通过公共数据服务商或者常规数据采集方式得到,故采集数据多基于征信、消费、行为数据,针对银行业务的采集数据少。
技术实现思路
1、为了解决现有技术中存在的问题,本发明提供了如下技术方案。
2、本发明第一方面提供了一种基于金融行为数据进行风险特征自动挖掘的方法,包括:
3、设置金融数据的维度类型及维度类型的对应值和划分顺序;
4、对银行已采集并经过标注的各个客户的金融数据集分别根据维度类型的划分顺序和对应值进行划分,得到多个维度子集;
5、根据各个维度子集中已标注的数据类型,计算对应的统计指标的值;将计算得到的所有统计指标的值作为风险特征值;所述统计指标依据所述数据类型进行设置,所述数据类型包括连续型和离散型。
6、优选地,所述维度类型包括:交易时间和交易类型。
7、优选地,所述交易时间的对应值包括但不限于:15天、1个月和/或1季度;所述交易类型的对应值包括但不限于:转入、转出、存款、放款、正常还款和/或逾期还款。
8、优选地,所述划分顺序包括:先将客户的金融数据集按照交易时间划分,再将按照交易时间划分得到的数据集按照交易类型划分。
9、优选地,连续型数据对应的统计指标包括但不限于:最大值、平均值、波动性、时间距离、持续时间和/或变化趋势;离散型数据对应的统计指标包括:和、最大值、数量、平均值、频次、占比和/或集中度。
10、本发明第二方面提供了一种基于金融行为数据进行风险特征自动挖掘的装置,包括:
11、第一设置模块,用于设置金融数据的维度类型及维度类型的对应值和划分顺序;
12、数据集划分模块,用于对银行采集的各个客户的金融数据集分别根据维度类型的划分顺序和对应值进行划分,得到多个维度子集;
13、风险特征值确定模块,用于根据各个维度子集中已标注的数据类型,计算对应的统计指标的值;将计算得到的所有统计指标的值作为风险特征值;所述统计指标依据所述数据类型进行设置,所述数据类型包括连续型和离散型。
14、优选地,所述维度类型包括:交易时间和交易类型;所述交易时间的对应值包括:15天、1个月和/或1季度;所述交易类型的对应值包括:转入、转出、存款、放款、正常还款和/或逾期还款;所述划分顺序包括:先将客户的金融数据集按照交易时间划分,再将按照交易时间划分得到的数据集按照交易类型划分。
15、优选地,连续型数据对应的统计指标包括:最大值、平均值、波动性、时间距离、持续时间和/或变化趋势;离散型数据对应的统计指标包括:和、最大值、数量、平均值、频次、占比和/或集中度。
16、本发明第三方面提供了一种存储器,存储有多条指令,所述指令用于实现如第一方面所述的基于金融行为数据进行风险特征自动挖掘的方法。
17、本发明第四方面提供了一种电子设备,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如第一方面所述的基于金融行为数据进行风险特征自动挖掘的方法。
18、本发明的有益效果是:本发明提供的基于金融行为数据进行风险特征自动挖掘的方法和装置,通过预设金融数据的维度类型及其对应值和划分顺序,对银行已采集并经过标注的各个客户的金融数据集分别根据维度类型的划分顺序和对应值进行划分,得到多个维度子集;再通过设置金融数据的数据类型及其对应的统计指标,分别确定各个维度子集中数据的数据类型,并计算该数据类型对应的统计指标的值;将计算得到的所有统计指标的值作为风险特征值。自动实现了风险特征值批量计算和生成,而且生成的特征维度丰富可以扩展,不需要依赖人工经验,覆盖全面,分布均匀。为大数据智能风控后续的特征值衍生、特征值效果筛选等提供了海量、全面的特征数据。
技术特征:1.一种基于金融行为数据进行风险特征自动挖掘的方法,其特征在于,包括:
2.如权利要求1所述的基于金融行为数据进行风险特征自动挖掘的方法,其特征在于,所述维度类型包括:交易时间和交易类型。
3.如权利要求2所述的基于金融行为数据进行风险特征自动挖掘的方法,其特征在于,所述交易时间的对应值包括:15天、1个月和/或1季度;所述交易类型的对应值包括:转入、转出、存款、放款、正常还款和/或逾期还款。
4.如权利要求2所述的基于金融行为数据进行风险特征自动挖掘的方法,其特征在于,所述划分顺序包括:先将客户的金融数据集按照交易时间划分,再将按照交易时间划分得到的数据集按照交易类型划分。
5.如权利要求1所述的基于金融行为数据进行风险特征自动挖掘的方法,其特征在于,连续型数据对应的统计指标包括:最大值、平均值、波动性、时间距离、持续时间和/或变化趋势;离散型数据对应的统计指标包括:和、最大值、数量、平均值、频次、占比和/或集中度。
6.一种基于金融行为数据进行风险特征自动挖掘的装置,其特征在于,包括:
7.如权利要求6所述的基于金融行为数据进行风险特征自动挖掘的装置,其特征在于,所述维度类型包括:交易时间和交易类型;所述交易时间的对应值包括:15天、1个月和/或1季度;所述交易类型的对应值包括:转入、转出、存款、放款、正常还款和/或逾期还款;所述划分顺序包括:先将客户的金融数据集按照交易时间划分,再将按照交易时间划分得到的数据集按照交易类型划分。
8.如权利要求6所述的基于金融行为数据进行风险特征自动挖掘的装置,其特征在于,连续型数据对应的统计指标包括:最大值、平均值、波动性、时间距离、持续时间和/或变化趋势;离散型数据对应的统计指标包括:和、最大值、数量、平均值、频次、占比和/或集中度。
9.一种存储器,其特征在于,存储有多条指令,所述指令用于实现如权利要求1-5任一项所述的基于金融行为数据进行风险特征自动挖掘的方法。
10.一种电子设备,其特征在于,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如权利要求1-5任一项所述的基于金融行为数据进行风险特征自动挖掘的方法。
技术总结本发明公开了基于金融行为数据进行风险特征自动挖掘的方法和装置,属于银行智能风控技术领域。方法包括:设置金融数据的维度类型及维度类型的对应值和划分顺序;对银行已采集并经过标注的各个客户的金融数据集分别根据维度类型的划分顺序和对应值进行划分,得到多个维度子集;根据各个维度子集中已标注的数据类型,计算对应的统计指标的值;将计算得到的所有统计指标的值作为风险特征值;所述统计指标依据所述数据类型进行设置。本发明自动实现了特征批量计算和生成,而且生成的特征维度丰富可以扩展,不需要依赖人工经验,覆盖全面,分布均匀。本发明为大数据智能风控后续的特征值衍生、特征值效果筛选等提供了海量、全面的特征数据。技术研发人员:易湘君,吴莲海,黄超,胡金鹏,曾子健,陈鸿受保护的技术使用者:梅州客商银行股份有限公司技术研发日:技术公布日:2024/9/9本文地址:https://www.jishuxx.com/zhuanli/20240911/291302.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
上一篇
一种目标跟踪方法与流程
下一篇
返回列表