一种针对表格数据的风险识别方法、装置及设备与流程
- 国知局
- 2024-12-06 12:10:23
本文件涉及计算机,尤其涉及一种针对表格数据的风险识别方法、装置及设备。
背景技术:
1、随着人们对自己的隐私数据越来越重视,风险识别和预测成为很多在线业务的重要处理核心任务。在金融类业务领域,风险管理和预测是核心任务之一,其中涉及到如非法金融活动、信贷逾期等多种风险事件。通常的风险识别方式面临特征表示能力有限、未充分利用时间信息,以及多任务学习中存在的模型泛化能力不足等情况。为此,需要提供一种基于多任务学习的风险识别方案,从而通过多任务学习提升多任务学习网络的泛化能力,而且能够更加准确的预测用户发生特定风险事件的时间分布,从而实现对未观测风险事件的有效处理,提升风险评估的细致度和准确性。
技术实现思路
1、本说明书实施例的目的是提供一种基于多任务学习的风险识别方案,从而通过多任务学习提升多任务学习网络的泛化能力,而且能够更加准确的预测用户发生特定风险事件的时间分布,从而实现对未观测风险事件的有效处理,提升风险评估的细致度和准确性。
2、为了实现上述技术方案,本说明书实施例是这样实现的:
3、本说明书实施例提供的一种针对表格数据的风险识别方法,所述方法包括:获取用户在执行目标业务的过程中的表格数据。分别对所述表格数据中的类别型数据和数值型数据进行特征提取,得到所述类别型数据对应的类别表征和所述数值型数据对应的数值表征,基于所述类别表征和所述数值表征,确定所述表格数据对应的数据表征。将所述表格数据对应的数据表征输入到预先训练的多任务学习网络中,得到包含所述表格数据对应的多个任务中不同任务之间的关系的每个任务的风险表征,所述多任务学习网络中包括多个专家模型和所述任务对应的门控网络,所述门控网络用于为每个所述专家模型的输出数据分配相应的权重。基于所述每个任务的风险表征,通过预先训练的风险识别网络确定所述表格数据是否存在预设风险的识别结果。
4、本说明书实施例提供的一种针对表格数据的风险识别装置,所述装置包括:数据获取模块,获取用户在执行目标业务的过程中的表格数据。特征提取模块,分别对所述表格数据中的类别型数据和数值型数据进行特征提取,得到所述类别型数据对应的类别表征和所述数值型数据对应的数值表征,基于所述类别表征和所述数值表征,确定所述表格数据对应的数据表征。多任务处理模块,将所述表格数据对应的数据表征输入到预先训练的多任务学习网络中,得到包含所述表格数据对应的多个任务中不同任务之间的关系的每个任务的风险表征,所述多任务学习网络中包括多个专家模型和所述任务对应的门控网络,所述门控网络用于为每个所述专家模型的输出数据分配相应的权重。风险识别模块,基于所述每个任务的风险表征,通过预先训练的风险识别网络确定所述表格数据是否存在预设风险的识别结果。
5、本说明书实施例提供的一种针对表格数据的风险识别设备,所述针对表格数据的风险识别设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取用户在执行目标业务的过程中的表格数据。分别对所述表格数据中的类别型数据和数值型数据进行特征提取,得到所述类别型数据对应的类别表征和所述数值型数据对应的数值表征,基于所述类别表征和所述数值表征,确定所述表格数据对应的数据表征。将所述表格数据对应的数据表征输入到预先训练的多任务学习网络中,得到包含所述表格数据对应的多个任务中不同任务之间的关系的每个任务的风险表征,所述多任务学习网络中包括多个专家模型和所述任务对应的门控网络,所述门控网络用于为每个所述专家模型的输出数据分配相应的权重。基于所述每个任务的风险表征,通过预先训练的风险识别网络确定所述表格数据是否存在预设风险的识别结果。
6、本说明书实施例还提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:获取用户在执行目标业务的过程中的表格数据。分别对所述表格数据中的类别型数据和数值型数据进行特征提取,得到所述类别型数据对应的类别表征和所述数值型数据对应的数值表征,基于所述类别表征和所述数值表征,确定所述表格数据对应的数据表征。将所述表格数据对应的数据表征输入到预先训练的多任务学习网络中,得到包含所述表格数据对应的多个任务中不同任务之间的关系的每个任务的风险表征,所述多任务学习网络中包括多个专家模型和所述任务对应的门控网络,所述门控网络用于为每个所述专家模型的输出数据分配相应的权重。基于所述每个任务的风险表征,通过预先训练的风险识别网络确定所述表格数据是否存在预设风险的识别结果。
7、本说明书实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下流程:获取用户在执行目标业务的过程中的表格数据。分别对所述表格数据中的类别型数据和数值型数据进行特征提取,得到所述类别型数据对应的类别表征和所述数值型数据对应的数值表征,基于所述类别表征和所述数值表征,确定所述表格数据对应的数据表征。将所述表格数据对应的数据表征输入到预先训练的多任务学习网络中,得到包含所述表格数据对应的多个任务中不同任务之间的关系的每个任务的风险表征,所述多任务学习网络中包括多个专家模型和所述任务对应的门控网络,所述门控网络用于为每个所述专家模型的输出数据分配相应的权重。基于所述每个任务的风险表征,通过预先训练的风险识别网络确定所述表格数据是否存在预设风险的识别结果。
技术特征:1.一种针对表格数据的风险识别方法,所述方法包括:
2.根据权利要求1所述的方法,所述分别对所述表格数据中的类别型数据和数值型数据进行特征提取,得到所述类别型数据对应的类别表征和所述数值型数据对应的数值表征,包括:
3.根据权利要求2所述的方法,所述多种不同的特征提取规则包括第一特征提取规则、第二特征提取规则和第三特征提取规则,通过多种不同的特征提取规则对所述表格数据中的数值型数据进行特征提取,得到每种特征提取规则对应的子特征,包括:
4.根据权利要求1所述的方法,所述多个专家模型是所述多个任务共享的专家模型,所述将所述表格数据对应的数据表征输入到预先训练的多任务学习网络中,得到包含所述表格数据对应的多个任务中不同任务之间的关系的每个任务的风险表征,包括:
5.根据权利要求4所述的方法,所述门控网络的数量由所述多个任务的数量确定,且每个任务对应一个门控网络,所述将所述表格数据对应的数据表征分别输入到所述任务对应的门控网络中,得到所述门控网络为每个专家模型分配的权重,包括:
6.根据权利要求1所述的方法,所述多个专家模型包括每个任务对应的专家模型和所述多个任务共享的共享专家模型,所述将所述表格数据对应的数据表征输入到预先训练的多任务学习网络中,得到包含所述表格数据对应的多个任务中不同任务之间的关系的每个任务的任务表征,包括:
7.根据权利要求1所述的方法,所述基于所述每个任务的风险表征,通过预先训练的风险识别网络确定所述表格数据是否存在预设风险的识别结果,包括:
8.根据权利要求1所述的方法,所述方法还包括:
9.根据权利要求8所述的方法,所述损失函数包括所述表格数据样本在每个时间的风险概率对应的风险损失函数和对错误排序的输出概率进行惩罚对应的排序损失函数。
10.根据权利要求9所述的方法,所述风险损失函数是通过首次命中风险时间和表格数据样本的联合分布的对数似然函数确定的损失函数。
11.一种针对表格数据的风险识别装置,所述装置包括:
12.一种针对表格数据的风险识别设备,所述针对表格数据的风险识别设备包括:
技术总结本说明书实施例公开了一种针对表格数据的风险识别方法、装置及设备,该方法包括:获取用户在执行目标业务的过程中的表格数据;分别对表格数据中的类别型数据和数值型数据进行特征提取,得到类别型数据对应的类别表征和数值型数据对应的数值表征,基于类别表征和数值表征,确定表格数据对应的数据表征;将表格数据对应的数据表征输入到预先训练的多任务学习网络中,得到包含表格数据对应的多个任务中不同任务之间的关系的每个任务的风险表征,多任务学习网络中包括多个专家模型和任务对应的门控网络;基于每个任务的风险表征,通过预先训练的风险识别网络确定表格数据是否存在预设风险的识别结果。技术研发人员:董迹海,许小龙,李哲,吴垠,郑开元,许丽丹受保护的技术使用者:支付宝(杭州)信息技术有限公司技术研发日:技术公布日:2024/12/2本文地址:https://www.jishuxx.com/zhuanli/20241204/339753.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表