基于车辆行为大数据的重载货车出险预测方法及装置与流程
- 国知局
- 2024-07-31 22:49:12
本发明涉及数据处理,具体涉及一种基于车辆行为大数据的重载货车出险预测方法及装置。
背景技术:
1、如何提升货运车险业务的精细化管控水平,控制风险,提高经济效益是保险公司特别关注的问题。依托车联网大数据技术,通过科技能力的智慧承保可为保险公司承保大货车保险业务保驾护航。
2、由于保险公司对货运车辆出险预测只能通过车型、车系、品牌、吨位、使用年限等“从车”因素,粗略地区分车辆出险成本,无法做到对车辆出险进行专业、系统地分析预测。既不能干预风险,也不能改造风险、管理风险,故而造成赔付成本高、长期亏损的局面。
技术实现思路
1、有鉴于此,本发明提供了一种基于车辆行为大数据的重载货车出险预测方法及装置,以解决现有技术不能对车辆出险进行专业、系统地分析预测的问题。
2、第一方面,本发明提供了一种基于车辆行为大数据的重载货车出险预测方法,该方法包括:
3、获取重载货车历史数据集和历史保单数据集,重载货车历史数据集表征重载货车的静态属性、行为属性、以及重载货车对应的路网属性;基于重载货车历史数据集和历史保单数据集构建特征数据集;将特征数据集经过pu-learning机器学习算法处理,得到初始样本集;将初始样本集经过单因子分析方法和特征变换方法处理,得到目标样本集;利用lightgbm模型对目标样本集进行训练,得到重载货车出险预测模型;获取待预测重载货车的实际数据集和实际保单数据,并将实际数据集和实际保单数据输入重载货车出险预测模型,得到待预测重载货车的出险预测结果。
4、本发明提供的基于车辆行为大数据的重载货车出险预测方法,首先获取表征重载货车的静态属性、行为属性、以及重载货车对应的路网属性的重载货车历史数据集和历史保单数据集并构建特征数据集,进而通过pu-learning机器学习算法处理,得到初始样本集,可以实现可靠样本的挖掘,进而通过单因子分析方法和特征变换方法处理,可以提高样本质量。最后利用得到的目标样本集可以训练得到用于重载货车的出险预测的模型,提升了模型效果,实现了车辆出险专业、系统的分析预测。
5、在一种可选的实施方式中,基于重载货车历史数据集和历史保单数据集构建特征数据集,包括:
6、获取重载货车历史数据集中包含的多个车辆历史行为数据和多个历史路网数据;基于多个车辆历史行为数据构建多个车辆业务特征和多个驾驶特征,并基于多个历史路网数据构建多个道路特征;基于历史保单数据集构建多个车辆静态特征和多个保单特征;基于多个车辆业务特征、多个驾驶特征、多个道路特征、多个车辆静态特征和多个保单特征确定特征数据集。
7、本发明提供的基于车辆行为大数据的重载货车出险预测方法,通过车辆历史静态数据构建车辆静态特征,通过车辆历史行为数据构建车辆业务特征和驾驶特征,通过路网数据构建道路特征,通过保单数据构建保单特征,实现了从人、从车、从用等维度构建特征,提高了特征的质量,使得特征数据集更加全面,为后续提升模型效果提供了数据支持。
8、在一种可选的实施方式中,将特征数据集经过pu-learning机器学习算法处理,得到初始样本集,包括:
9、基于特征数据集获取正样本集合和负样本集合;基于正样本集合和负样本集合,利用lightgbm模型进行迭代训练,得到多个初始二分类模型;基于多个初始二分类模型,经过预设模型评价方法,得到目标二分类模型;基于预设样本需求和目标二分类模型,确定初始样本集。
10、本发明提供的基于车辆行为大数据的重载货车出险预测方法,采用lightgbm模型进行迭代训练,相比于保险常用传统的glm或者gam,能够得到更好的模型效果且依然可以保持可解释性。
11、在一种可选的实施方式中,基于正样本集合和负样本集合,利用lightgbm模型进行迭代训练,得到多个初始二分类模型,包括:
12、基于正样本集合和负样本集合,经过lightgbm模型训练,建立初始二分类模型;将特征数据集经过初始二分类模型处理,得到多个预测概率值;基于多个预测概率值对特征数据集进行排序,得到新的负样本集合,并返回建立初始二分类模型的步骤,反复迭代,得到多个初始二分类模型。
13、本发明提供的基于车辆行为大数据的重载货车出险预测方法,采用lightgbm模型进行迭代训练,可以得到多个二分类模型,为后续最终模型的确定提供了支持。
14、在一种可选的实施方式中,基于多个初始二分类模型,经过预设模型评价方法,得到目标二分类模型,包括:
15、获取多个初始二分类模型的多个预测结果;基于多个预测结果确定每个初始二分类模型的准确率和召回率;基于每个初始二分类模型的准确率和召回率,确定目标二分类模型。
16、本发明提供的基于车辆行为大数据的重载货车出险预测方法,通过评估每个初始二分类模型的准确率和召回率可以确定出效果最好的目标二分类模型。
17、在一种可选的实施方式中,基于预设样本需求和目标二分类模型,确定初始样本集,包括:
18、获取目标二分类模型的准确率和召回率;基于目标二分类模型的准确率、召回率和预设样本需求,确定初始样本集。
19、本发明提供的基于车辆行为大数据的重载货车出险预测方法,通过结合确定出的效果最好的目标二分类模型的准确率、召回率以及预设样本需求,可以确定出对应的初始样本集,实现了可靠样本的挖掘。
20、第二方面,本发明提供了一种基于车辆行为大数据的重载货车出险预测装置,该装置包括:
21、获取模块,用于获取重载货车历史数据集和历史保单数据集,重载货车历史数据集表征重载货车的静态属性、行为属性、以及重载货车对应的路网属性;构建模块,用于基于重载货车历史数据集和历史保单数据集构建特征数据集;第一处理模块,用于将特征数据集经过pu-learning机器学习算法处理,得到初始样本集;第二处理模块,用于将初始样本集经过单因子分析方法和特征变换方法处理,得到目标样本集;训练模块,用于利用lightgbm模型对目标样本集进行训练,得到重载货车出险预测模型;获取与预测模块,用于获取待预测重载货车的实际数据集和实际保单数据,并将实际数据集和实际保单数据输入重载货车出险预测模型,得到待预测重载货车的出险预测结果。
22、第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的基于车辆行为大数据的重载货车出险预测方法。
23、第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的基于车辆行为大数据的重载货车出险预测方法。
24、第五方面,本发明提供了一种计算机程序产品,包括计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的基于车辆行为大数据的重载货车出险预测方法。
本文地址:https://www.jishuxx.com/zhuanli/20240730/194788.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。