一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种核保数据的核验方法和装置与流程

2022-07-13 16:30:18 来源:中国专利 TAG:


1.本技术属于数据处理技术领域,尤其涉及一种核保数据的核验方法和装置。


背景技术:

2.保险核验(即,核保)一直是保险承保业务中比较重要的环节,针对投保用户进行风险性和合规性的检查,以保证用户投保的有效性,一方面可以为保险公司规避风险,另一方面也可以减少后续投保用户在赔付时的风险。
3.目前,对投保用户进行风险核验,一般还是采用人工的方式,即,由核保人员逐项进行审核判断,这样将导致核保的效率和准确性都较低。
4.针对上述问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本技术目的在于提供一种核保数据的核验方法和装置,以提升核保的效率和准确率。
6.本技术提供一种核保数据的核验方法和装置是这样实现的:
7.一种核保数据的核验方法,所述方法包括:
8.获取目标投保用户的特征数据;
9.对所述目标投保用户的特征数据进行量化,得到目标特征向量;
10.根据所述目标投保用户的年龄和/或性别,匹配到与所述目标投保用户关联的标准体的标准特征向量;
11.确定所述目标特征向量与所述标准特征向量之间的目标相似度;
12.根据所述目标相似度与预设的相似度阈值之间的大小关系,确定所述目标投保用户是否通过核验。
13.在一个实施方式中,确定所述目标特征向量与所述标准特征向量之间的目标相似度,包括:
14.计算所述目标特征向量与所述标准特征向量之间的余弦相似度:
15.将计算的余弦相似度,作为所述目标特征向量与所述标准特征向量之间的目标相似度。
16.在一个实施方式中,所述目标特征向量和所述标准特征向量被按照维度划分为多个分组,每个分组中至少包括两个或两个以上的特征因子。
17.在一个实施方式中,确定所述目标特征向量与所述标准特征向量之间的目标相似度,包括:
18.计算所述多个分组中,各个分组对应的目标特征向量和标准特征向量之间的余弦相似度,得到多个中间相似度;
19.获取各个分组对应的权重值,作为各个中间相似度的权重值;
20.根据各个中间相似度和各个中间相似度对应的权重值,计算得到目标相似度。
21.在一个实施方式中,按照如下公式计算中间相似度:
[0022][0023]
其中,sim(paage
ix
)a表示分组a的中间相似度,natv(paage
ix
)v表示目标特征向量,stdv(paage
ix
)v表示标准特征向量,stdfo(paage
ix
)为对应年龄阶段i、性别x的标准体对应的分组pa的特征因子,natfo(paage
ix
)为对应年龄阶段i、性别x的目标投保用户对应的分组a的特征因子,m表示分组a中包含的特征因子的数量。
[0024]
在一个实施方式中,按照如下公式计算目标相似度:
[0025][0026]
其中,fs(age
ix
)表示最终目标相似度,i表示年龄阶段、x表示性别,sim(paage
ix
)a表示分组a的中间相似度,weighta表示分组a对应的权重值,v表示分组的数量。
[0027]
在一个实施方式中,按照如下公式确定每个维度对应的权重值:
[0028][0029]
其中,weighta表示分组a对应的权重值,v表示分组的数量,w
ak
表示分组a自身的相关度,wzk表示分组a与其它分组的相关度,adja表示调整值。
[0030]
在一个实施方式中,根据所述目标相似度与预设的相似度阈值之间的大小关系,确定所述目标投保用户是否通过核验,包括:
[0031]
在所述目标相似度小于所述相似度阈值的情况下,确定核验未通过;
[0032]
在所述目标相似度大于等于所述相似度阈值的情况下,确定核验通过。
[0033]
在一个实施方式中,在所述目标相似度小于所述相似度阈值的情况下,确定核验未通过之后,还包括:
[0034]
计算所述目标相似度与所述相似度阈值之间的相对差值;
[0035]
根据所述相似度差值与预设比较值之间的大小关系,确定所述目标投保用户是否通过核验。
[0036]
一种核保数据的核验装置,包括:
[0037]
获取模块,用于获取目标投保用户的特征数据;
[0038]
量化模块,用于对所述目标投保用户的特征数据进行量化,得到目标特征向量;
[0039]
匹配模块,用于根据所述目标投保用户的年龄和/或性别,匹配到与所述目标投保用户关联的标准体的标准特征向量;
[0040]
确定模块,用于确定所述目标特征向量与所述标准特征向量之间的目标相似度;
[0041]
核验模块,用于根据所述目标相似度与预设的相似度阈值之间的大小关系,确定所述目标投保用户是否通过核验。
[0042]
一种终端设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理
器执行所述指令时实现上述方法的步骤。
[0043]
一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现上述方法的步骤。
[0044]
本技术提供的核保数据的核验方法和装置,通过对目标投保用户的特征数据进行量化,得到目标特征向量,然后匹配到与其对应的标准体的标准特征向量,确定两者之间的相似度,从而确定目标投保用户是否符合投保标准体的需求,从而实现对投保用户的核验。通过上述方案解决了现有的核保过程需要人工进行所存在的效率和准确率都较低的问题,达到了有效提升核保准确率和效率的技术效果。
附图说明
[0045]
为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0046]
图1是本技术提供的核保数据的核验方法一种实施例的方法流程图;
[0047]
图2是本技术提供的特征因子按照维度进行划分的划分示意图;
[0048]
图3是本技术提供的各维度的权重值的确定方法示意图;
[0049]
图4是本技术提供的投保核验方法一种实施例的方法流程图;
[0050]
图5是本技术提供的一种核保数据的核验方法的电子设备的硬件结构框图;
[0051]
图6是本技术提供的一种核保数据的核验装置的模块结构示意图。
具体实施方式
[0052]
为了使本技术领域的人员更好地理解本技术中的技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
[0053]
考虑到现有的核保一般是采用人工核保的方式,核保效率和准确度都较低,为此,在本例中考虑到可以对用户的数据进行量化,并设置标准体的量化数据,获取投保用户的量化数据,两者进行相似度对比,以确定目标用户是否符合投保要求。
[0054]
具体的,可以通过量化每个投保用户的特征向量,以及投保标准标的标准特征向量,计算每个自然投保用户的特征向量与标准特征向量之间的相似度,来评估投保用户的风险程度,从而实现自动化核保的需求,提高核保效率和核保准确率。
[0055]
图1是本技术提供的核保数据的核验方法一种实施例的方法流程图。虽然本技术提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本技术实施例描述及附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或
者并行执行(例如并行处理器或者多线程处理的环境,甚至分布式处理环境)。
[0056]
如图1所示,该核保数据的核验方法可以包括如下步骤:
[0057]
步骤101:获取目标投保用户的特征数据;
[0058]
例如,其中,上述目标投保用户的特征数据,可以是关于过往的历史数据获取的,例如,可以采集用户过往的投保记录、理赔记录、健康病历数据等数据,作为用户的特征数据。
[0059]
步骤102:对所述目标投保用户的特征数据进行量化,得到目标特征向量;
[0060]
因为是投保用户的核验,因此,特征数据可以包括但不限于以下一个或多个:在对年龄、性别、bmi、职业、收入状况、地区、疾病历史、历史投保保全、理赔历史、运动习惯、抽烟、酗酒等。将这些特征数据进行量化就可以得到反应目标投保用户情况的特征向量。
[0061]
步骤103:根据所述目标投保用户的年龄和/或性别,匹配到与所述目标投保用户关联的标准体的标准特征向量;
[0062]
考虑到对于投保用户而言,不同的性别和年龄段,身体情况等是不同的,因此,为了更为细化准确地确定投保用户的特征数据,可以按照年龄(周岁)、性别等进行预分组,例如,可以每5岁一组,例如,男性分为21组:agem[0,4]、agem[5,9]

agem[100,∞);女性分为21组:agef[0,4]、agef[5,9]

agef[100,∞),记为age
ix
,其中,i为确定的组数,x为性别标识,m指男性,f指女性。
[0063]
即,产生每个年龄区间、性别对应的特征指标,将产生的指标特征记为fi(age
ix
)=fiage[a,b],其中,a和b表示年龄的上下限值,x为性别标识,i为确定的组数。
[0064]
然而,值得注意的是,上述以年龄段和性别进行分组,所划分的年龄段仅是一种示例性表述,在实际实现的时候,也可以采用其它的年龄段划分模式,例如,不是一定按照固定的年龄区间划分,可以按照分析确定相似年龄段,从而灵活实现年龄段设置。
[0065]
对于标准体的标准特征向量,可以是预先基于历史数据分析设定好的,也可以是在有核验需求的时候,实时统计历史数据生成的。例如,可以基于历史数据分析确定每个年龄段和性别对应的标准体各个特征因子的取值,从而形成该年龄段该性别对应的标准体的标准特征向量,然后与年龄段和性别进行关联存储,在存在投保核验需求的时候,确定目标投保用户的年龄和性别,从而匹配到对应的标准体。又或者,可以是在存在核保需求的时候,确定确定目标投保用户的年龄和性别,然后基于目标投保用户的年龄和性别,从历史数据中获取对应的年龄段和性别核保成功的数据,对这些数据进行聚合分析,得到对应的标准体。具体采用哪种方式形成标准体的标准特征向量可以根据实际需求设定,本技术对此不作限定。
[0066]
步骤104:确定所述目标特征向量与所述标准特征向量之间的目标相似度;
[0067]
在实现的时候,确定目标特征向量与所述标准特征向量之间的相似度,可以是确定两者之间的余弦相似度,以确定的余弦相似度作为目标相似度。即,确定所述目标特征向量与所述标准特征向量之间的目标相似度,可以包括:计算所述目标特征向量与所述标准特征向量之间的余弦相似度:将计算的余弦相似度,作为所述目标特征向量与所述标准特征向量之间的目标相似度。
[0068]
为了实现对特征向量的精细化控制,考虑到目标投标用户的本质是人,对于人的特征数据的划分,可以是多个维度的,因此,可以将目标特征向量和标准特征向量按照维度
划分为多个分组,每个分组中至少包括两个或两个以上的特征因子。相应的,在确定所述目标特征向量与所述标准特征向量之间的目标相似度的时候,可以先计算所述多个分组中,各个分组对应的目标特征向量和标准特征向量之间的余弦相似度,得到多个中间相似度;然后,获取各个分组对应的权重值,作为各个中间相似度的权重值;根据各个中间相似度和各个中间相似度对应的权重值,计算得到目标相似度。
[0069]
例如,可以按照基本身体素质、职业、财务能力、患病历史、生活习惯等各多个维度进行划分,即,将特征因子分为:bmi核保风险、职业核保风险、投保理赔历史记录核保风险、财务能力风险、疾病历史核保风险、生活习惯核保风险等。在进行细化分组的时候,假设总的特征因子包括:年龄、bmi、性别、地区表示、疾病历史、产品类型、职业、存在退保记录、存在失效记录、承保保额、一年内理赔历史、两年内理赔历史、五年内理赔历史、超五年理赔历史、危险运动习惯、抽烟、酗酒。
[0070]
对于上述这些特征因子,可以分为如下几类:
[0071]
1)疾病历史核保风险,包括:年龄、性别、疾病历史、地区标识;
[0072]
2)投保理赔历史记录核保风险,包括:产品类型、一年内理赔历史、两年内理赔历史、五年内理赔历史、超五年理赔历史、存在退保记录、存在失效记录;
[0073]
3)职业核保风险,包括:年龄、性别、地区标识、职业;
[0074]
4)生活习惯核保风险,包括:危险运动习惯、抽烟、酗酒、年龄、性别;
[0075]
5)财务能力风险,包括:年龄、性别、地区标识、产品类型、承保保额、存在退保记录、存在失效记录;
[0076]
6)bm核保风险,包括:年龄、bmi、性别。
[0077]
然而,值得注意的是,上例所列列举的特征因子,以及对特征因子的分类方式仅是一种示例性描述,在实际实现的时候,可以根据需求和情况下,选择其它的特征因子,或者按照其它分类方式进行分类,本技术对此不作限定。
[0078]
其中,上述中间相似度可以按照如下公式计算得到:
[0079][0080]
其中,sim(paage
ix
)a表示分组a的中间相似度,natv(paage
ix
)v表示目标特征向量,stdv(paage
ix
)v表示标准特征向量,stdfo(paage
ix
)为对应年龄阶段i、性别x的标准体对应的分组pa的特征因子,natfo(paage
ix
)为对应年龄阶段i、性别x的目标投保用户对应的分组a的特征因子,m表示分组a中包含的特征因子的数量。
[0081]
上述目标相似度可以按照如下公式计算得到:
[0082][0083]
其中,fs(age
ix
)表示最终目标相似度,i表示年龄阶段、x表示性别,sim(paage
ix
)a表示分组a的中间相似度,weighta表示分组a对应的权重值,v表示分组的数量。
[0084]
考虑到维度之间是存在相互影响的,为此,在确定各个维度所占的权重的时候,可以结合维度之间的相关性进行,例如,可以按照如下公式确定每个维度对应的权重值:
[0085][0086]
其中,weighta表示分组a对应的权重值,v表示分组的数量,w
ak
表示分组a自身的相关度,wzk表示分组a与其它分组的相关度,adja表示调整值。
[0087]
步骤105:根据所述目标相似度与预设的相似度阈值之间的大小关系,确定所述目标投保用户是否通过核验。
[0088]
在进行核验的时候,可以是在所述目标相似度小于所述相似度阈值的情况下,确定核验未通过;在所述目标相似度大于等于所述相似度阈值的情况下,确定核验通过。
[0089]
进一步的,为了进行更为细化的区分,以提升核验通过的概率,提升投保成功率,针对核验未通过的可以设置条件通过的情况下,为此,在所述目标相似度小于所述相似度阈值的情况下,确定核验未通过之后,还可以计算所述目标相似度与所述相似度阈值之间的相对差值;根据所述相似度差值与预设比较值之间的大小关系,确定所述目标投保用户是否通过核验。
[0090]
即,在划分判定结果的时候,除了确定符合标准体的投标用户和不符合标准体的投标用户,还可以设置一类条件标准体,即,虽然不符合标准体,但是如果满足某些条件,可以作为条件标准体。
[0091]
例如,在确定小于相似度阈值的情况下,可以计算相对差值,如果相对差值gapvalue《0.5,则可以视为有条件标准体,如果相对差值gapvalue》=0.5,则可以视为应拒绝标的。
[0092]
其中,相对差值可以按照如下公式计算:
[0093][0094]
其中,gapvalue表示相对差值,similarity表示最终相似度,thredsholdvalue表示相似度阈值。
[0095]
上述的核保数据的核验方法,可以是自动执行的,即,可以获取目标投保用户的特征数据,自动对数据进行量化和相似度比较,以对数据进行核验。通过自动化处理的方式,可以达到系统自动化核保的目的。
[0096]
下面结合一个具体实施例对上述方法进行说明,然而,值得注意的是,该具体实施例仅是为了更好地说明本技术,并不构成对本技术的不当限定。
[0097]
在本例中,为了进行高效核保,考虑到可以对标准体(即,投保标准标)的数据(例如,对年龄、性别、bmi、职业、收入状况、地区、疾病历史、历史投保保全、理赔历史、运动习惯、抽烟、酗酒)进行量化,得到特征实体,将每个投保用户(可称为:投保标)的数据进行量化,例如,对年龄、性别、bmi、职业、收入状况、地区、疾病历史、历史投保保全、理赔历史、运动习惯、抽烟、酗酒等转换为特征实体。然后,将投保用户的特征实体与标准体的特征实体进行差异比较,以确定投保用户的风险程度。
[0098]
即,通过量化每个投保用户的特征向量,以及投保标准标的标准特征向量,计算每
(paage
ix
)、stdf2(paage
ix
)、stdf3(paage
ix
)

stdfm(paage
ix
),其中,m为分组pa特征统计指标的特征因子个数。即,形成标准体的特征数据。
[0116]
步骤5:对于投保用户,可以获取投保用户的数据,然后按照年龄、性别匹配对应分组age
ix
,分组分别计算投保用户的各个特征因子数据,各个特征因子依次记为natf1(paage
ix
)、natf2(paage
ix
)、natf3(paage
ix
)

natfm(paage
ix
),以此生成针对该投保用户的实体数据在相应年龄段、性别的特征向量natv(paage
ix
)v=natf1(paage
ix
)、natf2(paage
ix
)、natf3(paage
ix
)

natfm(paage
ix
),其中,m为分组pa特征统计指标的特征因子个数。
[0117]
步骤6:分别计算出投保用户每组特征因子向量与标准体的特征因子向量之间的余弦相似度,结果记为sim(paage
ix
)a,其中,a为分组标记。
[0118]
其中,对于余弦相似度的计算,按照如下公式计算:
[0119][0120]
其中,natv(paage
ix
)v表示投标用户的特征因子向量,stdv(paage
ix
)v表示标准体的特征因子向量,stdfo(paage
ix
)为标准体对应的分组pa、对应年龄阶段i、性别x的特征因子,natfo(paage
ix
)为投标用户对应的分组pa、对应年龄阶段i、性别x的特征因子。
[0121]
步骤7:将各组余弦相似度作为中间相似度,根据中间相似度计算最终相似度;
[0122]
具体的,可以通过为每组特征因子向量赋予权重的方式,计算最终相似度,最终相似度可以按照如下公式计算得到:
[0123][0124]
其中,fs(age
ix
)表示最终相似度,sim(paage
ix
)a表示a组特征因子向量对应的中间相似度,weighta表示a组特征因子向量的权重值,v表示特征矩阵行数,中间相似度的数量等于特征因子向量分组的组数。
[0125]
在实现的时候,可以设定按照bmi核保风险、职业核保风险、投保理赔历史记录核保风险、财务能力风险、疾病历史核保风险、生活习惯核保风险分组后每组对应的权重值,如果划分为a组,那么就会产生a个中间相似度。考虑到在实际业务场景中,对于风险偏向会因为产品类型的不同而有所倾向或注重,例如:对于意外险对于核保标的生活习惯风险、职业风险会更加注重,因为一个有着极限运动习惯或者职业为刑警对于发生意外的风险会较之无极限运动、普通职业的核保标的要高,因此,可以为生活习惯风险、职业风险设置较高的权重;再例如,对于医疗型产品,会更加关注疾病历史风险、投保理赔历史风险,因此,对于医疗型产品可以为疾病历史风险、投保理赔历史风险设置更高的权重。对于每种产品各个分组权重的设置,可以根据实际的产品需求设定,本技术对此不作限定。
[0126]
在确定权重的时候,可以按照如图3所示的方式,确定不同产品中各个特征因子分组向量的权重:获取既往核保结论数据,对核保结论数据进行拆解,分析统计各个结论,并集合核保分组维度,对结论数据进行归类,分析不同维度在不通过产品上对于结论的统计
数据,从而抽象得到权重数据,再对权重数据进行人工校准,从而得到各维度(即,各分组)的权重数值。
[0127]
对于每个维度的权重的计算,可以通过对统计数据进行矩阵化处理的方式实现,即,考虑到维度之间的相互影响,从而得到更为准确的权重值,例如,可以如下表1所示,构建a行k列的矩阵w
ak
,通过对于件数在a行k列数据元素进行除运算,得到如下表格:
[0128]
表1
[0129][0130][0131]
然后,通过如下公式计算每个维度的权重值:
[0132][0133]
其中,w
ak
表示第a行k列的元素,wzk表示矩阵w
ak
向量归一化的数组,adja表示人工调整数值,如果为0则标识完全依照系统模拟计算的结果值,否则为人工调整权重结果。
[0134]
步骤8:在确定最终相似度之后,可以与预设的相似度阈值进行比较,如果大于相似度阈值,可以确定为符合标准体的投标用户,如果小于相似度阈值,则确定为不符合标准体的投标用户。
[0135]
进一步的,在划分判定结果的时候,除了确定符合标准体的投标用户和不符合标准体的投标用户,还可以设置一类条件标准体,即,虽然不符合标准体,但是如果满足某些条件,可以作为条件标准体。
[0136]
即,在确定小于相似度阈值的情况下,可以计算相对差值,如果相对差值gapvalue《0.5,则可以视为有条件标准体,如果相对差值gapvalue》=0.5,则可以视为应拒绝标的。
[0137]
其中,相对差值可以按照如下公式计算:
[0138]
[0139]
其中,gapvalue表示相对差值,similarity表示最终相似度,thredsholdvalue表示相似度阈值。
[0140]
具体的,可以按照如图4所示的流程进行投保核验:
[0141]
1)获取自然投标标的(即,投标用户)的数据,然后进行特征抽象为具体数据,即,实现特征计算;
[0142]
2)获取标准投标标的(即,标准体)的数据,然后进行特征模拟;
[0143]
3)对特征按照维度进行特征分组,和向量化处理;
[0144]
4)计算自然投标标的与标准投标标的特征的余弦相似度;
[0145]
5)引入为每个维度设置的权重数据,计算得到最终相似度;
[0146]
6)确定最终相似度是否小于预设的标准阈值,如果小于,则输出风险等级,如果大于,则确定核保通过。
[0147]
下面以一个具体实例进行说明:
[0148]
假定设定了标准特征实体stdentity,目标年龄组[20,24],其具体特征如下表2所示:
[0149]
表2
[0150][0151]
假定投标用户a1,目标年龄组为[20,24],具体特征如下表3所示:
[0152]
表3
[0153][0154]
假定投标用户a2,目标年龄组为[20,24],具体特征如下表4所示:
[0155]
表4
[0156]
[0157][0158]
假定投标用户a3,目标年龄组为[20,24],具体特征如下表5所示:
[0159]
表5
[0160][0161][0162]
基于上例所给出的保险核验方法,对上述投标用户a1、a2和a3,分别进行计算,可以得到如下表6所示的结果:
[0163]
表6
[0164]
投标用户a1a1a3相似度0.7770870.9561830.556244风险程度条件标准标的标准体拒绝
[0165]
在上例中,通过对投保用户进行风险校验,可以确定投保用户的风险程度,从而可以通过风险程度调整费率或启用加费,以便针对特定客户群体提供合理的投保责任计划。
[0166]
在上例中,通过分析标准体数据,投保用户数据,按照年龄段和性别进行划分,将特定的特征因子进行抽象化,计算与标准体之间的向量相似度,从而确定出投保用户的风险程度,同时在确定相似度的时候,对特征因子按照维度进行分组计算,为每个维度设置权重因子,从而得到最终的相似度结果,通过基于维度的权重值设定,可以按照需求提升核验
结果的准确度,且可以提高核验流程的可控性。
[0167]
本技术上述实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在电子设备上为例,图5是本技术提供的一种核保数据的核验方法的电子设备的硬件结构框图。如图5所示,电子设备10可以包括一个或多个(图中仅示出一个)处理器02(处理器02可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器04、以及用于通信功能的传输模块06。本领域普通技术人员可以理解,图5所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,电子设备10还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。
[0168]
存储器04可用于存储应用软件的软件程序以及模块,如本技术实施例中的核保数据的核验方法对应的程序指令/模块,处理器02通过运行存储在存储器04内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的投保数据核验方法。存储器04可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器04可进一步包括相对于处理器02远程设置的存储器,这些远程存储器可以通过网络连接至电子设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0169]
传输模块06用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备10的通信供应商提供的无线网络。在一个实例中,传输模块06包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块06可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0170]
在软件层面,上述核保数据的核验装置可以如图6所示,可以包括:
[0171]
获取模块601,用于获取目标投保用户的特征数据;
[0172]
量化模块602,用于对所述目标投保用户的特征数据进行量化,得到目标特征向量;
[0173]
匹配模块603,用于根据所述目标投保用户的年龄和/或性别,匹配到与所述目标投保用户关联的标准体的标准特征向量;
[0174]
确定模块604,用于确定所述目标特征向量与所述标准特征向量之间的目标相似度;
[0175]
核验模块605,用于根据所述目标相似度与预设的相似度阈值之间的大小关系,确定所述目标投保用户是否通过核验。
[0176]
在一个实施方式中,确定模块604具体可以用于计算所述目标特征向量与所述标准特征向量之间的余弦相似度:将计算的余弦相似度,作为所述目标特征向量与所述标准特征向量之间的目标相似度。
[0177]
在一个实施方式中,所述目标特征向量和所述标准特征向量被按照维度可以被划分为多个分组,每个分组中至少包括两个或两个以上的特征因子。
[0178]
在一个实施方式中,确定模块604具体可以用于计算所述多个分组中,各个分组对应的目标特征向量和标准特征向量之间的余弦相似度,得到多个中间相似度;获取各个分组对应的权重值,作为各个中间相似度的权重值;根据各个中间相似度和各个中间相似度对应的权重值,计算得到目标相似度。
[0179]
在一个实施方式中,确定模块604具体可以按照如下公式计算中间相似度:
[0180][0181]
其中,sim(paage
ix
)a表示分组a的中间相似度,natv(paage
ix
)v表示目标特征向量,stdv(paage
ix
)v表示标准特征向量,stdfo(paage
ix
)为对应年龄阶段i、性别x的标准体对应的分组pa的特征因子,natfo(paage
ix
)为对应年龄阶段i、性别x的目标投保用户对应的分组a的特征因子,m表示分组a中包含的特征因子的数量。
[0182]
在一个实施方式中,确定模块604具体可以按照如下公式计算目标相似度:
[0183][0184]
其中,fs(age
ix
)表示最终目标相似度,i表示年龄阶段、x表示性别,sim(paage
ix
)a表示分组a的中间相似度,weighta表示分组a对应的权重值,v表示分组的数量。
[0185]
在一个实施方式中,确定模块604具体可以按照如下公式确定每个维度对应的权重值:
[0186][0187]
其中,weighta表示分组a对应的权重值,v表示分组的数量,w
ak
表示分组a自身的相关度,wzk表示分组a与其它分组的相关度,adja表示调整值。
[0188]
在一个实施方式中,核验模块605具体可以在所述目标相似度小于所述相似度阈值的情况下,确定核验未通过;在所述目标相似度大于等于所述相似度阈值的情况下,确定核验通过。
[0189]
在一个实施方式中,核验模块605具体可以在所述目标相似度小于所述相似度阈值的情况下,确定核验未通过之后,计算所述目标相似度与所述相似度阈值之间的相对差值;根据所述相似度差值与预设比较值之间的大小关系,确定所述目标投保用户是否通过核验。
[0190]
本技术的实施例还提供能够实现上述实施例中的核保数据的核验方法中全部步骤的一种电子设备的具体实施方式,所述电子设备具体包括如下内容:处理器(processor)、存储器(memory)、通信接口(communications interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的核保数据的核验方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
[0191]
步骤1:获取目标投保用户的特征数据;
[0192]
步骤2:对所述目标投保用户的特征数据进行量化,得到目标特征向量;
[0193]
步骤3:根据所述目标投保用户的年龄和/或性别,匹配到与所述目标投保用户关联的标准体的标准特征向量;
[0194]
步骤4:确定所述目标特征向量与所述标准特征向量之间的目标相似度;
[0195]
步骤5:根据所述目标相似度与预设的相似度阈值之间的大小关系,确定所述目标投保用户是否通过核验。
[0196]
从上述描述可知,本技术实施例通过对目标投保用户的特征数据进行量化,得到目标特征向量,然后匹配到与其对应的标准体的标准特征向量,确定两者之间的相似度,从而确定目标投保用户是否符合投保标准体的需求,从而实现对投保用户的核验。通过上述方案解决了现有的核保过程需要人工进行所存在的效率和准确率都较低的问题,达到了有效提升核保准确率和效率的技术效果。
[0197]
本技术的实施例还提供能够实现上述实施例中的核保数据的核验方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的核保数据的核验方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
[0198]
步骤1:获取目标投保用户的特征数据;
[0199]
步骤2:对所述目标投保用户的特征数据进行量化,得到目标特征向量;
[0200]
步骤3:根据所述目标投保用户的年龄和/或性别,匹配到与所述目标投保用户关联的标准体的标准特征向量;
[0201]
步骤4:确定所述目标特征向量与所述标准特征向量之间的目标相似度;
[0202]
步骤5:根据所述目标相似度与预设的相似度阈值之间的大小关系,确定所述目标投保用户是否通过核验。
[0203]
从上述描述可知,本技术实施例通过对目标投保用户的特征数据进行量化,得到目标特征向量,然后匹配到与其对应的标准体的标准特征向量,确定两者之间的相似度,从而确定目标投保用户是否符合投保标准体的需求,从而实现对投保用户的核验。通过上述方案解决了现有的核保过程需要人工进行所存在的效率和准确率都较低的问题,达到了有效提升核保准确率和效率的技术效果。
[0204]
本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件 程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0205]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0206]
虽然本技术提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
[0207]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0208]
虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。
[0209]
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0210]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0211]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0212]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0213]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0214]
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的
示例。
[0215]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0216]
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0217]
本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0218]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0219]
以上所述仅为本说明书实施例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献