数据处理方法、装置、电子设备及计算机可读存储介质与流程
- 国知局
- 2024-10-21 14:58:04
本技术涉及大数据,具体而言,本技术涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。
背景技术:
1、计算机和通信技术的发展使得人们能够大规模的访问和共享信息,在社会研究中,用户行为的分析和建模具有重要意义;用户画像是指根据用户的属性、偏好、行为习惯等信息而抽象出来的标签化用户模型,作为实际用户的虚拟代表,用户画像所形成的用户角色需要有代表性,能代表产品或市场的主要受众和目标群体。
2、现有技术中的用户画像方法即针对目标对象构建对象数据,只能针对同一类型的特征数据进行分析和处理,无法对不同用户群即目标对象集合基于不同特征标签进行用户画像,导致画像模型无法迁移于不同应用场景,需要针对新的应用场景创建相匹配的新的用户画像模型,增加了筛选特征数据的成本,存在构建画像数据的效率低下的问题。
技术实现思路
1、本技术实施例提供了一种数据处理方法、装置、电子设备及计算机可读存储介质,可以解决现有技术中构建画像数据效率低下的问题。所述技术方案如下:
2、根据本技术实施例的一个方面,提供了一种数据处理方法,该方法包括:
3、获取筛选信息,从预设的候选对象集合中筛选出与筛选信息对应的目标对象集合;
4、从预设的多个候选特征标签中确定与目标对象集合对应的至少一个第一特征标签;
5、确定目标对象集合的对象类型;其中,对象类型是基于目标对象集合中目标对象的数量所确定的;
6、根据对象类型,基于各个第一特征标签以及第一特征标签对应的特征数据类型,确定目标对象集合的第一标签特征值;其中,第一标签特征值用于表征第一特征标签与目标对象集合的关联强度;
7、根据目标对象集合的第一标签特征值,构建目标对象集合对应第一特征标签的对象数据。
8、在一个可能的实现方式中,上述确定目标对象集合的对象类型之前,还包括:
9、查询第一特征标签所对应的对象数据;
10、确定目标对象集合的对象类型,包括:
11、若第一特征标签所对应对的对象数据不存在,则确定目标对象集合的对象类型。
12、在一个可能的实现方式中,上述根据对象类型,基于各个第一特征标签以及第一特征标签对应的特征数据类型,确定目标对象集合的第一标签特征值之前,包括:
13、若目标对象集合中的目标对象的数量大于或等于预设数量阈值,则从目标对象集合中抽取目标对象子集;
14、基于各个第一特征标签以及第一特征标签对应的特征数据类型,确定目标对象集合的第一标签特征值,包括:
15、基于各个第一特征标签以及第一特征标签对应的特征数据类型,确定目标对象子集的第一标签特征值,将所确定的目标对象子集的第一标签特征值作为目标对象集合的第一标签特征值。
16、在又一个可能的实现方式中,上述方法还包括:
17、当接收到针对目标对象集合的深度分析指令,根据深度分析指令从多个候选特征标签中确定与目标对象集合对应的至少一个第二特征标签;
18、基于第二特征标签,获取目标对象集合的第二标签特征值;
19、对各第二标签特征值进行排序,根据排序结果和各第二特征标签的分类层级选取目标标签和目标标签所对应的标签值;
20、将目标标签和目标标签所对应的标签值添加到对象数据中,得到更新后的对象数据。
21、在又一个可能的实现方式中,上述获取目标对象集合的第二标签特征值之前,包括:
22、基于第二特征标签查询目标对象集合的第二标签特征值;
23、获取目标对象集合的第二标签特征值,包括:
24、若第二标签特征值存在,则从对象数据中获取第二标签特征值。
25、在另一个可能的实现方式中,上述获取目标对象集合的第二标签特征值,还包括:
26、若第二标签特征值不存在,则根据第二特征标签生成针对目标对象集合的查询指令;
27、执行查询指令,生成第二特征标签对应的第二标签特征值。
28、在另一个可能的实现方式中,上述执行查询指令,生成第二特征标签对应的第二标签特征值,包括:
29、当目标对象集合的数量为至少两个时,获取各目标对象集合所对应的第二特征标签的标签值的统计信息;
30、将各目标对象集合对应的统计信息的差值,作为第二标签特征值。
31、根据本技术实施例的另一个方面,提供了一种数据处理装置,该装置包括:
32、筛选模块,用于获取筛选信息,从预设的候选对象集合中筛选出与筛选信息对应的目标对象集合;
33、第一确定模块,用于从预设的多个候选特征标签中确定与目标对象集合对应的至少一个第一特征标签;
34、第二确定模块,用于确定目标对象集合的对象类型;其中,对象类型是基于目标对象集合中目标对象的数量所确定的;
35、第三确定模块,用于根据对象类型,基于各个第一特征标签以及第一特征标签对应的特征数据类型,确定目标对象集合的第一标签特征值;其中,第一标签特征值用于表征第一特征标签与目标对象集合的关联强度;
36、构建模块,用于根据目标对象集合的第一标签特征值,构建目标对象集合对应第一特征标签的对象数据。
37、在一个可能的实现方式中,上述第二确定模块在确定目标对象集合的对象类型之前,还用于:
38、查询第一特征标签所对应的对象数据;
39、确定目标对象集合的对象类型,包括:
40、若第一特征标签所对应对的对象数据不存在,则确定目标对象集合的对象类型。
41、在一个可能的实现方式中,上述第三确定模块在根据对象类型,基于各个第一特征标签以及第一特征标签对应的特征数据类型,确定目标对象集合的第一标签特征值之前,还用于:
42、若目标对象集合中的目标对象的数量大于或等于预设数量阈值,则从目标对象集合中抽取目标对象子集;
43、基于各个第一特征标签以及第一特征标签对应的特征数据类型,确定目标对象集合的第一标签特征值,包括:
44、基于各个第一特征标签以及第一特征标签对应的特征数据类型,确定目标对象子集的第一标签特征值,将所确定的目标对象子集的第一标签特征值作为目标对象集合的第一标签特征值。
45、在又一个可能的实现方式中,上述装置,还包括深度分析模块,用于:
46、当接收到针对目标对象集合的深度分析指令,根据深度分析指令从多个候选特征标签中确定与目标对象集合对应的至少一个第二特征标签;
47、基于第二特征标签,获取目标对象集合的第二标签特征值;
48、对各第二标签特征值进行排序,根据排序结果和各第二特征标签的分类层级选取目标标签和目标标签所对应的标签值;
49、将目标标签和目标标签所对应的标签值添加到对象数据中,得到更新后的对象数据。
50、在又一个可能的实现方式中,上述深度分析模块在获取目标对象集合的第二标签特征值之前,还用于:
51、基于第二特征标签查询目标对象集合的第二标签特征值;
52、获取目标对象集合的第二标签特征值,包括:
53、若第二标签特征值存在,则从对象数据中获取第二标签特征值。
54、在另一个可能的实现方式中,上述深度分析模块在获取目标对象集合的第二标签特征值时,还用于:
55、若第二标签特征值不存在,则根据第二特征标签生成针对目标对象集合的查询指令;
56、执行查询指令,生成第二特征标签对应的第二标签特征值。
57、在另一个可能的实现方式中,上述深度分析模块在执行查询指令,生成第二特征标签对应的第二标签特征值时,用于:
58、当目标对象集合的数量为至少两个时,获取各目标对象集合所对应的第二特征标签的标签值的统计信息;
59、将各目标对象集合对应的统计信息的差值,作为第二标签特征值。
60、根据本技术实施例的另一个方面,提供了一种电子设备,该电子设备包括:存储器、处理器及存储在存储器上的计算机程序,上述处理器执行计算机程序以实现本技术实施例第一方面所示方法的步骤。
61、根据本技术实施例的再一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本技术实施例第一方面所示方法的步骤。
62、根据本技术实施例的一个方面,提供了一种计算机程序产品,其包括计算机程序,该计算机程序被处理器执行时实现本技术实施例第一方面所示方法的步骤。
63、本技术实施例提供的技术方案带来的有益效果是:
64、本技术实施例通过筛选信息从候选对象集合中筛选出目标对象集合,并从预设的多个候选特征标签中确定与目标对象集合对应的至少一个第一特征标签;接着基于目标对象集合中目标对象的数量确定对象类型,并根据对象类型、基于各第一特征标签以及第一特征标签对应的特征数据类型,确定目标对象集合的第一标签特征值;进而根据目标对象集合的第一标签特征值,构建目标对象集合对应第一特征标签的对象数据;本技术实施例通过对象类型和各第一特征标签对应的特征数据类型确定目标对象集合的第一标签特征值,实现了针对不同类型的特征标签计算对应第一标签特征值。由于第一特征标签值可以表征第一特征标签与目标对象集合的关联强度,实现了第一特征标签与目标对象集合的有效关联,增强了对象数据的准确性。
65、同时,区别于现有技术中无法适配于不同目标对象集合和不同类型的特征标签,本技术实施例可以根据第一特征标签对应的特征数据类型确定对应的目标对象集合的第一标签特征值;可以提升画像数据构建系统的可迁移性,有效提高目标对象集合的特征数据的分析和处理效率。
本文地址:https://www.jishuxx.com/zhuanli/20241021/319977.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。