基于贪心算法的用户画像最优属性组确定方法和装置与流程
- 国知局
- 2024-07-31 22:50:25
本发明涉及计算机,特别涉及人工智能,尤其涉及一种基于贪心算法的用户画像最优属性组确定方法和装置。
背景技术:
1、在互联网时代,数据驱动信息的流动。各行各业通过数据分析挖掘商机,数据日益成为一种资产财富,但是数据的获取是有成本的。用户画像的构建需要大量属性数据,基于数据是一种资产的思想,多指标必然会带来高成本,但同时也会构建更完善的用户画像。因此,一个用户画像的构建需要考虑到数据成本与属性数据两者间的平衡。相关技术中,用户画像属性选择方案侧重于挖掘数据本身的价值或者仅关注数据数量,若仅关注数据本身的价值,忽略企业对数据的获取成本,会造成数据成本过高;若仅关注数据数量,直接获取海量数据源信息进行直接处理,导致资源消耗高,最终形成的用户画像属性组的可能不是最优选择,应用性能较差。
技术实现思路
1、本发明的一个目的在于提供一种基于贪心算法的用户画像最优属性组确定方法,能够在一定数据成本下,将数据的信息量最大化,平衡了数据成本和信息价值,降低了资源消耗和数据成本,提高数据价值,从而提高了最终形成的用户画像最优属性组的应用性能。本发明的另一个目的在于提供一种基于贪心算法的用户画像最优属性组确定装置。本发明的再一个目的在于提供一种计算机可读介质。本发明的还一个目的在于提供一种计算机设备。
2、为了达到以上目的,本发明一方面公开了一种基于贪心算法的用户画像最优属性组确定方法,包括:
3、根据用户画像数据源,确定出样本数据,样本数据包括多个属性指标;
4、通过熵权法,根据样本数据,生成信息权重数据;
5、通过熵权法,根据获取的属性指标的成本评分数据,生成成本权重数据;
6、基于贪心算法,根据信息权重数据和成本权重数据,生成用户画像的最优属性组。
7、优选的,通过熵权法,根据样本数据,生成信息权重数据,包括:
8、通过极值法对样本数据进行无量纲化处理,生成无量纲样本矩阵;
9、对无量纲样本矩阵进行平移处理,生成平移后的无量纲样本矩阵;
10、对平移后的无量纲样本矩阵进行标准化处理,生成信息权重数据。
11、优选的,样本数据包括每个属性指标对应的样本属性值;
12、通过极值法对样本数据进行无量纲化处理,生成无量纲样本矩阵,包括:
13、根据样本数据,获取属性指标的最大值和最小值;
14、根据属性指标的样本属性值、最大值和最小值,生成属性指标的无量纲样本属性值;
15、根据多个属性指标和每个属性指标的无量纲样本属性值,生成无量纲样本矩阵。
16、优选的,对平移后的无量纲样本矩阵进行标准化处理,生成信息权重数据,包括:
17、根据平移后的无量纲样本矩阵中每个无量纲样本属性值,生成特征比重矩阵;
18、根据特征比重矩阵进行熵值计算,生成属性熵值矩阵,属性熵值矩阵包括多个属性指标和每个属性指标的熵值;
19、对属性熵值矩阵进行差异性系数计算,生成差异性系数矩阵,差异性系数矩阵包括多个属性指标和每个属性指标的差异性系数;
20、根据差异性系数矩阵,生成信息权重数据,信息权重数据包括多个属性指标和每个属性指标的信息权重。
21、优选的,成本评分数据包括多个属性指标和每个属性指标对应的成本评分值;
22、通过熵权法,根据获取的属性指标的成本评分数据,生成成本权重数据,包括:
23、通过极值法对成本评分数据进行无量纲化处理,生成无量纲成本矩阵;
24、对无量纲成本矩阵进行平移处理,生成平移后的无量纲成本矩阵;
25、对平移后的无量纲成本矩阵进行标准化处理,生成成本权重数据。
26、优选的,基于贪心算法,根据信息权重数据和成本权重数据,生成用户画像的最优属性组,包括:
27、根据信息权重数据和成本权重数据,生成单位成本信息;
28、按照单位成本信息,对属性指标进行排序,生成排序后的属性指标;
29、根据预设的实际成本值和实际指标数量进行初始化,生成初始化状态;
30、通过预设的状态转移方程,根据初始化状态和成本权重数据,对排序后的属性指标进行遍历,生成用户画像的最优属性组。
31、本发明还公开了一种基于贪心算法的用户画像最优属性组确定装置,包括:
32、样本数据确定单元,用于根据用户画像数据源,确定出样本数据,样本数据包括多个属性指标;
33、信息权重生成单元,用于通过熵权法,根据样本数据,生成信息权重数据;
34、成本权重生成单元,用于通过熵权法,根据获取的属性指标的成本评分数据,生成成本权重数据;
35、最优属性组生成单元,用于基于贪心算法,根据信息权重数据和成本权重数据,生成用户画像的最优属性组。
36、本发明还公开了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述方法。
37、本发明还公开了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述处理器执行所述程序时实现如上所述方法。
38、本发明还公开了一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现如上所述方法。
39、本发明根据用户画像数据源,确定出样本数据,样本数据包括多个属性指标;通过熵权法,根据样本数据,生成信息权重数据;通过熵权法,根据获取的属性指标的成本评分数据,生成成本权重数据;基于贪心算法,根据信息权重数据和成本权重数据,生成用户画像的最优属性组,能够在一定数据成本下,将数据的信息量最大化,平衡了数据成本和信息价值,降低了资源消耗和数据成本,提高数据价值,从而提高了最终形成的用户画像最优属性组的应用性能。
技术特征:1.一种基于贪心算法的用户画像最优属性组确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于贪心算法的用户画像最优属性组确定方法,其特征在于,所述通过熵权法,根据所述样本数据,生成信息权重数据,包括:
3.根据权利要求2所述的基于贪心算法的用户画像最优属性组确定方法,其特征在于,所述样本数据包括每个属性指标对应的样本属性值;
4.根据权利要求2所述的基于贪心算法的用户画像最优属性组确定方法,其特征在于,所述对所述平移后的无量纲样本矩阵进行标准化处理,生成所述信息权重数据,包括:
5.根据权利要求1所述的基于贪心算法的用户画像最优属性组确定方法,其特征在于,所述成本评分数据包括多个属性指标和每个属性指标对应的成本评分值;
6.根据权利要求1所述的基于贪心算法的用户画像最优属性组确定方法,其特征在于,所述基于贪心算法,根据所述信息权重数据和成本权重数据,生成用户画像的最优属性组,包括:
7.一种基于贪心算法的用户画像最优属性组确定装置,其特征在于,所述装置包括:
8.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至6任一项所述的基于贪心算法的用户画像最优属性组确定方法。
9.一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于,所述程序指令被处理器加载并执行时实现权利要求1至6任一项所述的基于贪心算法的用户画像最优属性组确定方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至6任一项所述的基于贪心算法的用户画像最优属性组确定方法。
技术总结本发明实施例提供了一种基于贪心算法的用户画像最优属性组确定方法和装置,可用于人工智能技术领域,所述方法包括:根据用户画像数据源,确定出样本数据,样本数据包括多个属性指标;通过熵权法,根据样本数据,生成信息权重数据;通过熵权法,根据获取的属性指标的成本评分数据,生成成本权重数据;基于贪心算法,根据信息权重数据和成本权重数据,生成用户画像的最优属性组,能够在一定数据成本下,将数据的信息量最大化,平衡了数据成本和信息价值,降低了资源消耗和数据成本,提高数据价值,从而提高了最终形成的用户画像最优属性组的应用性能。技术研发人员:毕国耀受保护的技术使用者:中国工商银行股份有限公司技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/194924.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表