一种基于RFM模型及KMeans聚类的IPTV价值用户挖掘的方法及系统与流程
- 国知局
- 2024-07-31 23:21:08
本发明涉及大数据分析,具体为一种基于rfm模型及kmeans聚类的iptv价值用户挖掘的方法及系统。
背景技术:
1、iptv是基于家庭宽带网络的多媒体电视业务,大屏点播收入是家庭市场的重要收入来源,也是集团公司六大类战旅产品图谱的重要标识。随着业务的纵深发展,将逐渐从个体向家庭领域拓展和延伸,运营商作为宽带接入的重要渠道,在家庭领域有天然的接入优势,家庭领域的增值业务将为运营商打开新的收入空间。
2、现有技术中,为促进iptv业务的发展,完成iptv增值业务收入的目标,相关业务平台建设完成及各场景业务流程完善后,iptv业务运营将成为业务持续稳定发展的重要工作和关键点,以提高用户活跃度,增强客户粘性,增加增值产品包订购收入。通过对用户价值进行精准分层,并针对不同用户制定不同运营策略,以达到用户精准营销的策略,提升顾客满意度与忠诚度,提升企业核心竞争力,助力大屏业务规模、收入双跃升。采用用户价值分析中最经典的rfm模型,数据的可获得性强,模型的分层可解释性强等优点,结合机器学习中k-means算法,该算法思想简单、收敛速度快;在对大规模数据集进行聚类分析时,算法聚类较高效且效果较好;当数据集的结构分布是球形或类球形或者其他凸形的结构时,k-means算法能高效的发现类簇结构;算法对数值型数据的聚类效果好,聚类结果也与数据的输入顺序无关。
3、因此,我们需要一种基于rfm模型及kmeans聚类的iptv价值用户挖掘的方法及系统,用来打破原有业务分析模型的现状,设计新型数据挖掘模式,创新设计线上屏幕点播、线下实体渠道及移动电子渠道共同营销、共同订购的新模式,有效拓增用户规模及收入。
技术实现思路
1、本发明的目的在于提供一种基于rfm模型及kmeans聚类的iptv价值用户挖掘的方法及系统,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种基于rfm模型及kmeans聚类的iptv价值用户挖掘的方法,所述方法包括以下步骤:
3、数据处理,实现导入数据、探索数据以及数据清洗;
4、用户消费行为分析;
5、rfm模型构建,衡量用户价值和用户创造利益能力;
6、通过k-means聚类算法,对用户价值进行精准分层,并针对不同用户制定不同运营策略,以达到用户精准营销的策略。
7、优选的,数据处理的具体操作包括:
8、导入数据时,包括数据来源,通过对用户数据、用户单次订购和周期订购数据进行关联,获取所需的用户订购数据,其字段包含:订单号,iptv账号,地区,商品编号,商品名称,订单金额,付款金额,订单类型,下单时间,开始时间,结束时间,付款方式,是否退款信息;
9、探索数据时,查看整体数据情况,数据类型是否正常、关键数据值是否有缺失、付款金额是否有异常,对数据做一个整体掌握;查看数据规模,包含785874行,13列数据,其中地区和商品名称存在空值,订单金额有存在0的订单数据;
10、数据清洗时,对数据进行去文本空格处理;对数据集中的重复数据进行去重处理;对数据集中缺失值进行填充处理,将地区描述字段中空值填充成“其他”;对数据集中付款金额小于等于0的数据进行删除处理;用直方图和核密度显示“订单金额”的数据分布:将地区字段进行整合处理,把地级市和县统一归纳为8个地市,空值设置为其他;将时间数据转化为日期类型。
11、优选的,用户消费行为分析的具体操作包括:
12、用户退款情况统计分析、用户订购商品分布情况分析、用户订购方式情况分析以及用户订购金额情况分析。
13、优选的,rfm模型构建,衡量用户价值和用户创造利益能力的具体操作包括:
14、3个特征指标分别是最近一次消费r、消费频率f和消费金额m,根据用户3个维度r、f、m值的差异,对用户进行划分,通过rfm模型,将用户实现等级划分;制定个性化的沟通和营销服务,为更多的营销决策提供有力支持;衡量客户价值和客户利润创收能力。
15、优选的,通过k-means聚类算法,对用户价值进行精准分层,并针对不同用户制定不同运营策略,以达到用户精准营销的策略的具体操作包括:
16、在实现聚类之前,对数据进行标准化处理,消除不同量纲对距离计算的影响,采用手肘法和轮廓系数来选择最佳的k值,即用户的类别数量。
17、一种基于rfm模型及kmeans聚类的iptv价值用户挖掘系统,所述系统由数据处理模块、行为分析模块、模型构建模块以及分层模块组成;
18、数据处理模块,实现导入数据、探索数据以及数据清洗;
19、行为分析模块,用于用户消费行为分析;
20、模型构建模块,用于rfm模型构建,衡量用户价值和用户创造利益能力;
21、分层模块,通过k-means聚类算法,对用户价值进行精准分层,并针对不同用户制定不同运营策略,以达到用户精准营销的策略。
22、优选的,数据处理模块,导入数据时,包括数据来源,通过对用户数据、用户单次订购和周期订购数据进行关联,获取所需的用户订购数据,其字段包含:订单号,iptv账号,地区,商品编号,商品名称,订单金额,付款金额,订单类型,下单时间,开始时间,结束时间,付款方式,是否退款信息;
23、探索数据时,查看整体数据情况,数据类型是否正常、关键数据值是否有缺失、付款金额是否有异常,对数据做一个整体掌握;查看数据规模,包含785874行,13列数据,其中地区和商品名称存在空值,订单金额有存在0的订单数据;
24、数据清洗时,对数据进行去文本空格处理;对数据集中的重复数据进行去重处理;对数据集中缺失值进行填充处理,将地区描述字段中空值填充成“其他”;对数据集中付款金额小于等于0的数据进行删除处理;用直方图和核密度显示“订单金额”的数据分布:将地区字段进行整合处理,把地级市和县统一归纳为8个地市,空值设置为其他;将时间数据转化为日期类型。
25、优选的,行为分析模块,用户退款情况统计分析、用户订购商品分布情况分析、用户订购方式情况分析以及用户订购金额情况分析。
26、优选的,模型构建模块,3个特征指标分别是最近一次消费r、消费频率f和消费金额m,根据用户3个维度r、f、m值的差异,对用户进行划分,通过rfm模型,将用户实现等级划分;制定个性化的沟通和营销服务,为更多的营销决策提供有力支持;衡量客户价值和客户利润创收能力。
27、优选的,分层模块,在实现聚类之前,对数据进行标准化处理,消除不同量纲对距离计算的影响,采用手肘法和轮廓系数来选择最佳的k值,即用户的类别数量。
28、与现有技术相比,本发明的有益效果是:
29、本发明提出的基于rfm模型及kmeans聚类的iptv价值用户挖掘的方法及系统,基于rfm模型及kmeans聚类算法,对iptv价值用户进行挖掘,具备技术逻辑架构成熟、代码健硕性强、运行高效、高度的可解耦性等优点,可大力推广到对价值用户进行挖掘,为创造更高的经济价值和社会影响力。同时该技术模型具有极大地可复制性和可参考价值,为增值业务运营起到辅助作用。
30、打破传统的数据分析思路和方法,提高了科技创新的工作效率,加快科技成果的推广应用,实现增产增效,提高iptv增值业务收入。同时,打破传统的重科研、轻推广的观念,充分发挥本项目的科技优势,加速本项目成果的转化应用,提高了其他业务系统的市场收入。
31、在推广新技术、促进科技成果转化应用方面,团队成员积极高效的配合其他业务系统选取模型、对比各个算法优势、获取数据、对数据进行清洗处理等工作,为项目落地起到了巨大的推动作用,实现了广泛推广性的巨大价值。
本文地址:https://www.jishuxx.com/zhuanli/20240730/197148.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表