基于主动学习的商品推荐方法和介质
- 国知局
- 2024-10-09 15:20:57
本发明属于推荐系统,尤其是涉及一种基于主动学习的商品推荐方法和介质。
背景技术:
1、推荐系统(recommender systems)可以用于帮助用户从海量的项目中寻找对用户有利用价值或用户感兴趣的部分,目前已在信息化社会中得当广泛应用。为了产生可靠推荐,推荐系统通常需要大量用户交互数据,当相关数据较少时,推荐的准确性受到制约,因此,当一名新用户进入推荐系统时,由于系统对于用户的了解情况较少,基于协同过滤(collaborative filtering)的推荐算法难以生成可靠的推荐,即会产生用户冷启动问题(user cold-start problem),使得推荐系统在初始阶段难以有效运转。
2、主动学习(active learning)作为在机器学习中,面对数据集中数据量不足或数据种类不全面时的常用方法,也被视为解决用户冷启动问题的主流方法。相比于基于内容的推荐,主动学习不需要任何用户的统计信息,能在充分保护用户隐私的条件下解决用户冷启动问题。现有的主动学习方法,要求用户提供固定数目的评分结果,并依此作为后续产生推荐的依据,例如,中国发明专利cn106127506b公开了一种基于主动学习解决商品冷启动问题的推荐方法,挑选用户基于四个要素对新商品进行评分,使用得到的评分数据对评分模型进行再训练,利用再训练的评分模型预测未挑选用户对新商品的评分,并根据该评分进行商品推荐。然而,主动学习过程中,固定长度的待评分列表,会极大程度的影响用户的全局满意度,具体来说,过长的列表会导致用户的忍耐度降低,用户可能快速的退出系统;而过短的列表会导致系统在主动学习阶段收集的用户偏好不充足,从而影响后续推荐的准确度。由于推荐系统与每一个用户的交互情况不一致,即完全相同的待评分列表对于部分用户可能是过长,而对于其他用户是过短,因此,如何控制不同用户退出主动学习的时机,确保推荐系统既能充分收集用户的偏好信息,以生成高质量的推荐结果,同时又可以避免用户因为主动学习阶段冗长弃用推荐系统,是亟待解决的关键问题。
技术实现思路
1、本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于主动学习的商品推荐方法和介质,既可以确保充分收集用户的偏好信息,生成高质量的推荐结果,同时又可以避免用户因为主动学习阶段冗长弃用推荐系统。
2、本发明的目的可以通过以下技术方案来实现:
3、本发明提供一种基于主动学习的商品推荐方法,包括以下步骤:
4、获取推荐系统新用户在主动学习阶段生成的用户交互数据,据此进行商品推荐;
5、其中,基于量化推荐相关性判断推荐系统新用户是否需要退出主动学习,所述量化推荐相关性基于当前评分预估结果与初始评分预估结果的差异进行计算,所述初始评分预估结果基于推荐系统初始用户交互数据计算,所述当前评分预估结果基于推荐系统新用户对待评分项目的评分计算。
6、进一步地,以预估方差为指标选取所述待评分项目,所述预估方差包括熵、最大评分和最小评分指标。
7、进一步地,所述预估方差的计算公式具体如下:
8、
9、其中,vp为预估方差,ui为与物品i有过交互的用户集合,为用户u′i对物品i的评分结果,对应熵,为特定用户u在轮数t对物品i的预估评分,对应最大评分和最小评分指标。
10、进一步地,所述量化推荐相关性的计算公式具体如下:
11、
12、其中,r为量化推荐相关性,i为待评分项目的集合,为初始评分预估结果,为当前评分预估结果,t为推荐轮数,u为用户标识符。
13、进一步地,基于所述量化推荐相关性判断推荐系统新用户是否需要退出主动学习的具体过程如下:
14、s301、基于量化推荐相关性进行曲线拟合,得到曲线上界a;
15、s302、判断是否满足:若是,则需要退出主动学习,其中,r为量化推荐相关性,t为推荐轮数,u为用户标识符,k为偏好信息阈值。
16、进一步地,步骤s301中,通过指数函数进行曲线拟合。
17、进一步地,步骤s302中,同时还需考虑是否满足:若是,则需要退出主动学习,其中,v为偏好信息增益,g为偏好信息增益阈值。
18、进一步地,所述偏好信息增益v的计算公式具体如下:
19、
20、其中,z为滑动窗口大小。
21、进一步地,通过评分预估算法计算所述初始评分预估结果和所述当前评分预估结果。
22、本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述方法。
23、与现有技术相比,本发明具有以下有益效果:
24、1、本发明提出一种基于主动学习的商品推荐方法,根据推荐系统新用户在主动学习阶段生成的用户交互数据进行商品推荐,特别地,判断推荐系统新用户是否需要退出主动学习的过程为:首先获取推荐系统初始用户交互数据,计算初始评分预估结果,然后获取推荐系统新用户对主动学习中待评分项目的评分,计算当前评分预估结果,基于当前评分预估结果与初始评分预估结果的差异,计算量化推荐相关性,据此判断推荐系统新用户是否需要退出主动学习,上述方法可以步进式决定推荐系统新用户退出主动学习阶段的时机,在确保收集到充足的用户偏好信息以产生高质量的推荐结果的同时,避免用户因为主动学习阶段冗长而弃用系统。
25、2、本发明构建了预估方差这一新指标选取待评分项目,预估方差融合了熵、最大评分和最小评分指标,其中,熵可以用于表示不同评分之间的离散程度,最大评分和最小评分指标有助于了解项目的评分范围和极值情况,因此预估方差够综合考量待评分项目的评分分布、不确定性和差异性,提供更全面、准确的评估结果,本发明提出的待评分项目的选取方式,可以与大量的主动学习方法和部分非主动学习方法相结合,解决用户冷启动问题。
技术特征:1.一种基于主动学习的商品推荐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于主动学习的商品推荐方法,其特征在于,以预估方差为指标选取所述待评分项目,所述预估方差包括熵、最大评分和最小评分指标。
3.根据权利要求2所述的一种基于主动学习的商品推荐方法,其特征在于,所述预估方差的计算公式具体如下:
4.根据权利要求1所述的一种基于主动学习的商品推荐方法,其特征在于,所述量化推荐相关性的计算公式具体如下:
5.根据权利要求1所述的一种基于主动学习的商品推荐方法,其特征在于,基于所述量化推荐相关性判断推荐系统新用户是否需要退出主动学习的具体过程如下:
6.根据权利要求5所述的一种基于主动学习的商品推荐方法,其特征在于,步骤s301中,通过指数函数进行曲线拟合。
7.根据权利要求5所述的一种基于主动学习的商品推荐方法,其特征在于,步骤s302中,同时还需考虑是否满足:若是,则需要退出主动学习,其中,v为偏好信息增益,g为偏好信息增益阈值。
8.根据权利要求7所述的一种基于主动学习的商品推荐方法,其特征在于,所述偏好信息增益v的计算公式具体如下:
9.根据权利要求1所述的一种基于主动学习的商品推荐方法,其特征在于,通过评分预估算法计算所述初始评分预估结果和所述当前评分预估结果。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。
技术总结本发明涉及一种基于主动学习的商品推荐方法和介质,包括以下步骤:获取推荐系统新用户在主动学习阶段生成的用户交互数据,据此进行商品推荐;其中,基于量化推荐相关性判断推荐系统新用户是否需要退出主动学习,所述量化推荐相关性基于当前评分预估结果与初始评分预估结果的差异进行计算,所述初始评分预估结果基于推荐系统初始用户交互数据计算,所述当前评分预估结果基于推荐系统新用户对待评分项目的评分计算。与现有技术相比,本发明既可以确保推荐系统生成高质量的推荐结果,同时又可以避免用户因为主动学习阶段冗长而弃用推荐系统。技术研发人员:赵生捷,钱思伟,王洁受保护的技术使用者:同济大学技术研发日:技术公布日:2024/9/29本文地址:https://www.jishuxx.com/zhuanli/20241009/308445.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。