推荐模型的训练方法、推荐方法、装置、电子设备及介质与流程

2021-12-01 01:38:00 来源：中国专利 TAG：

技术特征：
1.一种推荐模型的训练方法，包括：基于用户在第一历史时间段内针对第一对象发布者的第一行为信息，确定所述用户对所述第一对象发布者的第一偏好值；将所述第一发布者的信息和所述用户的当前信息输入待训练推荐模型，以得到所述待训练推荐模型所输出的第二偏好值；以及基于所述第一偏好值和所述第二偏好值，调整所述待训练推荐模型的参数。2.根据权利要求1所述的方法，其中，所述基于用户在第一历史时间段内针对第一对象发布者的第一行为信息，确定所述用户对所述第一对象发布者的第一偏好值包括：基于所述第一行为信息，利用预测模型预测所述用户在所述第一历史时间段之后对所述第一对象发布者所发布的对象的点击概率；以及基于预测得到的所述点击概率，确定所述第一偏好值。3.根据权利要求2所述的方法，其中，所述第一行为信息包括多个第一子行为信息，所述基于所述第一行为信息，利用预测模型预测所述用户在所述第一历史时间段之后对所述第一对象发布者所发布的对象的点击概率包括：利用所述预测模型，确定所述多个第一子行为信息中的每一个第一子行为信息所对应的系数的加权和，其中，针对所述多个第一子行为信息中的每一个第一子行为信息，该第一子行为信息的权重与该第一子行为信息与当前时刻的之间的时间间隔长短负相关；以及基于所述加权和确定所述点击概率。4.根据权利要求1所述的方法，其中，所述针对所述第一对象发布者的所述第一行为信息包括以下至少一种：针对所述第一对象发布者的互动行为信息；或针对所述第一对象发布者所发布的对象的互动行为信息。5.根据权利要求1所述的方法，其中，所述用户的当前信息包括用户在第二历史时间段内的第二行为信息，所述第二历史时间段的终止时刻为当前时刻，所述第二历史时间段小于所述第一历史时间段。6.根据权利要求5所述的方法，其中，所述用户的当前信息还包括以下至少一种：用户的属性信息；用户所关注的对象发布者的信息；或用户所关注的对象所对应的对象发布者的信息。7.一种推荐方法，包括：获取待推荐对象所对应的对象发布者的信息；将所述对象发布者的信息和用户的当前信息输入推荐模型，以得到所述推荐模型所输出的预测偏好值，其中，所述推荐模型为根据权利要求1至6中任意一项训练而得到的；以及至少基于所述预测偏好值，执行对所述待推荐对象的推荐。8.根据权利要求7所述的方法，其中，所述用户的当前信息包括用户在第二历史时间段内的第二行为信息，所述第二历史时间段的终止时刻为当前时刻，所述方法还包括：基于所述用户的第二行为信息，确定所述用户对所述待推荐对象所对应的对象发布者的当前偏好值；其中，所述至少基于所述预测偏好值，执行对所述待推荐对象的推荐包括：
基于所述预测偏好值和所述当前偏好值，执行对所述待推荐对象的推荐。9.一种推荐模型的训练装置，包括：第一确定单元，被配置用于基于用户在第一历史时间段内针对第一对象发布者的第一行为信息，确定所述用户对所述第一对象发布者的第一偏好值；输入单元，被配置用于将所述第一发布者的信息和所述用户的当前信息输入待训练推荐模型，以得到所述待训练推荐模型所输出的第二偏好值；以及调整单元，被配置用于基于所述第一偏好值和所述第二偏好值，调整所述待训练推荐模型的参数。10.根据权利要求9所述的装置，其中，所述第一确定单元包括：预测子单元，被配置用于基于所述第一行为信息，利用预测模型预测所述用户在所述第一历史时间段之后对所述第一对象发布者所发布的对象的点击概率；以及确定子单元，被配置用于基于预测得到的所述点击概率，确定所述第一偏好值。11.根据权利要求10所述的装置，其中，所述第一行为信息包括多个第一子行为信息，所述预测子单元进一步包括：利用所述预测模型，确定所述多个第一子行为信息中的每一个第一子行为信息所对应的系数的加权和，其中，针对所述多个第一子行为信息中的每一个第一子行为信息，该第一子行为信息的权重与该第一子行为信息与当前时刻的之间的时间间隔长短负相关的模块；以及基于所述加权和确定所述点击概率的模块。12.根据权利要求9所述的装置，其中，所述针对所述第一对象发布者的所述第一行为信息包括以下至少一种：针对所述第一对象发布者的互动行为信息；或针对所述第一对象发布者所发布的对象的互动行为信息。13.根据权利要求9所述的装置，其中，所述用户的当前信息包括用户在第二历史时间段内的第二行为信息，所述第二历史时间段的终止时刻为当前时刻，所述第二历史时间段小于所述第一历史时间段。14.根据权利要求13所述的装置，其中，所述用户的当前信息还包括以下至少一种：用户的属性信息；用户所关注的对象发布者的信息；或用户所关注的对象所对应的对象发布者的信息。15.一种推荐装置，包括：第一获取单元，被配置用于获取待推荐对象所对应的对象发布者的信息；第二获取单元，被配置用于将所述对象发布者的信息和用户的当前信息输入推荐模型，以获取所述推荐模型所输出的预测偏好值，其中，所述推荐模型为根据权利要求1至6中任意一项训练而得到的；以及推荐单元，被配置用于至少基于所述预测偏好值，执行对所述待推荐对象的推荐。16.根据权利要求15所述的装置，其中，所述用户的当前信息包括用户在第二历史时间段内的第二行为信息，所述第二历史时间段的终止时刻为当前时刻，所述装置还包括：第二确定单元，被配置用于基于所述用户的第二行为信息，确定所述用户对所述待推
荐对象所对应的对象发布者的当前偏好值；其中，所述推荐单元进一步包括：基于所述预测偏好值和所述当前偏好值，执行对所述待推荐对象的推荐的模块。17.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1
‑
8中任一项所述的方法。18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1
‑
8中任一项所述的方法。19.一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现权利要求1
‑
8中任一项所述的方法。

技术总结
本公开提供了一种推荐模型的训练方法、推荐方法、装置、电子设备及介质，涉及人工智能领域，尤其涉及内容推荐和深度学习领域。实现方案为：基于用户在第一历史时间段内针对第一对象发布者的第一行为信息，确定用户对第一对象发布者的第一偏好值；将第一发布者的信息和用户的当前信息输入待训练推荐模型，以得到待训练推荐模型所输出的第二偏好值；以及基于第一偏好值和第二偏好值，调整待训练推荐模型的参数。数。数。

技术研发人员：崔曦元
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：2021.09.01
技术公布日：2021/11/30

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种面向跨版本缺陷预测的演化程度度量方法与流程

推荐模型的训练方法、推荐方法、装置、电子设备及介质与流程

相关文献

最热文献