一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种预测模型的训练方法、信息推送的方法及装置与流程

2021-11-25 00:11:00 来源:中国专利 TAG:

技术特征:
1.一种预测模型的训练方法,其特征在于,预测模型包括每个业务场景对应的子预测层,以及场景权重层,包括:针对每个业务场景,获取该业务场景下的目标训练样本,所述目标训练样本包括在该业务场景下,向用户推送的历史推送信息以及用户的相关信息;根据所述历史推送信息以及所述相关信息,确定所述目标训练样本在该业务场景下对应的场景特征,以及所述目标训练样本针对所有业务场景下对应的综合特征,以及将该业务场景对应的标识信息输入到所述场景权重层,确定该业务场景针对所述综合特征进行加权所需的场景权重矩阵;将所述场景特征以及利用所述场景权重矩阵加权后的综合特征输入到该业务场景对应的子预测层中,得到针对所述历史推送信息的预测点击率;根据所述预测点击率以及所述目标训练样本对应的标签信息,对所述预测模型训练。2.如权利要求1所述的方法,其特征在于,每个子预测层对应一个数据预处理层,所述相关信息包括用户的历史业务记录以及用户的属性信息;根据所述历史推送信息以及所述相关信息,确定所述目标训练样本在该业务场景下对应的场景特征,具体包括:根据所述历史业务记录,确定所述用户对应的行为特征,根据所述属性信息,确定所述用户对应的画像特征,以及,根据所述历史推送信息,确定所述历史推送信息对应的推送信息特征;对所述行为特征、所述画像特征以及所述推送信息特征进行拼接,得到所述目标训练样本对应的样本特征;将所述样本特征输入到该业务场景下子预测层对应的数据预处理层中,得到所述场景特征。3.如权利要求2所述的方法,其特征在于,将所述样本特征输入到该业务场景下子预测层对应的数据预处理层中,得到所述场景特征,具体包括:将所述样本特征输入到该业务场景下子预测层对应的数据预处理层中,以使所述数据预处理层,根据该业务场景下的目标训练样本所满足的第一样本分布,对所述样本特征进行归一化处理,得到所述场景特征,所述第一样本分布,是所述数据预处理层根据已输入的目标训练样本学到的。4.如权利要求1所述的方法,其特征在于,所述预测模型还包括有共享数据预处理层,所述相关信息包括用户的历史业务记录以及用户的属性信息;根据所述历史推送信息以及所述相关信息,确定所述目标训练样本针对所有业务场景下对应的综合特征,具体包括:根据所述历史业务记录,确定所述用户对应的行为特征,根据所述属性信息,确定所述用户对应的画像特征,以及,根据所述历史推送信息、确定所述历史推送信息对应的推送信息特征;将所述行为特征、所述画像特征以及所述推送信息特征进行拼接,得到所述目标训练样本对应的样本特征;将所述样本特征输入到所述共享数据预处理层中,得到所述综合特征。5.如权利要求4所述的方法,其特征在于,将所述样本特征输入到所述共享数据预处理
层中,得到所述综合特征,具体包括:将所述样本特征输入到所述共享数据预处理层中,以使所述共享数据预处理层,根据所有业务场景下的目标训练样本所满足的第二样本分布,对所述样本特征进行归一化处理,得到所述综合特征,所述第二样本分布,是所述共享数据预处理层在不区分业务场景的条件下,根据已输入的目标训练样本学到的。6.如权利要求1所述的方法,其特征在于,所述预测模型还包括:共享预测层;根据所述预测点击率以及所述目标训练样本对应的标签信息,对所述预测模型训练,具体包括:获取经过预先训练的所述共享预测层对应的第一网络参数,以及该业务场景对应的子预测层对应的第二网络参数,所述共享预测层,是通过训练样本在所述共享预测层下的预测点击率与所述训练样本对应的标签信息之间的偏差,训练得到的;根据所述第一网络参数和所述第二网络参数,确定经过预先训练的所述共享预测层与该业务场景对应的子预测层之间的参数偏差;以最小化所述参数偏差,以及所述目标训练样本在该业务场景下的预测点击率与所述目标训练样本对应的标签信息之间偏差为优化目标,对所述预测模型训练。7.一种信息推送的方法,其特征在于,预测模型包括每个业务场景对应的子预测层,以及场景权重层,包括:确定在当前业务场景下需要向用户推送的各候选信息,以及获取所述用户的相关信息和所述当前业务场景对应的标识信息;针对每个候选信息,将该候选信息、所述相关信息以及所述标识信息,输入到预先训练的预测模型中,以使所述预测模型根据该候选信息和所述相关信息,确定该候选信息在所述当前业务场景下对应的场景特征,该候选信息针对所有业务场景下对应的综合特征,以及将所述标识信息输入到所述场景权重层,确定所述当前业务场景针对所述综合特征进行加权所需的场景权重矩阵,并将所述场景特征以及利用所述场景权重矩阵加权后的综合特征输入到所述当前业务场景对应的子预测层中,得到针对该候选信息的预测点击率,所述预测模型是通过如上述权利要求1~6任一项所述的训练方法训练得到的;根据各候选信息对应的预测点击率,从各候选信息中选取出向所述用户推送的候选信息,作为目标信息,并将所述目标信息推送给所述用户。8.一种预测模型的训练装置,其特征在于,预测模型包括每个业务场景对应的子预测层,以及场景权重层,包括:获取模块,用于针对每个业务场景,获取该业务场景下的目标训练样本,所述目标训练样本包括在该业务场景下,向用户推送的历史推送信息以及用户的相关信息;确定模块,用于根据所述历史推送信息以及所述相关信息,确定所述目标训练样本在该业务场景下对应的场景特征,以及所述目标训练样本针对所有业务场景下对应的综合特征,以及将该业务场景对应的标识信息输入到所述场景权重层,确定该业务场景下针对所述综合特征进行加权所需的场景权重矩阵;预测模块,用于将所述场景特征以及利用所述场景权重矩阵加权后的综合特征输入到该业务场景对应的子预测层中,得到针对所述历史推送信息的预测点击率;训练模型,用于根据所述预测点击率以及所述目标训练样本对应的标签信息,对所述
预测模型训练。9.一种信息推送的装置,其特征在于,预测模型包括每个业务场景对应的子预测层,以及场景权重层,包括:数据获取模块,用于确定在当前业务场景下需要向用户推送的各候选信息,以及,获取所述用户的相关信息和所述当前业务场景对应的标识信息;预测模块,用于针对每个候选信息,将该候选信息、所述相关信息以及所述标识信息,输入到预先训练的预测模型中,以使所述预测模型,根据该候选信息和所述相关信息,确定该候选信息在所述当前业务场景下对应的场景特征,以及该候选信息针对所有业务场景下对应的综合特征,以及将所述标识信息输入到所述预测模型中的场景权重层,确定所述当前业务场景针对所述综合特征进行加权所需的场景权重矩阵,并将所述场景特征以及利用所述场景权重矩阵加权后的综合特征输入到所述当前业务场景对应的子预测层中,得到针对该候选信息的预测点击率,所述预测模型是通过如上述权利要求1~6任一项所述的训练方法训练得到的;推送模块,用于根据各候选信息对应的预测点击率,从各候选信息中选取出向所述用户推送的候选信息,作为目标信息,并将所述目标信息推送给所述用户。10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~6或权利要求7任一项所述的方法。11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~6或权利要求7任一项所述的方法。

技术总结
本说明书公开了一种预测模型的训练方法、信息推送的方法及装置,并具体公开了,针对每个业务场景,根据向用户推送的历史推送信息和用户的相关信息,确定目标训练样本对应的场景特征以及综合特征,根据该业务场景对应的标识信息,确定场景权重矩阵,将场景特征和利用场景权重矩阵加权后的综合特征,输入到该业务场景对应的子预测层中,得到针对历史推送信息的预测点击率,并根据预测点击率以及目标训练样本对应的标签信息,对预测模型训练。这样,在推送信息时,利用该预测模型,确定出各候选信息对应的预测点击率,并根据预测点击率选取出向用户推送的目标信息,提升了预测模型输出的预测结果的准确性,使得推送的目标信息更符合用户的偏好。户的偏好。户的偏好。


技术研发人员:吴强 王海涛 张亚鹏
受保护的技术使用者:北京三快在线科技有限公司
技术研发日:2021.08.12
技术公布日:2021/11/24
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献