技术新讯 > 电子通信装置的制造及其应用技术 > 训练排序模型和排序的方法和装置与流程 > 正文

训练排序模型和排序的方法和装置与流程

国知局
2024-08-30 14:46:48

本公开涉及计算机，涉及人工智能领域，尤其涉及智能搜索领域，具体为一种训练排序模型和排序的方法和装置。

背景技术：

1、在目前的直播电商排序模型中，建模方式多为单目标建模，主要是按照目标划分：点击率(ctr)、转化率(cvr)、交易额(gmv)这3个目标。

2、直播电商作为用户侧产品，策略分发侧的主要任务之一是带动用户消费增长。既要用户多消费，又要用户多看多逛，提升用户每次浏览的体验。因此在策略分发上不仅需要考虑以货品为核心的导购效率，也要围绕以用户为核心的内容效率，从追求消费金额到消费时长增长。

3、因此，需要多目标的排序模型来解决在推荐系统中同时存在的多个业务目标问题。多目标的排序模型的核心思想是将多个目标函数整合到一个模型中，并通过优化算法找到同时满足这些目标的解决方案。

技术实现思路

1、本公开提供了一种训练排序模型和排序的方法、装置、设备、存储介质以及计算机程序产品。

2、根据本公开的第一方面，提供了一种训练排序模型的方法，包括：基于样本集合对排序模型的共享嵌入层进行预训练，其中，所述排序模型包括共享嵌入层、直播间内观看时长预测网络和目标预测网络，所述共享嵌入层的输出分别作为直播间内观看时长预测网络和目标预测网络的输入，所述目标预测网络的输出结果包括点击率和/或转化率；在预训练完成的共享嵌入层的基础上，基于所述样本集合分别对所述直播间内观看时长预测网络和所述目标预测网络进行训练。

3、根据本公开的第二方面，提供了一种排序方法，包括：响应于接收到用户的访问请求，获取所述用户的特征、与所述用户的特征匹配的至少一个候选直播间的特征以及所述用户和所述至少一个候选直播间的交叉特征；将所述用户的特征和至少一个候选直播间的特征输入根据第一方面中任一项所述的方法训练的排序模型，得到每个候选直播间的得分；按得分由高到低的顺序输出所述至少一个候选直播间。

4、根据本公开的第三方面，提供了一种训练排序模型的装置，包括：预训练单元，被配置成基于样本集合对排序模型的共享嵌入层进行预训练，其中，所述排序模型包括共享嵌入层、直播间内观看时长预测网络和目标预测网络，所述共享嵌入层的输出分别作为直播间内观看时长预测网络和目标预测网络的输入，所述目标预测网络的输出结果包括点击率和/或转化率；精调单元，被配置成在预训练完成的共享嵌入层的基础上，基于所述样本集合分别对所述直播间内观看时长预测网络和所述目标预测网络进行训练。

5、根据本公开的第四方面，提供了一种排序装置，包括：获取单元，被配置成响应于接收到用户的访问请求，获取所述用户的特征、与所述用户的特征匹配的至少一个候选直播间的特征以及所述用户和所述至少一个候选直播间的交叉特征；预测单元，被配置成将所述用户的特征和至少一个候选直播间的特征输入由第三方面中任一项所述的装置训练的排序模型，得到每个候选直播间的得分；输出单元，被配置成按得分由高到低的顺序输出所述至少一个候选直播间。

6、根据本公开的第五方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面或第二方面中任一项所述的方法。

7、根据本公开的第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行第一方面或第二方面中任一项所述的方法。

8、根据本公开的第七方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现第一方面中任一项所述的方法。

9、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种训练排序模型的方法，包括：

2.根据权利要求1所述的方法，其中，所述样本集合包括曝光样本集合；以及

3.根据权利要求1所述的方法，其中，所述样本集合包括点击样本集合；以及

4.根据权利要求1所述的方法，所述样本集合包括曝光样本集合和点击样本集合；以及

5.根据权利要求1所述的方法，其中，所述样本集合包括曝光样本集合；以及

6.根据权利要求1所述的方法，其中，所述样本集合包括点击样本集合；以及

7.根据权利要求1所述的方法，所述样本集合包括曝光样本集合和点击样本集合；以及

8.根据权利要求2或4或5或7所述的方法，所述曝光得分包括以下至少一种：

9.根据权利要求3或4所述的方法，所述点击得分包括以下至少一种：

10.根据权利要求6或7所述的方法，所述点击得分包括以下至少一种：

11.根据权利要求10所述的方法，所述方法还包括：

12.根据权利要求10所述的方法，所述方法还包括：

13.根据权利要求10所述的方法，所述方法还包括：

14.根据权利要求1所述的方法，所述样本集合中的样本包括：特征和标签，其中，所述特征包括：直播间特征、用户特征、用户和直播间的交叉特征，标签包括以下至少一种：点击率标签、直播间外观看时长大于预定第一时长的概率标签、转化率标签、归一化后的交易额标签、直播间外观看时长与直播间内观看时长之和大于预定第二时长的概率标签、直播间内观看时长大于第三时长的概率标签、直播间内观看时长大于第四时长的概率标签、直播间内观看时长大于第五时长的概率标签。

15.根据权利要求1所述的方法，所述目标预测网络包括多个目标预测子网络，所述直播间内观看时长预测网络包括多个直播间内观看时长预测子网络，所述目标预测子网络包括深度神经网络、专家网络和专家共享网络，所述直播间内观看时长预测子网络包括深度神经网络。

16.一种排序方法，包括：

17.一种训练排序模型的装置，包括：

18.根据权利要求17所述的装置，其中，所述样本集合包括曝光样本集合；以及

19.根据权利要求17所述的装置，其中，所述样本集合包括点击样本集合；以及

20.根据权利要求17所述的装置，所述样本集合包括曝光样本集合和点击样本集合；以及

21.根据权利要求17所述的装置，其中，所述样本集合包括曝光样本集合；以及

22.根据权利要求17所述的装置，其中，所述样本集合包括点击样本集合；以及

23.根据权利要求17所述的装置，所述样本集合包括曝光样本集合和点击样本集合；以及

24.根据权利要求18或20或21或23所述的装置，所述曝光得分包括以下至少一种：

25.根据权利要求19或20所述的装置，所述点击得分包括以下至少一种：

26.根据权利要求22或23所述的装置，所述点击得分包括以下至少一种：

27.根据权利要求26所述的装置，所述装置还包括第一统计单元，被配置成：

28.根据权利要求26所述的装置，所述装置还包括第二统计单元，被配置成：

29.根据权利要求26所述的装置，所述装置还包括第三统计单元，被配置成：

30.根据权利要求17所述的装置，所述样本集合中的样本包括：特征和标签，其中，所述特征包括：直播间特征、用户特征、用户和直播间的交叉特征，标签包括以下至少一种：点击率标签、直播间外观看时长大于预定第一时长的概率标签、转化率标签、归一化后的交易额标签、直播间外观看时长与直播间内观看时长之和大于预定第二时长的概率标签、直播间内观看时长大于第三时长的概率标签、直播间内观看时长大于第四时长的概率标签、直播间内观看时长大于第五时长的概率标签。

31.根据权利要求17所述的装置，所述目标预测网络包括多个目标预测子网络，所述直播间内观看时长预测网络包括多个直播间内观看时长预测子网络，所述目标预测子网络包括深度神经网络、专家网络和专家共享网络，所述直播间内观看时长预测子网络包括深度神经网络。

32.一种排序装置，包括：

33.一种电子设备，包括：

34.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-16中任一项所述的方法。

35.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-16中任一项所述的方法。

技术总结本公开提供了训练排序模型和排序的方法和装置，涉及人工智能领域，尤其涉及智能搜索领域。具体实现方式包括：基于样本集合对排序模型的共享嵌入层进行预训练，其中，所述排序模型包括共享嵌入层、直播间内观看时长预测网络和目标预测网络，所述共享嵌入层的输出分别作为直播间内观看时长预测网络和目标预测网络的输入，所述目标预测网络的输出结果包括点击率和/或转化率；在预训练完成的共享嵌入层的基础上，基于所述样本集合分别对所述直播间内观看时长预测网络和所述目标预测网络进行训练。该实施方式能够训练出满足多个目标的排序模型，从而提高排序模型推荐的直播间的点击率、转化率、完播率等。技术研发人员：孙吉庆,李枚芳,徐佳佳,徐培治受保护的技术使用者：北京百度网讯科技有限公司技术研发日：技术公布日：2024/8/27