技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于大语言模型的自动解耦序列推荐方法 > 正文

基于大语言模型的自动解耦序列推荐方法

国知局
2024-08-05 11:43:29

本技术涉及大语言模型，特别是涉及一种基于大语言模型的自动解耦序列推荐方法。

背景技术：

1、序列推荐的目标是基于目标用户的历史行为，例如点击、观看、评论、点赞等，给其推荐一系列物品。随着近几年来深度学习技术的发展，许多工作在序列推荐任务上取得了巨大的成功。

2、传统的推荐模型通常采用的是基于协同过滤的方法，例如矩阵分解。收到深度学习模型的启发，最近的序列推荐模型大都转向深度神经网络例如循环神经网络、卷积神经网络以及transformer，通过堆砌了多层自注意力网络来建模用户的行为意图或是采用了类似于完型填空的目标并利用左右的上下文来预测被掩码覆盖掉的物品。

3、然而，通过上述方法中的推荐模型得到的用户表征依然是耦合的，没有考虑到用户意图下可能的潜在因子，这导致推荐的效果受到影响。

技术实现思路

1、有鉴于此，本技术实施例提供一种基于大语言模型的自动解耦序列推荐方法，以便克服上述问题或者至少部分地解决上述问题。

2、本技术实施例第一方面提供了一种基于大语言模型的自动解耦序列推荐方法，所述方法包括：

3、通过序列推荐模型中的序列编码器对用户点击的物品的行为序列进行编码，得到行为序列的表征，所述行为序列的表征包括多个用户意图；

4、将所述行为序列的表征聚类到多个可学习的原型意图，得到所述多个用户意图与所述多个原型意图的多个第一相似程度；

5、根据所述行为序列的表征中的最后一个位置的用户意图，得到未来的用户意图；

6、计算所述用户意图和所述未来的用户意图的第二相似程度；

7、根据所述第一相似程度、所述第二相似程度和所述行为序列的表征，得到用户意图的解耦表征；

8、根据各个候选物品的表征分别与用户意图的解耦表征之间的第三相似程度，得到序列推荐模型输出的初步推荐结果；

9、将所述初步推荐结果和重排指令输入大语言模型，得到对所述初步推荐结果进行重排后的推荐结果。

10、可选地，所述序列推荐模型的序列编码器中的自注意力层的架构为：从预定搜索空间中搜索得到的最优架构，所述预定搜索空间满足以下条件：

11、每一自注意力层至少有一个输入源接在该自注意力层的上一层上；

12、每一自注意力层的key输入源和value输入源相同，key输入源是指输入key投影层的语义特征，value输入源是指输入value投影层的语义特征。

13、可选地，所述从预定搜索空间中搜索得到的最优架构包括：

14、利用训练集训练超网络，在超网络中，每一种输入源对应一套参数；

15、使用遗传算法对训练好的超网络进行蒙特卡洛采样，得到多个候选架构，每个候选架构继承了训练好的超网络的参数；

16、从多个候选架构中选择在验证集上表现最好的候选架构，作为优化架构。

17、可选地，所述序列推荐模型的损失函数为：

18、

19、其中，表示在验证集上的损失函数值，表示在训练集上的损失函数值，a和a′为所述预定搜索空间中的任意两个不同的候选架构，arg minθ表示在下，随机采样得到a′，并使用a′作为模型架构来最小化损失函数，得到最优的序列推荐模型的参数θ，表示所述候选架构的分布。

20、可选地，所述在验证集上的损失函数值包括：

21、在所述验证集上的序列对物品的损失函数值和序列对序列的损失函数值；

22、在所述训练集上的损失函数值包括：

23、在所述训练集上的序列对物品的损失函数值和序列对序列的损失函数值；

24、所述序列对序列的损失函数值是按照以下步骤确定的：

25、计算基于用户的历史行为序列的用户意图的解耦表征，与基于用户的未来行为序列的用户意图的解耦表征之间的相似度；

26、当所述相似度高于预设相似度时，计算所述序列对序列的损失函数值。

27、可选地，所述将所述初步推荐结果和重排指令输入大语言模型，得到对所述初步推荐结果进行重排后的推荐结果，包括：

28、获得所述初步推荐结果中各个候选物品对应的置信度；

29、对所述置信度按照由高到低的顺序进行排列，得到排序结果；

30、根据所述排序结果，生成所述重排指令，所述重排指令用于对除排序靠前的n个候选物品之外剩余的候选物品进行重排序；

31、将所述初步推荐结果和生成的重排指令输入所述大语言模型，得到重排后的推荐结果。

32、本技术实施例第二方面提供了一种基于大语言模型的自动解耦序列推荐装置，所述装置包括：

33、编码模块，用于通过序列推荐模型中的序列编码器对用户点击的物品的行为序列进行编码，得到行为序列的表征，所述行为序列的表征包括多个用户意图；

34、聚类模块，用于将所述行为序列的表征聚类到多个可学习的原型意图，得到所述多个用户意图与所述多个原型意图的多个第一相似程度；

35、获取模块，用于根据所述行为序列的表征中的最后一个位置的用户意图，得到未来的用户意图；

36、计算模块，用于计算所述用户意图和所述未来的用户意图的第二相似程度；

37、用户意图的解耦表征获取模块，用于根据所述第一相似程度、所述第二相似程度和所述行为序列的表征，得到用户意图的解耦表征；

38、初步推荐结果获取模块，用于根据各个候选物品的表征分别与用户意图的解耦表征之间的第三相似程度，得到序列推荐模型输出的初步推荐结果；

39、重排推荐结果获取模块，用于将所述初步推荐结果和重排指令输入大语言模型，得到对所述初步推荐结果进行重排后的推荐结果。

40、本技术实施例第三方面，提供一种电子设备，包括存储器、处理器以及存储在存储器上的计算机程序，其中，所述处理器执行所述计算机程序以实现如第一方面所述的基于大语言模型的自动解耦序列推荐方法。

41、本技术实施例第四方面，提供一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现如第一方面所述的基于大语言模型的自动解耦序列推荐方法。

42、本技术实施例第五方面，提供一种计算机可读介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如第一方面所述的基于大语言模型的自动解耦序列推荐方法。

43、本技术的有益效果：

44、本技术实施例提供一种基于大语言模型的自动解耦序列推荐方法，包括：通过序列推荐模型中的序列编码器对用户点击的物品的行为序列进行编码，得到包括多个用户意图行为序列的表征，并行为序列的表征聚类到多个可学习的原型意图，得到多个用户意图与多个原型意图的多个第一相似程度，根据行为序列的表征中的最后一个位置的用户意图，得到未来的用户意图，计算用户意图和未来的用户意图的第二相似程度，根据第一相似程度、第二相似程度和行为序列的表征，得到用户意图的解耦表征，根据各个候选物品的表征分别与用户意图的解耦表征之间的第三相似程度，得到序列推荐模型输出的初步推荐结果，将初步推荐结果和重排指令输入大语言模型，得到对初步推荐结果进行重排后的推荐结果。

45、能够使得序列推荐模型解耦驱动用户行为的潜在因子，基于用户意图进行初步推荐，并通过大模型对序列推荐模型输出的初步推荐结果进行调整，提高推荐效果。