基于知识图谱的智能推荐系统及方法与流程
- 国知局
- 2024-08-02 14:59:12
本发明涉及数据处理,特别涉及基于知识图谱的智能推荐系统及方法。
背景技术:
1、近年来,随着大数据和人工智能技术的迅猛发展,个性化推荐系统在电子商务、社交网络、新闻推送等领域得到了广泛应用。推荐系统通过分析用户的历史行为和兴趣,向用户推荐其可能感兴趣的内容或商品,从而提高用户体验和平台的运营效率。目前,基于协同过滤、矩阵分解和深度学习的方法是推荐系统的主流技术。然而,随着数据规模的不断扩大和用户需求的日益复杂,传统推荐技术在处理复杂关系和高维数据时面临诸多挑战和问题。
2、协同过滤(collaborative filtering)技术是推荐系统中最早应用的一种方法。它主要分为基于用户的协同过滤和基于项目的协同过滤。基于用户的协同过滤通过计算用户之间的相似度,推荐与相似用户喜欢的项目;基于项目的协同过滤则通过计算项目之间的相似度,推荐与用户历史上喜欢的项目相似的项目。虽然协同过滤技术简单易实现,但它存在两个主要问题:一是冷启动问题,当新用户或新项目出现时,由于缺乏历史数据,难以进行准确推荐;二是数据稀疏性问题,用户与项目之间的交互数据通常非常稀疏,导致相似度计算不准确,从而影响推荐效果。矩阵分解(matrix factorization)技术是解决协同过滤问题的一种重要方法。矩阵分解通过将用户-项目交互矩阵分解为用户矩阵和项目矩阵,从而发现潜在的用户和项目特征。最经典的矩阵分解方法是隐语义模型(latentfactormodel),如svd(singular value decomposition)和als(alternating least squares)。这些方法能够有效地处理数据稀疏性问题,提供更精准的推荐。然而,矩阵分解方法仍然存在一些不足之处:一是它们通常假设用户和项目特征是线性可分的,难以捕捉复杂的非线性关系;二是当数据规模非常大时,矩阵分解的计算复杂度较高,难以实时更新和处理。深度学习(deeplearning)技术近年来在推荐系统中取得了显著的进展。通过构建复杂的神经网络模型,深度学习方法能够捕捉数据中的非线性关系,提供更为精准和个性化的推荐。典型的深度学习推荐模型包括基于卷积神经网络(cnn)、递归神经网络(rnn)和注意力机制(attention mechanism)的模型。这些模型能够有效处理高维和复杂的数据,提高推荐系统的性能。然而,深度学习方法也存在一些挑战:一是模型的训练和推理需要大量计算资源,难以在资源受限的环境中部署;二是深度学习模型通常是黑箱模型,缺乏可解释性,难以让用户理解推荐的原因。
技术实现思路
1、本发明的目的是提供基于知识图谱的智能推荐系统及方法,使得系统能够在处理复杂关系和大规模数据时,生成高质量的特征表示,并提供精准的推荐服务。
2、为解决上述技术问题,本发明提供基于知识图谱的智能推荐系统,所述系统包括:知识图谱构建部分、嵌入表示部分、超图处理部分和推荐生成部分;所述知识图谱构建部分,用于从数据源采集数据,进行预处理,构建初始数据集,使用初始数据集构建知识图谱,提取实体和关系;所述嵌入表示部分,用于使用变分图自编码器对知识图谱中的实体进行嵌入表示,使用变分图自编码器对知识图谱中的关系进行嵌入表示;超图处理部分,用于基于实体嵌入表示和关系嵌入表示构建超图,利用超图卷积神经网络,提取高阶特征,将卷积操作后的得到的高阶特征与实体嵌入表示和关系嵌入表示进行融合,生成最终特征表示;推荐生成部分,用于基于最终特征表示,生成推荐列表。
3、进一步的,所述知识图谱构建部分包括:数据采集单元、实体和关系处理单元和知识图谱构建单元;所述数据采集单元,用于从数据源采集数据,对数据源采集到的数据进行数据清洗处理和数据标准化处理,构建初始数据集;所述实体和关系处理单元,用于使用命名实体识别技术,从初始数据集提取实体;利用关系抽取技术,从初始数据集中提取实体之间的关系;对相同实体和关系进行链接,以去除冗余信息;将实体和关系组合生成三元组;其中,表示第个实体,表示第个实体,表示第个关系;所述知识图谱构建单元,用于将实体、关系和三元组整合,最终形成知识图谱;其中,表示去除冗余信息后的实体集合,表示去除冗余信息后的关系集合,表示所有三元组组成的三元组集合。
4、进一步的,所述数据源至少包括:社交媒体平台、电子商务平台、新闻网站、论坛和博客。
5、进一步的,所述嵌入表示部分,使用变分图自编码器对知识图谱中的实体进行嵌入表示时,在变分图自编码器的输入实体和其关联的关系集合;得到实体嵌入表示为:;其中,为潜在变量,作为实体的实体嵌入表示;表示将实体和其对应的关系集合输入到变分图自编码器中;是从标准正态分布中采样的噪声向量;表示逐元素相乘;是潜在变量的标准差,表示变分图自编码器预测的潜在空间中实体的方差;是潜在变量的均值,表示编码器预测的潜在空间中实体的均值。
6、进一步的,所述嵌入表示部分,使用变分图自编码器对知识图谱中的关系进行嵌入表示时,在变分图自编码器的输入关系和其连接的实体集合;得到关系嵌入表示为:;是权重矩阵,用于将连接后的向量映射到嵌入空间表示关系向量和实体集合的平均向量的连接,以将关系与其相关联的实体结合起来;是偏置向量,用于线性变换;是对实体集合取平均,得到其对应的平均向量。
7、进一步的,潜在变量的均值使用如下公式进行计算:
8、;
9、其中和分别是预设的第一均值权重矩阵和第二均值权重矩阵,是均值偏置向量;表示与实体相关联的关系集合的大小,即实体相关联的关系数量;潜在变量的标准差使用如下公式计算:
10、;
11、其中,是软加函数,定义为:;
12、为函数变量;为方差权重矩阵;为方差偏置向量。
13、进一步的,超图处理部分,基于实体嵌入表示和关系嵌入表示构建超图的过程具体包括:将实体嵌入表示视为超图中的一个节点;将关系嵌入表示视为超图中的一个超边;若实体嵌入表示对应的实体和关系嵌入表示对应的关系是关联的,则对应的在超图中,将实体嵌入表示对应的节点和关系嵌入表示对应的超边进行连接。
14、进一步的,超图处理部分的超图卷积神经网络使用如下公式进行表示:
15、;
16、其中,为第层的节点特征矩阵;为第层的节点特征矩阵;为超图的邻接矩阵,表示节点与超边的连接关系;为节点的度矩阵,对角矩阵,其对角元素是节点的度数;为超边的度矩阵,对角矩阵,其对角元素是超边的度数;为超图权重矩阵,用于调整节点与超边之间的关系权重;为激活函数;利用超图卷积神经网络对超图进行多层卷积操作后,得到高阶特征为:
17、;
18、其中,为超图卷积神经网络的层数;再使用如下公式,将卷积操作后的得到的高阶特征与实体嵌入表示和关系嵌入表示进行融合,生成最终特征表示:
19、;
20、其中,第一融合系数;第二融合系数;第三融合系数;实体嵌入表示矩阵,其中每个元素为;为关系嵌入表示矩阵,其中每个元素为。
21、进一步的,推荐生成部分,基于最终特征表示,生成推荐列表的具体过程包括:用于对目标数据进行预处理,构建目标数据集,使用目标数据集构建目标知识图谱,提取目标实体和目标关系;使用变分图自编码器得到目标知识图谱中的目标实体的目标实体嵌入表示,使用变分图自编码器得到目标知识图谱中的目标关系的目标关系嵌入表示,基于目标实体嵌入表示和目标关系嵌入表示构建目标超图,利用超图卷积神经网络对目标超图进行卷积操作,提取目标高阶特征,将卷积操作后的得到的目标高阶特征与目标实体嵌入表示和目标关系嵌入表示进行融合,生成最终目标特征表示;所述最终目标特征表示为最终特征表示的一个子集,获取最终目标特征表示的中心元素,再从最终特征表示中找到与中心元素对应的元素,在最终特征表示中以该元素为中心,按照距离该元素的距离,从近到远生成推荐列表。
22、一种基于知识图谱的智能推荐方法,所述方法包括:从数据源采集数据,进行预处理,构建初始数据集,使用初始数据集构建知识图谱,提取实体和关系;使用变分图自编码器对知识图谱中的实体进行嵌入表示,使用变分图自编码器对知识图谱中的关系进行嵌入表示;基于实体嵌入表示和关系嵌入表示构建超图,利用超图卷积神经网络,提取高阶特征,将卷积操作后的得到的高阶特征与实体嵌入表示和关系嵌入表示进行融合,生成最终特征表示;基于最终特征表示,生成推荐列表。
23、本发明的基于知识图谱的智能推荐系统及方法,具有以下有益效果:首先,本发明通过引入知识图谱,有效地解决了传统推荐系统中的冷启动问题和数据稀疏性问题。在传统的协同过滤和矩阵分解方法中,新用户或新物品由于缺乏足够的历史数据,推荐效果往往不理想。知识图谱通过结构化地表示实体及其关系,使得系统能够利用丰富的上下文信息进行推荐。即使是新用户或新物品,也能通过其在知识图谱中的关联关系,找到与之相关的其他实体,从而进行有效推荐。例如,系统可以通过用户的基础信息(如年龄、职业等)在知识图谱中找到相似用户,并推荐这些用户喜欢的物品,从而缓解冷启动问题。此外,知识图谱中丰富的关系信息也使得系统在处理数据稀疏性问题时,能够通过多种路径进行推荐,提升推荐的准确性和多样性。其次,本发明利用变分图自编码器(vgae)对知识图谱中的实体和关系进行嵌入表示,提高了特征表示的质量和表达能力。vgae结合了变分推断和图神经网络的优点,能够在低维潜在空间中生成高质量的嵌入表示。通过对知识图谱中的实体和关系进行编码,系统不仅保留了原始数据的结构信息,还引入了潜在空间中的随机性,提高了嵌入表示的鲁棒性和泛化能力。这使得系统在处理复杂和大规模图数据时,能够生成更具代表性和区分度的特征表示,从而提高推荐效果。再者,本发明通过构建超图并利用超图卷积神经网络(hgcn)进行卷积操作,有效地提取和聚合了高阶特征。超图是一种能够表示多对多关系的图结构,通过将实体嵌入表示视为节点、关系嵌入表示视为超边,系统构建了一个复杂的关系网络。在这一网络中,节点和超边之间的连接关系能够更好地反映实体和关系之间的复杂交互信息。hgcn通过多层卷积操作,逐层提取和聚合节点的局部和全局信息,使得最终生成的高阶特征表示更加全面和准确。高阶特征不仅包含节点的自身信息,还综合了其在整个超图结构中的位置和作用,从而提升了推荐系统的整体性能。
本文地址:https://www.jishuxx.com/zhuanli/20240801/244567.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表