一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种科技文献推荐方法

2023-02-01 22:52:42 来源:中国专利 TAG:

技术特征:
1.一种科技文献推荐方法,其特征在于,包括以下步骤:s1:构建科技文献知识图谱:对科技文献资源数据进行爬取,得到非结构化文本数据;从非结构化文本数据中抽取与科技文献相关的实体和关系,得到实体集和关系集,并通过实体集和关系集构建三元组集合,结合实体集、关系集以及三元组集合,构建科技文献知识图谱;s2:构建用户的交互数据库:收集用户对于科技文献知识图谱的历史行为交互数据;收集用户面向科技文献知识图谱提出的自然语言查询,并将自然语言查询转化为sparql查询语句;存储历史行为交互数据以及sparql查询语句;s3:基于用户的交互数据库和科技文献知识图谱建立用户偏好模型,所述用户偏好模型包括知识表示学习模型以及推荐模型,用户偏好模型构建过程具体包括:s3-1:基于sparql查询语句结合科技文献知识图谱构建知识表示学习模型;s3-2:基于历史行为交互数据构建推荐模型;s4:构建平衡函数平衡知识表示学习模型中的实体和推荐模型中的项目并同时训练知识表示学习模型和推荐模型,得到既具有图结构特征又具有交互语义特征的用户向量值和实体向量值,并依据用户向量值与实体向量值的相似度由高至低依次排列生成推荐列表。2.根据权利要求1所述的科技文献推荐方法,其特征在于,所述步骤s3-1具体为:s3-1-1:分析sparql查询语句中二元谓词的时序特征与频率特征,并构建关系语义矩阵,其表达式如下:其中,s(r)表示关系r的语义权重值,为时间信任增长因子;表示二元谓词组(p
j
,p
k
)在时间帧τ
i
内的sparql查询语句集合出现的频率;β为平衡非频繁谓词组总频率的超参数;为非频繁谓词组集合,fp为频繁谓词组集合;s3-1-2:将关系语义矩阵作为输入,利用加权编码器来计算科技文献知识图谱中每个由不同关系链接的三元组的关联度,关联度函数的表达式如下:其中,w(h,r,t)为三元组关联度函数;(h,r,t)为三元组,h为头实体,r为关系,t为尾实体;是头实体为h的三元组集合;s3-1-3:基于翻译模型结合三元组的关联度函数,构建得到能量函数,通过能量函数构建关联度感知的知识表示学习模型的损失函数,通过梯度下降不断迭代损失函数得到具有知识图谱结构特征的实体的向量值和关系的向量值,知识表示学习模型的损失函数的表达式如下:其中,l
kg
为知识表示学习模型的损失函数,为正例三元组即真实存在于知识图谱中的三元组,为负例三元组即通过替换头实体或尾实体构造出来的三元组,h'表示替换的头
实体,t'表示替换的尾实体;e(h,r,t)表示翻译模型的正例三元组的距离分数,e(h',,t')表示翻译模型的负例三元组的距离分数,γ为边界距离值。3.根据权利要求2所述的科技文献推荐方法,其特征在于,所述步骤s3-2具体为:s3-2-1:计算历史行为交互数据中用户u和项目i与步骤s3-1的科技文献知识图谱中关系r的相似性;并进一步计算关系r在其关系集合中的注意力权重分布并进行归一化处理得到注意力权重的最终值,将注意力权重与对应的关系r相乘,建立指定用户-项目交互对与科技文献知识图谱中关系的偏好诱导模型,其表达式如下:其中,表示指定用户-项目交互对与科技文献知识图谱中关系的偏好诱导模型,表示关系r在其关系集合中的注意力权重归一化处理得到的最终值,u表示用户,i表示项目,表示在科技文献知识图谱中与交互项目i直接关联的关系集合;s3-2-2:计算历史行为交互数据中用户u和项目i与步骤s3-1的科技文献知识图谱中实体e的相似性;并计算实体e在其实体集合中的注意力权重分布并进行归一化处理得到注意力权重的最终值,将注意力权重与对应的实体e相乘,建立用户-项目交互对与科技文献知识图谱中实体的偏好诱导模型,其表达式如下:其中,e表示实体,其包括头实体h和尾实体t,表示在科技文献知识图谱中与交互项目i直接关联的实体集合;s3-2-3:基于步骤s3-2-1中的用户对关系的偏好诱导模型以及步骤s3-2-2中的用户对实体的偏好诱导模型,建立用户对项目的偏好模型,通过用户对项目的偏好模型构建推荐模型的损失函数,通过梯度下降的方式不断迭代损失函数得到具有用户交互特征的用户的向量值和项目的向量值,推荐模型的损失函数的表达式如下:l
rs
=∑
(u,i)∈y

(u,i

)∈y
′-logσ[g(u,i

;p

)-g(u,i;p)];其中,l
rs
表示推荐模型的损失函数,(u,i)表示用户-项目交互对,(u,i

)表示随机替换项目构造的负交互对,i

表示替换后的项目,logσ表示bpr损失函数计算,y

表示用户与项目的负交互列表集合,y表示用户与项目的交互列表集合,g(u,i;p)表示用户对项目的偏好模型,g(u,i

;p

)表示用户对替换项目的偏好模型。4.根据权利要求3所述的科技文献推荐方法,其特征在于,所述步骤s3-1-3中能量函数表达式如下:其中,e(h,r,t/w)表示能量函数,e(h,r,t)表示翻译模型。5.根据权利要求4所述的科技文献推荐方法,其特征在于,所述步骤s3-2-3中用户对项目的偏好模型表达式如下:
其中,p表示交互关系向量,表示聚合用户对关系的偏好后的交互关系向量,表示聚合用户对实体的偏好后的项目,l1即l1范式,l2即l2范式。6.根据权利要求5所述的科技文献推荐方法,其特征在于,所述步骤s4中平衡函数表达式如下:l=λl
rs
(1-λ)l
kg
;其中,l为平衡函数,λ为超参数。

技术总结
本发明提供了一种科技文献推荐方法通过采集科技文献相关数据构建科技文献知识图谱,同时收集并处理用户在系统产生的交互数据,设计融合用户行为特征与知识表示的推荐模型。相较于现有推荐模型,一方面基于用户面向科技文献资源提出的自然语言查询,分析用户偏好对科技文献知识图谱产生的语义影响,提取隐含在用户信息中的关系语义特征,建立融入关系语义的知识表示学习模型,用以提高科技文献等知识的语义表征;另一方面基于用户的历史行为交互数据,结合知识表示学习模型深入分析关系与实体对用户偏好的语义影响,建立多层次偏好感知的推荐模型,用以提高用户与科技文献之间的语义关联。关联。关联。


技术研发人员:杨柳 谢冰媛 龙军 陈庭轩 王子冬
受保护的技术使用者:中南大学
技术研发日:2022.10.19
技术公布日:2023/1/31
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献