检索排序方法、装置、电子设备及存储介质与流程
- 国知局
- 2024-08-30 15:07:25
本公开涉及计算机,具体涉及一种检索排序方法、装置、电子设备及存储介质。
背景技术:
1、相关技术中,用户给定检索文本(query)进行检索,检索系统需要从海量资料库中得到多条检索结果,并对多条检索结果进行排序后提供给用户,其中,在进行排序时检索系统需要利用复杂的特征工程和多个模型融合的方式对多条检索结果进行多目标融合排序,其依赖复杂的特征工程,涉及成百上千的模型,人力算力消耗巨大,并且多个目标的不同目标之间的冲突问题只能通过经验调整权重的方式缓解,多目标兼顾能力差,这是亟需解决的问题。
技术实现思路
1、本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
2、为此,本公开的目的在于提出一种检索排序方法、装置、电子设备及存储介质,以采用一个端到端的多目标检索模型,仅依赖少量特征实现检索排序,能够大幅度节省人力算力。
3、根据本公开第一方面,提供了一种检索排序方法,包括:获取基于检索文本query检索得到的多条检索结果;确定每条检索结果对应的多目标特征文本;将每条检索结果对应的多目标特征文本输入至训练好的多目标检索模型,生成每条检索结果的多目标打分结果;根据多目标打分结果,对多条检索结果进行排序。
4、在一些实施例中,确定每条检索结果对应的多目标特征文本,包括:确定每条检索结果对应的多个目标的单目标特征文本;对多个目标的单目标特征文本进行拼接,确定多目标特征文本。
5、在一些实施例中,多个目标包括相关性、质量、时效性和权威性;多个目标的单目标特征文本包括:相关性的相关性特征文本、质量的质量特征文本、时效性的时效性特征文本以及权威性的权威性特征文本。
6、在一些实施例中,上述方法还包括:获取多目标训练数据集;根据多目标训练数据集对初始多目标检索模型进行训练,生成训练好的多目标检索模型。
7、在一些实施例中,多目标训练数据集包括多目标样本特征文本以及多目标样本特征文本中单目标样本特征文本对应的单目标样本打分结果,其中,获取多目标训练数据集,包括:获取样本query对应的多条不同相关程度的样本检索结果;获取每条样本检索结果对应的多目标样本特征文本,以及多目标样本特征文本中单目标样本特征文本对应的单目标样本打分结果。
8、在一些实施例中,根据多目标训练数据集对初始多目标检索模型进行训练,生成训练好的多目标检索模型,包括:根据多目标样本特征文本中的单目标样本特征文本和单目标样本打分结果确定单目标损失;根据多目标样本特征文本和单目标样本打分结果确定多目标损失;根据单目标损失和多目标损失对初始多目标检索模型进行参数更新,生成训练好的多目标检索模型。
9、在一些实施例中,根据多目标样本特征文本中的单目标样本特征文本和单目标样本打分结果确定单目标损失,包括:将多目标样本特征文本中的单目标样本特征文本输入至初始多目标检索模型,得到单目标预测打分结果;根据单目标预测打分结果和单目标样本打分结果确定单目标损失。
10、在一些实施例中,根据多目标样本特征文本和单目标样本打分结果确定多目标损失,包括:将多目标样本特征文本输入至初始多目标检索模型,得到多个目标的单目标预测打分结果;根据多个目标的单目标预测打分结果和多个目标的单目标样本打分结果分别计算多个目标的单目标损失,根据多个目标的单目标损失确定多目标损失。
11、根据本公开第二方面,提供了一种检索排序装置,包括:数据获取单元,用于获取基于检索文本query检索得到的多条检索结果;文本确定单元,用于确定每条检索结果对应的多目标特征文本;结果确定单元,用于将每条检索结果对应的多目标特征文本输入至训练好的多目标检索模型,生成每条检索结果的多目标打分结果;排序处理单元,用于根据多目标打分结果,对多条检索结果进行排序。
12、根据本公开的第三方面,提供了一种电子设备,包括:
13、至少一个处理器;以及
14、与所述至少一个处理器通信连接的存储器;其中,
15、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的检索排序方法。
16、根据本公开第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行如第一方面所述的检索排序方法。
17、根据本公开的第五方面,提供了一种计算机程序产品,包括计算机指令,所述计算机指令在被处理器执行时实现如第一方面所述的检索排序方法的步骤。
18、本公开提供的检索排序方法、装置、电子设备及存储介质,存在如下有益效果:通过获取基于检索文本query检索得到的多条检索结果;然后确定每条检索结果对应的多目标特征文本;将每条检索结果对应的多目标特征文本输入至训练好的多目标检索模型,生成每条检索结果的多目标打分结果;之后根据多目标打分结果,对多条检索结果进行排序。由此,可以采用一个端到端的多目标检索模型,仅依赖少量特征实现检索排序,能够大幅度节省人力算力。
19、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
技术特征:1.一种检索排序方法,其中,包括:
2.如权利要求1所述的方法,其中,所述确定每条所述检索结果对应的多目标特征文本,包括:
3.如权利要求2所述的方法,其中,所述多个目标包括相关性、质量、时效性和权威性;所述多个目标的单目标特征文本包括:相关性的相关性特征文本、质量的质量特征文本、时效性的时效性特征文本以及权威性的权威性特征文本。
4.如权利要求1至3中任一项所述的方法,其中,所述方法还包括:
5.如权利要求4所述的方法,其中,所述多目标训练数据集包括多目标样本特征文本以及所述多目标样本特征文本中单目标样本特征文本对应的单目标样本打分结果,其中,所述获取多目标训练数据集,包括:
6.如权利要求5所述的方法,其中,所述根据所述多目标训练数据集对初始多目标检索模型进行训练,生成所述训练好的多目标检索模型,包括:
7.如权利要求6所述的方法,其中,所述根据所述多目标样本特征文本中的单目标样本特征文本和所述单目标样本打分结果确定单目标损失,包括:
8.如权利要求6所述的方法,其中,所述根据所述多目标样本特征文本和所述单目标样本打分结果确定多目标损失,包括:
9.一种检索排序装置,其中,包括:
10.如权利要求9所述的装置,其中,所述文本确定单元,具体用于:
11.如权利要求10所述的装置,其中,所述多个目标包括相关性、质量、时效性和权威性;所述多个目标的单目标特征文本包括:相关性的相关性特征文本、质量的质量特征文本、时效性的时效性特征文本以及权威性的权威性特征文本。
12.如权利要求9至11任一所述的装置,其中,所述装置还包括:
13.如权利要求12所述的装置,其中,所述多目标训练数据集包括多目标样本特征文本以及所述多目标样本特征文本中单目标样本特征文本对应的单目标样本打分结果,所述数据集获取单元,具体用于:
14.如权利要求13所述的装置,其中,所述模型训练单元,包括:
15.如权利要求14所述的装置,其中,所述单目标损失计算模块,具体用于:
16.如权利要求14所述的装置,其中,所述多目标损失计算模块,具体用于:
17.一种电子设备,其中,包括:
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行权利要求1至8中任一项所述的检索排序方法。
19.一种计算机程序产品,其中,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至8中任一项所述检索排序方法。
技术总结本公开提出一种检索排序方法、装置、电子设备及存储介质,涉及计算机技术领域。具体实现方案为:获取基于检索文本query检索得到的多条检索结果;确定每条检索结果对应的多目标特征文本;将每条检索结果对应的多目标特征文本输入至训练好的多目标检索模型,生成每条检索结果的多目标打分结果;根据多目标打分结果,对多条检索结果进行排序。由此,可以采用一个端到端的多目标检索模型,仅依赖少量特征实现检索排序,能够大幅度节省人力算力。技术研发人员:王文华,吕中厚,高正建,李蒙,田伟娟,王国秋受保护的技术使用者:北京百度网讯科技有限公司技术研发日:技术公布日:2024/8/27本文地址:https://www.jishuxx.com/zhuanli/20240830/285574.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表