一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种多通道信息检索与融合系统的制作方法

2022-05-21 04:44:44 来源:中国专利 TAG:


1.本发明涉及信息检索领域,尤其涉及一种利用多通道信息融合方式召回检索结果的系统。


背景技术:

2.随着信息时代的到来,信息、数据一直呈爆炸式增长。信息搜索的重要性日益突出,对检索的效率、准确性要求也越来越高。传统的检索模式是先对数据建立倒排索引,用户输入检索词后,根据检索词直接检索倒排索引,最终将命中结果返回用户。但随着信息急剧的增长,这样的检索方式没有办法根据用户的行为、可能的意图进行筛选,返回的结果还是太多质量太低。一些现有的检索系统通过对用户搜索关键词进行改写(如关键词纠错、同义词替换、关键词拓展等)一定程度上缓解上述问题,但是由于改写后结果仍然是唯一的关键词,仍然无法从根本上满足用户多样性搜索需求。


技术实现要素:

3.鉴于以上所述现有技术的缺点,本发明的目的在于提供一种多通道信息检索与融合系统,用于在针对特定信息源检索场景下,提高检索词的自动补全准确性,提升用户体验。
4.为实现上述目的及其他相关目的,本发明提供一种多通道信息检索与融合系统,其特征在于,包括:触发模型,所述触发模型对应召回通道,所述触发模型用于分析用户请求,并根据分析结果判定是否打开对应的召回通道。
5.优选地,上述多通道信息检索与融合系统中,所述触发模型用于分析用户请求的检索词本身、用户发起请求时的位置、发起请求时的时间、用户本身的个人信息。
6.优选地,上述多通道信息检索与融合系统中,所述召回通道包括相关性通道,和/或个性化通道,和/或亲密度通道,和/或地理位置通道。
7.优选地,上述多通道信息检索与融合系统中,还包括与融合层,所述与融合层将所述召回通道的召回结果同语义相关通道结果进行逻辑“与”操作。
8.优选地,上述多通道信息检索与融合系统中,还包括与融合层,所述与融合层将所述召回通道的召回结果同个性化向量通道结果进行“与”操作融合。
9.优选地,上述多通道信息检索与融合系统中,所述“与”操作采用比特图的方式加速。
10.优选地,上述多通道信息检索与融合系统中,还包括或融合层,所述或融合层包括多臂老虎机控制器,用于对所述与融合层的筛选结果作进一步处理。
11.优选地,上述多通道信息检索与融合系统中,所述或融合层针对每个所述召回通道设置排序算法。
12.优选地,上述多通道信息检索与融合系统中,所述或融合层针对每个所述召回通道设置最低曝光数量。
13.本发明还提供一种多通道信息检索与融合方法,用于信息检索领域,其特征在于,包括:分析用户检索请求的步骤;根据所述用户检索请求的分析结果,判定需要打开的召回通道的步骤;将所述召回通道的输出结果通过“与”操作进行融合的步骤。
14.优选地,上述多通道信息检索与融合方法中,所述分板用户检索请求包括分析检索词本身、用户发起请求时的位置、发起请求时的时间、用户本身的个人信息。
15.优选地,上述多通道信息检索与融合方法中,所述判定需要打开的召回通道的步骤中,根据所述用户检索请求与召回通道属性的相关性判定。
16.优选地,上述多通道信息检索与融合方法中,将所述召回通道的输出结果同语义相关通道结果进行“与”操作融合。
17.优选地,上述多通道信息检索与融合方法中,将述召回通道的输出结果将同个性化向量通道结果进行“与”操作融合。
18.优选地,上述多通道信息检索与融合方法中,还包括利用多臂老虎机控制算法对所述召回通道的结果进行筛选的步骤。
19.优选地,上述多通道信息检索与融合方法中,还包括对每个所述召回通道设置最低曝光数量。
附图说明
20.图1是本发明多通道信息检索与融合系统的逻辑框图。
具体实施方式
21.以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
22.请参阅附图。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
23.传统的检索系统,仅利用了检索词的语义信息这一个纬度来检索(或者称召回)结果,我们称该种检索方式为单通道召回方式。本发明的多通道信息检索与融合系统,除了从关键词本身的语义这一个纬度外,还要综合利用用户发起检索时的地理位置、用户历史检索习惯、信息浏览习惯以及被检索结果本身的热度等多个纬度的信息来召回检索结果反馈给用户,这种检索方式称为多通道召回方式。
24.图1是本发明多通道信息检索与融合系统的逻辑框图。标记1代表一个触发模型阵列,可以包括若干个触发模型,标记2代表一个通道阵列,可以包括若干个召回通道。每个触发模型对应一个召回通道。本例中,待检索的信息以网络用户分享的笔记为例,本领域普通技术人员在面临其它类型的数据源时,根据信息源的特征进行适当调整,无需要创造性劳动即可使用本发明的装置或方法。
25.触发模型用于从某一个特定的方面(或者称纬度)来分析用户输入的检索词,它基
于用户的历史行为建立,使用自然语言理解和强化学习的技术训练得到。并将用户对检索结果的点选行为作为反馈数据,对触发模型进行动态调整。当收到用户的检索请求时,触发模型首先分析检索请求中的所有信息,包括检索词本身、用户发起请求时的位置、发起请求时的时间、用户本身的个人信息(包括身份、网上冲浪记录、搜索记录等),分析的结果是判定是否需要打开对应的召回通道。判定的标准可以是检索请求与通道属性的相关性,比如检索请求中的检索词是“口红”,则与地理位置通道相关性很低,因此关闭地理位置通道;而口红与亲密度通道相关性很高,因此打开亲密度通道。
26.所谓召回通道,就是一个度量和筛选信息的纬度。比如相关性通道,就是从语义相关性这个纬度来度量信息,把和用户输入的关键词语义上最相关的文档筛选并返回。个性化通道用于从内容与用户兴趣的契合度这一角度来度量信息,一种常见的方式是利用余弦定理,先将查询和文档编码到向量空间,使用向量间夹角度量用户对文档的兴趣度。另外有地理位置,是从信息中的地理位置与用户发请求时所在的地理位置这个纬度来度量信息。亲密度通道是从人(比如作者、明星、歌手)与用户兴趣的契合度这一角度来度量信息等等。
27.图1中标记3表示与融合层。多个通道召回结果通过“与”操作进行融合能得到更符合用户需求的结果。比如将各个通道同语义相关通道结果经过“与”操作进行融合,能够剔除不相关笔记。各个通道和个性化向量通道结果进行“与”操作融合,能够在有限召回空间内将更符合用户个性化需求的结果选出。其他与操作融合将得到不同性质结果。在系统内通道与操作通过比特图的方式进行加速。
28.图1中标记4表示或融合层。通过“与”操作融合后得到的结果,通常已经是个性化,高质量的结果。但有时在经过与操作融合后,符合透出的文档仍然超过所能曝光文档的限度,需要进一步做选择。
29.这时候优选地是将结果再经过或融合层进一步处理。或融合层内可以包括多个处理装置本例中,多臂老虎机控制器,它通过基于上下文信息的多臂老虎机控制算法控制是否透出通道笔记。更优选地,还可以对每个通道的输出结果设置排序算法,即每个通道有自己的排序标准,比如被点击的次数、被搜索的次数等等。
30.更优选地,还可以对每个通道的输出结果设置最低曝光数量。所谓最低曝光数量,就是至少在一个通道内选择的结果数量。在极端情况下,有些被多臂老虎机筛出的通道结果,如果直接进行排序输出,可能会导致某些通道输出的结果排序位置较低,超出了搜索结果所允许的数量而被丢弃,使得多臂老虎机的筛选失去意义,也影响了结果的多样性。为避免该情况,可以设置通道的最低曝光数量,即一个通道最少输出一定数量的结果,本例中最低曝光数量设置为3。
31.举例说明上述优选的实施方式的工作方式:例如检索结果列表最终可以展示结果数量为 10个、通道最低曝光数量为3。经过与融合导处理后剩下a,b,c,d四个通道,再通过或融合层处理(本例中采用多臂老虎机选择)后剩下a,b,d三个通道。对a,b,d内的结果按排序模型排序,然后a,b,d分布截取前3个笔记,填充到10个空间里。这时候还剩余1个空间,我们再从a,b,d剩余的笔记里取全局排序最优的一个填充剩余1个空间,最终返回。
32.本发明还提供一种多通道信息检索与融合的方法,用于信息检索领域,包括:分析用户检索请求的步骤,具体地,可以分析用户的检索请求中包括检索词本身、用户发起请求时的位置、发起请求时的时间、用户本身的个人信息(包括身份、网上冲浪记录、搜索记录
等)。
33.根据用户请求的分析结果,判定需要打开的召回通道的步骤。判定的标准可以是检索请求与召回通道属性的相关性,比如检索请求中的检索词是“口红”,则与地理位置通道相关性很低,因此关闭地理位置通道;而口红与亲密度通道相关性很高,因此打开亲密度通道。
34.多个通道召回结果通过“与”操作进行融合的步骤。比如将各个通道同语义相关通道结果经过“与”操作进行融合,能够剔除不相关笔记。各个通道和个性化向量通道结果进行“与”操作融合,能够在有限召回空间内将更符合用户个性化需求的结果选出。其他与操作融合将得到不同性质结果。在系统内通道与操作通过比特图的方式进行加速。
35.优选地,“与”操作后,还可以包括利用基于上下文信息的多臂老虎机控制算法对通道召回结果进行筛选的步骤。更优选地,还可以对每个通道的输出结果设置排序算法,即每个通道有自己的排序标准,比如被点击的次数、被搜索的次数等等。更优选地,还可以对每个通道的输出结果设置最低曝光数量。
36.综上所述,本发明的多通道信息检索与融合系统和方法,能够自适应的选择在当前用户搜索词下最优的召回通路,从而增强搜索多样性和个性化,通过“与或”操作,控制多个通道召回结果的相关性和个性化的程度,并以高效方式融合多个通道结果。而且系统能够从搜索数据中学习增强个性化召回方式,不断自动改进检索结果的质量。
37.上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变,例如:触发模型是一种逻辑装置,实践中也可以将所有的触发判定都封装在一个逻辑模块中,然后输出打开、关闭通道的指令,这与本文中“触发模型陈列”的描述应当属于实质相同;同理,召回通道也只是逻辑装置,实现时是封装成一个模块,还是嵌入其它模块,还是独立,均属于本发明的构思。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献