技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于相似度搜索的业务信息支持方法及系统与流程  >  正文

基于相似度搜索的业务信息支持方法及系统与流程

  • 国知局
  • 2024-07-31 23:24:22

本申请涉及大数据,尤其是涉及一种基于相似度搜索的业务信息支持方法及系统。

背景技术:

1、指令事件是相关监管部门业务中非常重要的业务,通过对当前指令事件和历史指令事件库的搜索可以很好的反映出社会的热点事件。

2、由于事件数据往往是以长串文本形式存储在数据库中,现阶段一般是通过模糊匹配来查询相似事件,存在查询不准确,模糊匹配关键词需要人工来明确等问题。

技术实现思路

1、为了能更为准确的为相关部门提供需求信息,本申请提供一种基于相似度搜索的业务信息支持方法及系统。

2、第一方面,本申请提供一种基于相似度搜索的业务信息支持方法,采用如下的技术方案:

3、一种基于相似度搜索的业务信息支持方法,包括:

4、获取指令系统的历史指令数据,提取涉事信息并存入预设的数据库;其中,所述涉事信息包括涉事人员信息、时间、地点和事件名称中的一个或多个;

5、获取新搜索请求对应的指令事件文本,并提取得到当前的涉事信息;

6、分析,计算当前的涉事信息的各项与数据库中的历史涉事信息的各项的相似度;

7、汇总各项的相似度进行权重计算,得到整体相似度;

8、筛选出整体相似度不低于预设的相似度阈值的历史涉事信息所对应的历史指令数据,输出。

9、可选的,还包括:基于当前的涉事信息进行事件性质分类预处理;所述事件性质分类预处理包括:

10、如果涉事信息符合预设的地域性案件类别,则将数据库中非同县、市、省或联合管理区的数据作为次级历史数据;

11、如果涉事信息符合预设的季节性案件类别,则将数据库中非同季节或温度近似季节的数据作为次级历史数据;

12、相似度计算过程中,先对数据库中筛除次级历史数据后的其他历史数据分析和计算,再对次级历史数据分析和计算。

13、可选的,包括:

14、如果涉事信息符合预设的群体性/多群众案件类别,则:

15、接收上传的或根据涉事信息中的时间和地点从公共监控网络中调取匹配时段和地点的历史监控数据;

16、对历史监控数据进行多目标跟踪和识别,得到嫌弃人/相关人的身份信息;

17、定义嫌弃人/相关人为新的涉事人员,得到与嫌弃人/相关人相似的历史指令数据,输出。

18、可选的,如果涉事信息符合预设的群体性/多群众案件类别,则:

19、根据涉事信息中的地点查找预存的通信基站信息表,得到涉事地点的通信基站;

20、向通信基站发起涉事时段的在线移动设备识别信息获取请求,并标记为疑似关联用户设备;

21、基于疑似关联用户设备查找预连接的人员库,分析得到疑似关联用户的身份信息;

22、若当前时段涉事事件持续,且记录有现场办案人员,则向现场办案人员预先绑定的移动设备发送疑似关联用户的身份信息。

23、可选的,包括:

24、接收现场办案人员上传的疑似关联用户的验证反馈及核验始末时间节点;

25、定义截止核验未时间节点未完成现场核验的疑似关联用户为待协助用户;

26、基于人员库查找待协助用户的联系方式,并根据联系方式发送事件协助告知信息。

27、可选的,包括:如果涉事信息符合预设的网络事件类别,则对整体相似度不低于预设的相似度阈值的历史涉事信息所对应的历史指令数据进行预设的社交关系网风险分析,确定风险用户。

28、可选的,所述社交关系网风险分析,其包括:

29、根据涉事人员信息向预先匹配的多个社交网络平台发起活跃咨询请求;

30、定义符合预设近期活跃条件的社交网络平台为涉事嫌疑平台;

31、提取涉事信息中的事情关键信息,通过涉事嫌疑平台进行涉事人员历次社交过程中的事情关键信息出现频次统计;

32、确定事情关键信息出现频次高于预设的风险阈值的社交过程所涉及的其他用户为风险用户。

33、可选的,包括:

34、假设风险用户为新的涉事人员,分析,计算新的涉事信息与数据库中的历史涉事信息的相似度;

35、筛选出整体相似度不低于预设的相似度阈值的历史涉事信息所对应的历史指令数据,输出。

36、第二方面,本申请提供一种基于相似度搜索的业务信息支持系统,采用如下的技术方案:

37、一种基于相似度搜索的业务信息支持系统,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如上述中任一种基于相似度搜索的业务信息支持方法的计算机程序。

38、综上所述,本申请包括以下至少一种有益技术效果:

39、1、不再需要人为确定搜索词,便捷化检索过程,且可以减小搜索词确定不准确对搜索相似事件的干扰;

40、2、并非直接单一向量化文本数据的方式来查询相似事件,所以可以减小文本整体相似度高,但是属于不同事件的情况;

41、综合上述两点可知,本方法可以更为准确的为相关部门提供需求信息。

技术特征:

1.一种基于相似度搜索的业务信息支持方法,其特征在于,包括:

2.根据权利要求1所述的基于相似度搜索的业务信息支持方法,其特征在于,还包括:基于当前的涉事信息进行事件性质分类预处理;所述事件性质分类预处理包括:

3.根据权利要求2所述的基于相似度搜索的业务信息支持方法,其特征在于,包括:

4.根据权利要求3所述的基于相似度搜索的业务信息支持方法,其特征在于,如果涉事信息符合预设的群体性/多群众案件类别,则:

5.根据权利要求4所述的基于相似度搜索的业务信息支持方法,其特征在于,包括:

6.根据权利要求1所述的基于相似度搜索的业务信息支持方法,其特征在于,包括:如果涉事信息符合预设的网络事件类别,则对整体相似度不低于预设的相似度阈值的历史涉事信息所对应的历史指令数据进行预设的社交关系网风险分析,确定风险用户。

7.根据权利要求6所述的基于相似度搜索的业务信息支持方法,其特征在于:所述社交关系网风险分析,其包括:

8.根据权利要求7所述的基于相似度搜索的业务信息支持方法,其特征在于,包括:

9.一种基于相似度搜索的业务信息支持系统,其特征在于:包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至8中任一种基于相似度搜索的业务信息支持方法的计算机程序。

技术总结本发明公开了一种基于相似度搜索的业务信息支持方法及系统,其方法包括:获取指令系统的历史指令数据,提取涉事信息并存入预设的数据库;其中,所述涉事信息包括涉事人员信息、时间、地点和事件名称中的一个或多个;获取新搜索请求对应的指令事件文本,并提取得到当前的涉事信息;分析,计算当前的涉事信息的各项与数据库中的历史涉事信息的各项的相似度;汇总各项的相似度进行权重计算,得到整体相似度;筛选出整体相似度不低于预设的相似度阈值的历史涉事信息所对应的历史指令数据,输出。本申请具有更为准确的为相关部门提供需求信息的效果。技术研发人员:高冲,严赟,庄明伟受保护的技术使用者:嘉兴海视嘉安智城科技有限公司技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240730/197375.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。