一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据存储方法、检索方法、装置及电子设备与流程

2022-11-16 15:12:48 来源:中国专利 TAG:

技术特征:
1.一种数据存储方法,其特征在于,所述方法包括:基于数据存储原则将待存储数据存入已创建的逻辑存储空间内,其中,所述待存储数据为文本数据,所述逻辑存储空间具有空间标识,所述数据存储原则为:所述逻辑存储空间内存入的数据的大小小于或等于预设阈值;执行针对所述逻辑存储空间的索引创建操作;所述索引创建操作包括:识别所述逻辑存储空间内所存储的各文本数据对应的多个关键词;建立并存储所述多个关键词与所述逻辑存储空间的空间标识之间的映射关系,所述映射关系用于在数据检索时查找到检索词对应的逻辑存储空间,以从查找到的逻辑存储空间中检索所述检索词对应的数据。2.根据权利要求1所述的方法,其特征在于,所述执行针对所述逻辑存储空间的索引创建操作,包括:当监测到停止向所述逻辑存储空间内存入数据时,执行针对所述逻辑存储空间的索引创建操作。3.根据权利要求2所述的方法,其特征在于,所述基于数据存储原则将待存储数据存入已创建的逻辑存储空间内,包括:将待存储数据存入已创建的逻辑存储空间内;在将所述待存储数据存入所述逻辑存储空间内的过程中,若所述逻辑存储空间内存储的数据大小到达所述预设阈值,则停止向所述逻辑存储空间内存入所述待存储数据。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:在将所述待存储数据存入所述逻辑存储空间内的过程中,若所述逻辑存储空间从开始存入数据的时刻到当前时刻的时长到达设定时长,则停止向所述逻辑存储空间内存入所述待存储数据。5.根据权利要求1所述的方法,其特征在于,所述逻辑存储空间存储在hadoop分布式文件系统hdfs中,所述映射关系存储在elasticsearch系统中。6.根据权利要求5所述的方法,其特征在于,所述预设阈值等于或小于所述hdfs的分布式块的数据大小。7.根据权利要求6所述的方法,其特征在于,当所述预设阈值小于所述分布式块的数据大小时,所述预设阈值与所述分布式块的数据大小之间的差的绝对值小于设定阈值。8.根据权利要求1至7任一项所述的方法,其特征在于,所述识别所述逻辑存储空间内所存储的各文本数据对应的多个关键词,包括:通过命名实体识别算法识别所述逻辑存储空间内所存储的各文本数据对应的多个关键词。9.根据权利要求1至7任一项所述的方法,其特征在于,所述识别所述逻辑存储空间内所存储的各文本数据对应的多个关键词,包括:对所述逻辑存储空间内所存储的各文本数据进行分词处理,得到多个分词;从所述多个分词中筛选出属于预设属性的各个词作为所述逻辑存储空间内所存储的各文本数据对应的多个关键词。10.根据权利要求9所述的方法,其特征在于,所述预设属性包括以下至少一项:表示时
间的词、表示地点词、表示虚拟角色名称的词、表示所发生事件的词。11.根据权利要求1至7任一项所述的方法,其特征在于,在所述基于数据存储原则将待存储数据存入已创建的逻辑存储空间内之前,所述方法还包括:获取待存储数据;为所述待存储数据创建逻辑存储空间,并为所述逻辑存储空间添加空间标识。12.一种数据检索方法,其特征在于,所述数据检索方法包括:获取检索词;从所存储的各映射关系中查找所述检索词对应的目标空间标识,其中,所述各映射关系是根据权利要求1至11中任一项所述的数据存储方法中映射关系的存储方式所存储的;从所述目标空间标识对应的逻辑存储空间中查找与所述检索词相匹配的数据,其中,所述逻辑存储空间中存储的数据是根据权利要求1至11中任一项所述的数据存储方法中对待存储数据进行存储的方式所存储的。13.一种数据存储装置,其特征在于,所述装置包括:数据存储单元,用于基于数据存储原则将待存储数据存入已创建的逻辑存储空间内,其中,所述待存储数据为文本数据,所述逻辑存储空间具有空间标识,所述数据存储原则为:所述逻辑存储空间内存入的数据的大小小于或等于预设阈值;索引存储单元,用于执行针对所述逻辑存储空间的索引创建操作;所述索引存储单元具体用于通过以下步骤进行所述索引创建操作:识别所述逻辑存储空间内所存储的各文本数据对应的多个关键词;建立并存储所述多个关键词与所述逻辑存储空间的空间标识之间的映射关系,所述映射关系用于在数据检索时查找到检索词对应的逻辑存储空间,以从查找到的逻辑存储空间中检索所述检索词对应的数据。14.一种数据检索装置,其特征在于,所述装置包括:获取单元,用于获取检索词;标识查找单元,用于从所存储的各映射关系中查找所述检索词对应的目标空间标识,其中,所述各映射关系是根据权利要求13所述的数据存储装置中索引存储单元存储映射关系的方式所存储的;数据查找单元,用于从所述目标空间标识对应的逻辑存储空间中查找与所述检索词相匹配的数据,其中,所述逻辑存储空间中存储的数据是根据权利要求13所述的数据存储装置中数据存储单元存储待存储数据方式所存储的。15.一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储数据处理程序,该电子设备通电并通过所述处理器运行该程序后,执行如权利要求1-12中任一项所述的方法。16.一种计算机可读存储介质,其特征在于,存储有数据处理程序,该程序被处理器运行,执行如权利要求1-12中任一项所述的方法。

技术总结
本申请公开了一种数据存储方法、检索方法、装置、电子设备及计算机可读存储介质。存储方法包括:基于数据存储原则将待存储数据存入已创建的逻辑存储空间内,数据存储原则为:逻辑存储空间内存入的数据的大小小于或等于预设阈值;执行针对逻辑存储空间的索引创建操作:识别逻辑存储空间内所存储的各文本数据对应的多个关键词;建立并存储多个关键词与逻辑存储空间的空间标识之间的映射关系,映射关系用于在数据检索时查找到检索词对应的逻辑存储空间,以从查找到的逻辑存储空间中检索检索词对应的数据。采用本申请实施例提供的方案能够从查找到的逻辑存储空间中的少量的数据中快速检索到该检索词对应的数据,提高了检索效率。率。率。


技术研发人员:王英旋 冯阳 吴剑飞 谢泽勇
受保护的技术使用者:网易(杭州)网络有限公司
技术研发日:2022.07.12
技术公布日:2022/11/15
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献