技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种应用于文件柜的文件定位方法和系统与流程  >  正文

一种应用于文件柜的文件定位方法和系统与流程

  • 国知局
  • 2024-07-31 22:57:48

本发明属于文件管理,特别是涉及一种应用于文件柜的文件定位方法和系统。

背景技术:

1、文件柜用于存储和组织文件、文件和其他纸质资料的家具或设备,通常用于办公室、图书馆、学校、医疗机构以及其他需要管理大量纸质文件的场所,而随着办公需求的日益增长,数字化和电子文件逐渐取代了纸质文件,发展出智能文件柜。

2、而智能文件柜控制系统通过现代技术实现的高级文件柜管理解决方案,通常结合物联网iot、人工智能ai和云计算技术,提供更智能、高效和安全的文件管理体验,现有技术中的智能文件柜控制系统,用户可以通过手机应用、网页或其他远程途径访问和控制文件柜,可以随时随地查看文件柜的状态、开启/关闭锁、上传/下载文件,可以集成身份验证技术,如指纹识别、面部识别、密码等,以确保只有授权人员可以访问文件柜,可根据预设规则自动整理文件,将文件放置在适当的位置,帮助节省时间和精力。

3、然而传统的文件柜控制系统虽然可以查看内部文件柜的存储状态,但是当需要查找文件时,依然需要用户手动查找文件,依赖人工记忆和搜索,容易出现定位繁琐、耗时的情况,同时无法根据用户的个人习惯和历史访问行为提供个性化建议,用户需要自行判断和决策,因此亟需一种应用于文件柜的文件定位方法和系统来解决此类问题。

技术实现思路

1、本发明的目的在于提供一种应用于文件柜的文件定位方法和系统,通过粗定位和精准定位两种方法,在粗定位时确定文件柜中每层文件的区域,在精定位时确定每层文件中各个文件的角点,来实现文件的精准定位,解决了现有的文件柜内的文件查找费事费力、容易防错文件的问题。

2、为解决上述技术问题,本发明是通过以下技术方案实现的:

3、本发明为一种应用于文件柜的文件定位方法,包括如下步骤:

4、步骤s1:采集自然场景下,获取文件柜的文件图像;

5、步骤s2:根据文件图像建立二维坐标系,在二维坐标系中对文件柜的四个角点进行定义;

6、步骤s3:采用预训练好的网络架构提取文件图像特征;

7、步骤s4:采用多尺度特征聚合的方式进行尺度形变特征的适用性;

8、步骤s5:采用注意力机制辅助预测文件区域指导网络对文件四个角点粗定位;

9、步骤s6:以粗定位预测结果为输入,进行角点区域图像块预处理;

10、步骤s7:采用迭代检测将预处理得到的块区域角点图像进行多次迭代定位;

11、步骤s8:输出最终文件精准定位结果。

12、作为一种优选的技术方案,所述步骤s2中,以文件柜图像左上角点为二维坐标原点,文件柜宽的方向为二维坐标系x轴防线,文件柜高的方向为二维坐标系y轴方向建立二维坐标系;所述文件柜图像中文件角点分为四类,将四类角点中横纵坐标之和最小的点定义为文件柜的左上角点tl,即tl=min(xk+yk);则tl为初始点,按照文件柜的顺时针方向依次将文件柜的剩余三类角定义为右上角点tr,右下角点br和左下角点bl。

13、作为一种优选的技术方案,所述步骤s3中,预训练好的网络架构包括五段卷积,分别为block1、block2、block3、block4、block5;每段所述卷积内置有三个卷积层,每段卷积后连接一个池化层,通过三个全连接层将特征进行向量化处理。

14、每段卷积核数量相同,卷积核大小均为3×3,较小的卷积核可以保证网络在参数量较小的情况下,拥有更强的非线性函数拟合能力,进而提升卷积神经网络的特征学习能力。vgg网络最大的贡献是在使用很小的卷积核的情况下,网络层数的加深可以有效提升模型的效果,且vgg网络在其他数据集上都有良好的泛化能力。可以额外在五个block之后增加两个卷积层,然后连接两个全连接层用来回归输出粗定位网络预测的角点坐标。

15、在额外增加的两个卷积层中,将普通卷积替换为空洞率为1的3×3大小的空洞卷积来提取特征。因为空洞卷积在不采用池化操作的情况下,也能够提取图像的全局信息。还能在不增加卷积核参数的情况下,增大感受野范围,相比于普通卷积能输出更大的视野特征信息,有利于网络提取文件全局特征,更准确定位图像中不同尺度和形变的文件。

16、作为一种优选的技术方案,所述步骤s4中,多尺度特征聚合的方式包括二维卷积计算、反卷积计算和加和计算;所述尺度形变特征从block3输出时,使用二维卷积计算,同时对输出特征进行两次空洞率为1的反卷积计算和一次空洞率为1的反卷积计算,通过四次计算后的特征进行第一次加和计算,将从block3、block4、block5计算后得到的特征进行二次加和计算得到多尺度特征。

17、多尺度特征聚合既能使网络同时学习较高卷积层提取的语义特征和较低卷积层提取的结构细节特征进而获得不同尺度的文件特征,且部分特征的融合还可以很好的降低网络的超参数量,提高网络的训练速度。

18、作为一种优选的技术方案,所述步骤s5中,采用注意力机制辅助预测文件区域指导网络对文件四个角点粗定位的流程如下:

19、步骤s51:建立多层初始特征融合架构,生成像素级别文件置信度图;

20、步骤s52:多尺度特征聚合模块输出的卷积图fmlif通过激活函数softmax计算生成文件置信度图a,计算公式如下:

21、a=softmax(fmlif);

22、步骤s53:文件置信度图a与空洞卷积层生成的卷积特征fatrous进行像素级别的点乘操作生成使文件区域被增强的卷积特征。

23、注意力模块建立在多层初始特征融合架构之后,以生成像素级别文件置信度图,置信度图每一个像素点的置信度值代表此像素点属于文件区域的概率大小。

24、作为一种优选的技术方案,所述步骤s6中,角点区域图像块预处理将每个视频的前50%帧用于训练,20%帧用于验证,其余的30%用于测试,并逐帧解析成静态图像;当训练数据量不足时,通过对图像进行旋转、裁剪和更改图像对比度来对训练数据量进行扩充。

25、作为一种优选的技术方案,所述步骤s7中,粗定位获取的文件柜的角点坐标为{dp}、文件区域s以及文件区域中文件的角点坐标{dgt};对于每帧或者每个文件图像f计算jaccard索引ji,ji测量四边形的识别分数,则识别分数的公式如下:

26、

27、本发明为一种应用于文件柜的文件定位系统,包括安装在文件柜前侧的摄像机和与摄像机无线连接的定位主机;

28、所述定位主机内部署有文件定位平台;所述文件定位平台包括粗定位单元和精确定位单元;

29、所述粗定位单元包括粗定位卷积神经网络、多尺度特征聚合模块、注意力模块和文件粗定位输出模块;所述粗定位卷积神经网络用于提取文件图像特征;所述多尺度特征聚合模块用于使网络获得多种尺度的文件特征;所述注意力模块用于辅助预测文件区域指导网络对文件四个角点粗定位;

30、所述精确定位单元包括角点区域图像预处理模块、精定位卷积神经网络,角点判断模块和文件精定位输出模块;所述角点区域图像预处理模块用于对每个文件柜的每一层进行识别,确定文件柜每层图片;所述精定位卷积神经网络用于对每一层的文件进行识别;所述角点判断模块用于判断文件柜每一层各个文件的角点,确定文件角点在二维坐标系内的坐标。

31、本发明具有以下有益效果:

32、本发明通过粗定位和精准定位两种方法,在粗定位时确定文件柜中每层文件的区域,在精定位时确定每层文件中各个文件的角点,来实现文件的精准定位,提高文件的查找效率。

33、当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

本文地址:https://www.jishuxx.com/zhuanli/20240730/195501.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。