文件类型转换方法、装置、设备和存储介质与流程
- 国知局
- 2024-09-11 14:54:19
本技术涉及计算机,尤其涉及一种文件类型转换方法、装置、设备和存储介质。
背景技术:
1、目前,在将图片文件转换为pdf文件或者word文件时,用户需要先在用户终端中安装文件类型转换客户端,再通过文件类型转换客户端将用户选择的图片文件通过网络上传到服务器。在服务器中一般设置有文件类型转换算法,该文件类型转换算法利用服务器资源并行处理来自大量客户端的文件,将每个文件转换为用户所需的类型,再通过网络将转换出的各个文件分别返回给对应的客户端,以便在客户端中展示转档后的文件。
2、由于现有的文件类型转换过程必须借助服务器,需要在服务器进行集中转档操作,这导致现有的文件类型转换时间较长。造成这一问题的原因在于:文件的大小以及网络环境的优劣都会影响文件的上传和回传时间,而且,在需要处理的文件较多或者文件的复杂度较高时,服务器的算力不足而且资源有限,影响单个文件的转档时间,甚至会出现转档失败的问题。
技术实现思路
1、本技术提供了一种文件类型转换方法、装置、设备和存储介质,以解决现有的文件类型转换过程必须借助服务器,导致现有的文件类型转换时间较长的问题。
2、针对上述技术问题,本技术技术方案是通过如下实施例来解决的:
3、本技术实施例提供了一种文件类型转换方法,在用户终端执行,包括:确定待转换图像及目标文件类型;识别所述待转换图像中的信息块并且确定所述信息块的属性信息;在所述待转换图像中,提取所述信息块的特征信息;创建所述目标文件类型的文件并且根据所述信息块的属性信息和特征信息,将所述信息块绘制到所述文件中,得到目标转档文件。
4、其中,所述确定待转换图像及目标文件类型,包括:基于被选中的候选图像,针对所述候选图像执行预处理操作,将预处理操作之后的所述候选图像确定为待转换图像;和/或;接收所述其他用户终端发送的文件类型并且将接收到的所述文件类型确定为所述目标文件类型。
5、其中,所述针对所述候选图像执行预处理操作,包括:在所述候选图像存在噪声的情况下,对所述候选图像进行降噪处理;和/或,在所述候选图像的数据量大于预设的数据量阈值的情况下,对所述候选图像进行图像压缩处理;和/或,在所述候选图像的图像长宽比与所述用户终端的屏幕长宽比不同的情况下,调整所述候选图像的尺寸,使所述候选图像的长宽比与所述用户终端的屏幕长宽比相同。
6、其中,所述识别所述待转换图像中的信息块并且确定所述信息块的属性信息,包括:调用在操作系统中运行的图像分析工具,通过所述图像分析工具识别所述待转换图像中置信度大于预设置信度阈值的信息块,并且,确定所述置信度大于预设置信度阈值的信息块的属性信息。
7、其中,所述属性信息包括:所述信息块中的文本内容以及所述信息块在所述待转换图像中的坐标信息;所述特征信息包括:所述信息块中的文本内容的字体大小、字体颜色和/或背景颜色;所述在所述待转换图像中,提取所述信息块的特征信息,包括:根据所述信息块的坐标信息,确定所述信息块的尺寸;并且,根据所述信息块的尺寸,确定所述文本内容的字体大小;和/或,根据所述信息块的坐标信息,在所述待转换图像中,裁剪出所述信息块对应的信息块图像;并且,在所述信息块图像中,提取所述文本内容的字体颜色和/或背景颜色。
8、其中,所述根据所述信息块的尺寸,确定所述文本内容的字体大小,包括:确定与所述信息块的高度对应的初始字体大小;基于所述初始字体大小,绘制所述信息块中的文本内容并且生成用于容纳所述文本内容的文本框;其中,所述文本框的尺寸大小和所述文本内容的字体大小联动;将所述文本框的尺寸调整到与所述信息块的尺寸一致,确定尺寸调整后的所述文本框中的文本内容的字体大小,并且,将所述文本框中的文本内容的字体大小作为所述信息块中的文本内容的字体大小。
9、其中,所述在所述信息块图像中,提取所述文本内容的字体颜色和/或背景颜色,包括:利用预设的像素聚类算法,将所述信息块图像中的像素聚类为两个颜色簇;将包含像素少的颜色簇对应的颜色作为所述文本内容对应的字体颜色,并且,将包含像素多的颜色簇对应的颜色作为所述文本内容对应的背景颜色。
10、其中,在所述根据所述信息块的属性信息和特征信息,将所述信息块绘制到所述文件中之前,还包括:将所述信息块的属性信息以及所述信息块的特征信息作为一个block对象,存储在预先创建的block数组中;所述根据所述信息块的属性信息和特征信息,将所述信息块绘制到所述文件中,包括:从所述block数组中,获取所述block对象;根据所述block对象中的所述信息块的属性信息和特征信息,将所述信息块绘制到所述文件中。
11、其中,所述属性信息包括:所述信息块中的文本内容以及所述信息块在所述待转换图像中的坐标信息;所述特征信息包括:所述信息块中的文本内容对应的字体大小;所述根据所述信息块的属性信息和特征信息,将所述信息块绘制到所述文件中,包括:根据所述信息块的坐标信息并且基于所述文本内容对应的字体大小,将所述文本内容绘制到所述文件的页面上。
12、其中,所述特征信息还包括:所述信息块中的文本内容对应的字体颜色;所述根据所述信息块的坐标信息并且基于所述文本内容对应的字体大小,将所述文本内容绘制到所述文件的空白页页面上,包括:将所述待转换图像铺设在所述文件的页面上,形成背景图像;根据所述信息块的坐标信息并且基于所述文本内容对应的字体大小和字体颜色,将所述文本内容绘制到所述背景图像上。
13、其中,所述特征信息还包括:所述信息块中的文本内容对应的字体颜色和背景颜色;所述根据所述信息块的坐标信息并且基于所述文本内容对应的字体大小和字体颜色,将所述文本内容绘制到所述背景图像上,包括:根据所述信息块的坐标信息,确定所述信息块的尺寸;生成与所述信息块的尺寸一致并且与所述文本内容对应的背景颜色一致的背景图像块;根据所述信息块的坐标信息,将所述背景图像块绘制到所述背景图像之上;基于所述文本内容对应的字体大小和字体颜色,将所述文本内容绘制到所述背景图像块上。
14、其中,所述属性信息还包括:所述信息块的置信度;在所述信息块的数量为多个的情况下,在所述待转换图像中,提取所述信息块的特征信息之前,还包括:针对每个所述信息块,根据所述信息块的坐标信息以及与所述信息块位置相邻的信息块的坐标信息,确定相邻两个所述信息块之间的中心点距离;在所述中心点距离小于预设的距离阈值的情况下,比较两个所述信息块分别对应的置信度,舍弃置信度小的信息块,保留置信度大的信息块。
15、本技术实施例还提供了一种文件类型转换装置,设置在用户终端,包括:确定模块,用于确定待转换图像及目标文件类型;识别和确定模块,用于识别所述待转换图像中的信息块并且确定所述信息块的属性信息;提取模块,用于在所述待转换图像中,提取所述信息块的特征信息;创建和绘制模块,用于创建所述目标文件类型的文件并且根据所述信息块的属性信息和特征信息,将所述信息块绘制到所述文件中。
16、本技术实施例还提供了一种文件类型转换设备,包括:至少一个通信接口;与所述至少一个通信接口相连接的至少一个总线;与所述至少一个总线相连接的至少一个处理器;与所述至少一个总线相连接的至少一个存储器,其中,所述处理器被配置为:执行所述存储器中存储的文件类型转换程序,以实现上述任一项所述的文件类型转换方法。
17、本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被执行,以实现上述任一项所述的文件类型转换方法。
18、本技术实施例提供的上述技术方案与现有技术相比具有如下优点:本技术实施例提供的方法可以加载待转换图像并且确定目标文件类型;调用在操作系统中运行的图像分析工具,识别所述待转换图像中的信息块并且确定所述信息块的属性信息;在所述待转换图像中,提取所述信息块的特征信息;创建所述目标文件类型的文件并且根据所述信息块的属性信息和特征信息,将所述信息块绘制到所述文件中,得到目标转档文件。本技术实施例利用用户终端的原生功能,识别待转换图像中的信息块并且确定信息块的属性信息,并且,在用户终端提取信息块的特征信息,进而将信息块绘制到新建的文件中,无需借助服务器转档,无需联网即可实现文件类型转换,节省了图像传输时间及服务器集中转档时间,缩短了文件类型转换的时长。
本文地址:https://www.jishuxx.com/zhuanli/20240911/292520.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。