文档的密点标注方法及装置、文档的密点标注系统与流程
- 国知局
- 2024-07-31 22:54:33
本技术涉及数据处理,具体而言,涉及一种文档的密点标注方法及装置、文档的密点标注系统。
背景技术:
1、相关技术中,通过手工密点标注或者插件技术对待处理文档进行密点标注;采用手工密点标注,要求定密人员熟练掌握相关的定密依据,定密事项和相关密点,并且定密质量高度依赖于定密人员的业务能力,因此,存在密点标注的效率较低,规范性差的问题;采用插件技术进行密点标注,需要将用于密点标注的插件嵌入相关软件中,但是部分软件不支持插件嵌入,因此,无法应用于全场景,功能覆盖不全面的问题。
2、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本技术实施例提供了一种文档的密点标注方法及装置、文档的密点标注系统,以至少解决由于通过插件技术进行密点标注造成的无法应用于全场景,功能覆盖不全面的技术问题。
2、根据本技术实施例的一个方面,提供了一种文档的密点标注方法,密点标注方法运行在独立且运行有可视化密点编辑器的进程中,包括:获取目标文档,其中,目标文档为待进行密点标注的文档,目标文档的格式为格式集合中的任意一种格式,格式集合至少包括:流式文件格式、版式文件格式和文本类txt格式;从目标文档中提取目标数据,其中,目标数据为目标文档中记载的全部数据,目标数据包括内容数据和样式数据,在目标文档的格式为流式文件格式的情况下,从目标文档中提取目标数据包括:按照可扩展标记语言xml格式解析目标文档中的每个元数据文件,得到目标数据,在目标文档的格式为版式文件格式的情况下,从目标文档中提取目标数据包括:对目标文档中的文件头、文件体、交叉引用表和文件尾进行解析,得到目标数据,在目标文档的格式为txt格式的情况下,从目标文档中提取目标数据包括:逐字节读取目标文档中的数据,将读取到的目标文档中的数据统一转换为统一码unicode格式;将从不同格式的目标文档中提取得到的样式数据转换为目标语言数据,并将目标语言数据与内容数据存储到数据结构,调用应用程序编程接口api将数据结构传输到可视化密点编辑器,并在可视化密点编辑器的交互界面按照样式数据展示内容数据,其中,目标语言数据为可视化密点编辑器能够解析的数据;响应于交互界面检测到的第一触发指令,依据密点配置信息对目标数据进行密点标注,得到密点标注数据,并将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,其中,密点配置信息存储在交互界面对应的存储设备中。
3、可选地,在交互界面中展示目标数据,包括:获取目标数据的标识信息,其中,标识信息至少包括:目标数据中各个字符的段落序号;依据各个字符的段落序号从小到大的顺序对目标数据中的字符进行排列,得到排列结果;将排列结果展示在交互界面,其中,排列结果展示在交互界面时对应的图像与目标图像相同,目标图像为在任意界面中打开目标文档时显示的图像。
4、可选地,在存在段落序号相同的多个字符的情况下,密点标注的方法还包括:获取段落序号相同的多个字符中每个字符的位置序号,其中,每个字符的位置序号用于指示每个字符在同一段落中的位置;依据每个字符的位置序号从小到大的顺序将段落序号相同的多个字符进行排列。
5、可选地,依据密点配置信息对目标数据进行密点标注,其中,密点配置信息,包括:标注格式、定密事项和密点数据,其中,密点数据指示需要进行密点标注的数据,定密事项用于指示密点数据对应的数据类型,标注格式用于指示数据类型对应的标注方式,其中,不同的数据类型对应不同的标注方式。
6、可选地,依据密点配置信息对目标数据进行密点标注,包括:扫描目标数据,得到扫描结果;在扫描结果指示目标数据中存在有效数据的情况下,依据定密事项确定每个有效数据所属的数据类型,依据标注格式根据每个有效数据所属的数据类型确定每个有效数据对应的标注方式,其中,有效数据是与密点数据相同的数据;采用每个有效数据对应的标注方式对每个有效数据进行密点标注,其中,密点标注后的有效数据在交互界面中的显示方式与除有效数据以外的其它数据在交互界面中的显示方式不同。
7、可选地,将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,包括:将密点标注后的有效数据输入到目标文档,并将目标文档中的有效数据替换为密点标注后的有效数据。
8、可选地,在依据密点配置信息对目标数据进行密点标注后,包括:响应于交互界面检测到的第二触发指令,将交互界面提供的密点标注功能由自动模式切换为手动模式,其中,第二触发指令是在交互界面执行完成第一触发指令对应的操作之后生成的;在手动模式下,依据目标对象在交互界面中输入的操作信息对目标数据进行密点标注。
9、根据本技术实施例的另一方面,还提供了一种文档的密点标注系统,包括:内容提取模块和密点标注模块,其中,内容提取模块和密点标注模块用于运行独立且运行有可视化密点编辑器的进程,独立且运行有可视化密点编辑器的进程用于运行文档的密点标注方法,内容提取模块用于获取目标文档,从目标文档中提取目标数据,将目标数据传输到密点标注模块,其中,目标文档为待进行密点标注的文档,目标文档的格式为格式集合中的任意一种格式,格式集合至少包括:流式文件格式、版式文件格式和文本类txt格式,目标数据为目标文档中记载的全部数据,目标数据包括内容数据和样式数据,在目标文档的格式为流式文件格式的情况下,从目标文档中提取目标数据包括:按照可扩展标记语言xml格式解析目标文档中的每个元数据文件,得到目标数据,在目标文档的格式为版式文件格式的情况下,从目标文档中提取目标数据包括:对目标文档中的文件头、文件体、交叉引用表和文件尾进行解析,得到目标数据,在目标文档的格式为txt格式的情况下,从目标文档中提取目标数据包括:逐字节读取目标文档中的数据,将读取到的目标文档中的数据统一转换为统一码unicode格式;密点标注模块,用于接收目标数据,将从不同格式的目标文档中提取得到的样式数据转换为目标语言数据,并将目标语言数据与内容数据存储到数据结构,调用应用程序编程接口api将数据结构传输到可视化密点编辑器,并在可视化密点编辑器的交互界面按照样式数据展示内容数据,其中,目标语言数据为可视化密点编辑器能够解析的数据;密点标注模块,还用于响应于交互界面检测到的第一触发指令,依据密点配置信息对目标数据进行密点标注,得到密点标注数据,并将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,其中,密点配置信息存储在交互界面对应的存储设备中。
10、根据本技术实施例的另一方面,还提供了一种文档的密点标注装置,用于运行文档的密点标注方法,密点标注方法运行在独立且运行有可视化密点编辑器的进程中,包括:获取模块,用于获取目标文档,其中,目标文档为待进行密点标注的文档,目标文档的格式为格式集合中的任意一种格式,格式集合至少包括:流式文件格式、版式文件格式和文本类txt格式;读取模块,用于从目标文档中提取目标数据,其中,目标数据为目标文档中记载的全部数据,目标数据包括内容数据和样式数据,在目标文档的格式为流式文件格式的情况下,从目标文档中提取目标数据包括:按照可扩展标记语言xml格式解析目标文档中的每个元数据文件,得到目标数据,在目标文档的格式为版式文件格式的情况下,从目标文档中提取目标数据包括:对目标文档中的文件头、文件体、交叉引用表和文件尾进行解析,得到目标数据,在目标文档的格式为txt格式的情况下,从目标文档中提取目标数据包括:逐字节读取目标文档中的数据,将读取到的目标文档中的数据统一转换为统一码unicode格式;处理模块,用于将从不同格式的目标文档中提取得到的样式数据转换为目标语言数据,并将目标语言数据与内容数据存储到数据结构,调用应用程序编程接口api将数据结构传输到可视化密点编辑器,并在可视化密点编辑器的交互界面按照样式数据展示内容数据,其中,目标语言数据为可视化密点编辑器能够解析的数据;标注模块,用于响应于交互界面检测到的第一触发指令,依据密点配置信息对目标数据进行密点标注,得到密点标注数据,并将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,其中,密点配置信息存储在交互界面对应的存储设备中。
11、根据本技术实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质中存储有计算机程序,其中,在非易失性存储介质所在设备通过运行计算机程序执行上述的文档的密点标注方法。
12、根据本技术实施例的另一方面,还提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为通过计算机程序执行上述的文档的密点标注方法。
13、根据本技术实施例的另一方面,还提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行时实现上述的文档的密点标注方法的步骤。
14、在本技术实施例中,采用获取目标文档,其中,目标文档为待进行密点标注的文档,目标文档的格式为格式集合中的任意一种格式,格式集合至少包括:流式文件格式、版式文件格式和文本类txt格式;从目标文档中提取目标数据,其中,目标数据为目标文档中记载的全部数据,目标数据包括内容数据和样式数据,在目标文档的格式为流式文件格式的情况下,从目标文档中提取目标数据包括:按照可扩展标记语言xml格式解析目标文档中的每个元数据文件,得到目标数据,在目标文档的格式为版式文件格式的情况下,从目标文档中提取目标数据包括:对目标文档中的文件头、文件体、交叉引用表和文件尾进行解析,得到目标数据,在目标文档的格式为txt格式的情况下,从目标文档中提取目标数据包括:逐字节读取目标文档中的数据,将读取到的目标文档中的数据统一转换为统一码unicode格式;将从不同格式的目标文档中提取得到的样式数据转换为目标语言数据,并将目标语言数据与内容数据存储到数据结构,调用应用程序编程接口api将数据结构传输到可视化密点编辑器,并在可视化密点编辑器的交互界面按照样式数据展示内容数据,其中,目标语言数据为可视化密点编辑器能够解析的数据;响应于交互界面检测到的第一触发指令,依据密点配置信息对目标数据进行密点标注,得到密点标注数据,并将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档的方法,通过将待进行密点标注的文档中记载的全部数据读取到运行密点标注的方法的终端设备中,自动对读取到的数据进行密点标注,将密点标注后的数据传输回待进行密点标注的文档,替换待进行密点标注的数据进行密点标注前的数据,达到了不受文档格式的限制以及打开文档的软件的限制,对各种格式的文档进行密点标注的目的,从而实现了全面覆盖密点标注功能的技术效果,进而解决了由于通过插件技术进行密点标注造成的无法应用于全场景,功能覆盖不全面技术问题。
本文地址:https://www.jishuxx.com/zhuanli/20240730/195257.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。