一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种对Word文件数据结构化条目化的处理方法与流程

2022-03-26 15:28:25 来源:中国专利 TAG:

一种对word文件数据结构化条目化的处理方法
技术领域
1.本技术涉及文件在线编辑技术领域,尤其涉及一种对word文件数据结构化条目化的处理方法。


背景技术:

2.目前office.word作为软件研制过程中主要的管理工具之一,承载很多关键的急需结构化的信息。将软件研制模式由文件驱动转变为数据驱动,将工作数据条目化管理,并建立追溯关系,使软件研制过程从需求到开发测试的全过程可追溯。
3.为使以文件为中心的团队,轻松导入和利用现有资产,同时从整体上下文中更直观查看数据,很多信息系统,如专利cn111858523a“一种文件在线协同编辑方法”提供了web端的office.word文件技术(简称word文件),具备基本的文件编写能力,支持在线编辑公式、visio图、图片及附件等,支持查看正文、多级标题样式以及文件大纲,方便从整体角度编辑工程数据,但是在文件样式、富文本对象的多样性上,与word这样的专业文字处理工具相比较,必定存在一些弱势。专利cn200910052805.7“跨平台的文件在线编辑系统及其方法”提出了浏览器中打开office.word的方法,解决了以上的一些难题,可以更好的专注于文件的格式、ole对象的编写等等,需要将office.word的关键内容进行结构化、条目化处理,但是现有技术对于office.word的关键内容结构化、条目化还是解决的不够理想。因此,用户在使用信息系统的时候,如何有效对word文件数据结构化、条目化成为亟需改善的问题。


技术实现要素:

4.本技术解决的技术问题是:针对现有技术中无法有效对word文件数据结构化、条目化的问题,提供了一种对word文件数据结构化条目化的处理方法,本技术实施例所提供的方案中,通过将word文件所对应的文件数据进行数据化、条目化得到结构化条目化的数据,规避现阶段很多web端(网页端)的word编辑器诸多弊端,更好的支持各种软件(如math公式、visio图像)对象的无差别编辑,更是可以集成如mythtype等工具,将文档中重要的数据信息快速识别,条目化、控件化,实现有效对word文件数据结构化、条目化。
5.第一方面,本技术实施例提供一种对word文件数据结构化条目化的处理方法,该方法包括:创建浏览器控件,通过所述浏览器控件在线打开、编辑word文件得到所述word文件所对应的文件数据;对所述文件数据进行数据化、条目化得到结构化条目化的数据。
6.可选地,所述浏览器控件为activex控件。
7.可选地,通过所述浏览器控件在线打开、编辑word文件得到所述word文件所对应的文件数据,包括:通过所述浏览器控件在线打开word文件,并调用创建word文件内容控件的函数;通过所述函数编辑word文件得到所述文件数据。
8.可选地,对所述文件数据进行数据化、条目化得到结构化条目化的数据,包括:根据预设索引方法搜索查询所述文件数据中至少一个关键数据所处的位置信息,根据所述位
置信息对每个关键数据进行加框处理得到加框处理后的数据;通过预设插件将每个加框处理后的数据添加到word文件控件得到所述结构化条目化的数据。
9.可选地,所述预设插件为aspose插件。
10.可选地,通过预设插件将每个加框处理后的数据添加到word文件控件得到所述结构化条目化的数据,包括:通过aspose插件将每个加框处理后的数据添加到所述word文件控件中的富文本内容控件、下拉框内容控件或者多选框内容控件得到所述结构化条目化的数据。
11.可选地,还包括:通过activex控件将所述结构化条目化的数据进行解析得到解析后的数据,并展示所述解析后的数据。
12.第二方面,本技术提供一种电子设备,该电子设备,包括:
13.存储器,用于存储至少一个处理器所执行的指令;
14.处理器,用于执行存储器中存储的指令执行第一方面所述的方法。
15.第三方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行第一方面所述的方法。
16.与现有技术相比,本技术实施例所提供的方案至少具有如下技术有益效果:
17.本技术实施例所提供的方案中,通过将word文件所对应的文件数据进行数据化、条目化得到结构化条目化的数据,规避现阶段很多web端(网页端)的word编辑器诸多弊端,更好的支持各种软件(如math公式、visio图像)对象的无差别编辑,更是可以集成如mythtype等工具,将文档中重要的数据信息快速识别,条目化、控件化,实现有效对word文件数据结构化、条目化。
附图说明
18.图1为本技术实施例所提供的一种对word文件数据结构化条目化的处理方法的流程示意图;
19.图2为本技术实施例所提供的一种对word文件数据进行结构化条目化的示意图;
20.图3为本技术实施例所提供的一种对word文件数据处理的结构示意图;
21.图4为本技术实施例所提供的一种电子设备的结构示意图。
具体实施方式
22.本技术实施例提供的方案中,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
23.为了更好的理解上述技术方案,下面通过附图以及具体实施例对本技术技术方案做详细的说明,应当理解本技术实施例以及实施例中的具体特征是对本技术技术方案的详细的说明,而不是对本技术技术方案的限定,在不冲突的情况下,本技术实施例以及实施例中的技术特征可以相互组合。
24.本发明方法具体实现方式可以包括以下步骤(方法流程如图1所示):
25.步骤101,创建浏览器控件,通过所述浏览器控件在线打开、编辑word文件得到所
述word文件所对应的文件数据。
26.在本技术实施例所提供的方案中,为了对word文件数据进行结构化条目化处理,首先需要创建浏览器控件,作为举例,该浏览器控件为activex控件,进一步,创建浏览器控件的方式有多种,例如,通过mfc activex control的技术创建通过一种浏览器activex控件,研发officecontrolx64.ocx,这种activex控件可以调用微软平台的com、comaddin组件,拓展主流浏览器的拓展插件。
27.进一步,在一种可能实现的方式中,通过所述浏览器控件在线打开、编辑word文件得到所述word文件所对应的文件数据,包括:通过所述浏览器控件在线打开word文件,并调用创建word文件内容控件的函数;通过所述函数编辑word文件得到所述文件数据。
28.具体的,在本技术实施例所提供的方案中,在创建浏览器控件之后,根据该浏览器控制在浏览器中打开、编辑word文件。作为举例,通过浏览器控件使用javascript脚本操作、编辑、宏定义office.word,调用创建office.word内容控件的函数(如vba函数),根据快速编辑word文件并得到文件数据。
29.步骤102,对所述文件数据进行数据化、条目化得到结构化条目化的数据。
30.具体的,在本技术实施例所提供的方案中,在得到word文件所对应的文件数据之后,还需要对文件数据进行数据化、条目化处理得到结构化条目化的数据。在本技术实施例所提供的方案中,对文件数据进行数据化、条目化处理得到结构化条目化的数据的方式有多种,下面以其中一种为例进行说明。
31.在一种可能实现的方式中,对所述文件数据进行数据化、条目化得到结构化条目化的数据,包括:根据预设索引方法搜索查询所述文件数据中至少一个关键数据所处的位置信息,根据所述位置信息对每个关键数据进行加框处理得到加框处理后的数据;通过预设插件将每个加框处理后的数据添加到word文件控件得到所述结构化条目化的数据。
32.具体的,在本技术实施例所提供的方案中,通过系统平台提供的开放性接口,将word文件进行对象化,识别word文件中至少一个关键数据以及确定每个关键数据在word文件中所处的位置信息,作为举例,关键数据包含关键字、类型、章节等表征某种特征的数据;然后通过每个关键数据所对应的位置信息对每个关键数据进行加框处理得到加框处理后的数据;通过预设插件将每个加框处理后的数据添加到word文件控件得到结构化条目化的数据。作为举例,通过正则、字符匹配的方式进行关键数据的索引,识别word文件中至少一个关键数据,然后把word文件中的关键数据进行“加框”处理。
33.在一可能实现的方式中,所述预设插件为aspose插件。
34.又作为一种举例,通过java平台提供的aspose.word插件,将word文件进行对象化,使用aspose.structureddocumenttag操作类对关键数据进行数据化、条目化,通过正则、字符匹配的方式进行关键信息的索引,对数据进行控件化操作,使用structureddocumenttag.settitle()、settag()、structureddocumenttag.gettext()等等一系列的方法,把word文件中的关键信息进行“加框”处理。
35.进一步,在对word文件中的关键数据进行“加框”处理之后,将加框处理后的数据添加到word文件控件得到结构化条目化的数据。在本技术实施例所提供的方案中,将加框处理后的数据添加到word文件控件得到结构化条目化的数据的方式有多种,下面以其中一种为例进行说明。
36.在一种可能实现的方式中,通过预设插件将每个加框处理后的数据添加到word文件控件得到所述结构化条目化的数据,包括:通过aspose插件将每个加框处理后的数据添加到所述word文件控件中的富文本内容控件、下拉框内容控件或者多选框内容控件得到所述结构化条目化的数据。
37.具体的,在本技术实施例所提供的方案中,将数据添加为word文件的内容控件(如富文本内容控件、下拉框内容控件、多选框内容控件等),同时将关键数据同系统同步,做到了word文件主要数据的结构化、条目化,结构化的数据存储到系统(如包含文件的内容、格式、ole对象等等)。作为举例,通过aspose插件通过acceptallrevisions()的方法将数据添加为word文件控件使得word文件的数据结构化、条目化。
38.参见图2,为本技术实施例所提供的一种对word文件数据进行结构化条目化的示意图。在图2中,将该word文件按照数据类型分为三部分数据,分别为延时遥测数据、接收ccu重要数据以及发送ccu重要数据;进一步,又将每部分数据分进行结构化处理为6个条目,编号分别为1、2、3、4、5以及6,其中,编号1对应的内容为
“°”
;编号2对应的内容为“功能描述”;编号3对应的内容为“调用条件”;编号4对应的内容为“输入”;编号5对应的内容为“输出”;编号6对应的数据为“处理”。进一步,在将word文件中各部分进行结构化化之后,又将各部分中的数据进行条目化处理,如在图2中,将延时遥测数据中“处理”部分所涉及的数据放置在“《遥测》5.1”这个条目下面,将接收ccu重要数据以及发送ccu重要数据中“处理”部分所涉及的数据放置在“《重要数据》这个条目下面,进而实现对word文件数据进行结构化条目化。
39.进一步,在本技术实施例所提供的方案中,将word文件数据结构化、条目化处理之后,还需要将结构化条目化的数据进行展示。展示结构化条目化数据的方式有多种,下面以其中一种为例进行说明。
40.在一种可能实现的方式中,还包括:通过activex控件将所述结构化条目化的数据进行解析得到解析后的数据,并展示所述解析后的数据。
41.作为举例,通过activex控件提供的解析数据文件流技术,将结构化的数据呈现在word文件中;activex控件解析调用自定义的word文件宏定义脚本,将结构化、条目化数据展示在前端展示层中。
42.为了便于理解将上述对word文件数据结构化条目化的处理过程以及数据结构化条目化数据展示过程进行简要说明。
43.参见图3,为本技术实施例提供的一种对word文件数据处理的结构示意图。在图3中,将word文件数据处理分为两个部分,分别为对word文件数据进行结构化条目化处理以及展示结构化条目化的数据。进一步,将对word文件数据处理又分为三个阶段,分别为web端数据分析处理阶段、后台结构化数据阶段、信息系统展示阶段。为了便于理解,下面分别对这三个阶段的过程进行简要介绍。
44.(1)web端数据分析处理阶段:首先通过web浏览器加载在线office.word控件,该浏览器控件可以在线打开、编辑office.word,在浏览器上通过开发的按钮,调用创建office.word内容控件的函数方法(可以是vba函数),可以快速创建文档需要结构化的数据,最后将已定义好的文件数据、条目化数据的输出给阶段(2);
45.(2)后台结构化数据阶段:通过信息化系统平台提供的开放性接口,将word进行对
象化,识别office.word中关键信息,通过正则、字符匹配的方式进行关键信息的索引,把office.word中的关键信息进行“加框”处理,将数据添加为office.word的内容控件(富文本内容控件、下拉框内容控件、多选框内容控件等等),同时将关键数据同信息化系统同步,做到了文档主要数据的结构化、条目化,结构化的数据存储到信息化系统(包含文件的内容、格式、ole对象等等),然后将结构化数据结果送到阶段(3);
46.(3)信息系统展示阶段:根据阶段(2)返回的结构化数据,数据将以文件流的方式传入到浏览器控件中,通过自定义的函数,解析阶段(2)的数据,将结构化的数据呈现在office.word中;浏览器控件解析调用自定义的office.word宏定义脚本,将结构化、条目化数据展示在前端展示层中。
47.本技术实施例所提供的方案中,通过将word文件所对应的文件数据进行数据化、条目化得到结构化条目化的数据,规避现阶段很多web端(网页端)的word编辑器诸多弊端,更好的支持各种软件(如math公式、visio图像)对象的无差别编辑,更是可以集成如mythtype等工具,将文档中重要的数据信息快速识别,条目化、控件化,实现有效对word文件数据结构化、条目化。
48.参见图4,本技术提供一种计算机设备,该计算机设备,包括:
49.存储器401,用于存储至少一个处理器所执行的指令;
50.处理器402,用于执行存储器中存储的指令执行图1所述的方法。
51.本技术提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行图1所述的方法。
52.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
53.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
54.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
55.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
56.显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精
神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献