文档处理方法、装置及档案处理系统与流程

2022-06-01 11:13:26 来源：中国专利 TAG：

1.本公开涉及数据处理技术领域，特别是涉及一种文档处理方法、装置及档案处理系统。

背景技术：

2.在互联网时代，信息传播的方式、速度、广度都得到了质的提升。出于树立正确价值观、保密等原因，需要审核信息是否属于涉密、涉暴、涉欺诈等特定类别，根据信息的类别审核结果，执行相应处理。
3.举例来说，档案馆是收集、保管档案的机构，负责接收、征集、管理档案和开展档案利用等。多年来，全国各类档案馆大力开发档案信息资源，为社会各方面提供档案服务。有数据表明，档案馆通过积极向社会开放档案，平均每年接待利用档案资料者1300万人次，利用档案资料3600万卷(件、册)次。此外，还通过举办展览、参加有关活动等提供档案利用。
4.档案开放前需要对档案是否涉密进行鉴定。目前主要采用人工审核的方式判断档案是否涉密，如此会消耗大量人力，且人工审核也会存在档案泄露的风险。
5.因此，需要一种能够减少人力投入的文档处理方案。

技术实现要素：

6.本公开的目的在于提供一种能够减少人力投入的文档处理方案。
7.根据本公开的第一个方面，提供了一种文档处理方法，包括：使用判断模型判断待处理文档是否属于特定类别；对判定为不属于特定类别的文档进行复核；若复核结果为文档属于特定类别，则基于文档对判断模型进行增量训练，以更新判断模型。
8.根据本公开的第二个方面，提供了一种档案审核系统，包括：判断模块，用于使用判断模型判断待处理档案是否属于特定类别；发送模块，用于将判定为不属于特定类别的档案发送给一个或多个客户端，由客户端对接收到的档案进行复核；接收模块，用于接收客户端上传的复核结果；增量训练模块，用于若复核结果为档案属于特定类别，则基于档案对判断模型进行增量训练，以更新判断模型。
9.根据本公开的第三个方面，提供了一种文档审核装置，包括：判断模块，用于使用判断模型判断待处理文档是否属于特定类别；复核模块，用于对判定为不属于特定类别的文档进行复核；增量训练模块，用于若复核结果为文档属于特定类别，则基于文档对判断模型进行增量训练，以更新判断模型。
10.根据本公开的第四个方面，提供了一种计算设备，包括：处理器；以及存储器，其上存储有可执行代码，当可执行代码被处理器执行时，使处理器执行如上述第一方面所述的方法。
11.根据本公开的第五个方面，提供了一种非暂时性机器可读存储介质，其上存储有可执行代码，当可执行代码被电子设备的处理器执行时，使处理器执行如上述第一方面所述的方法。
12.由此，本公开通过借助判断模型判断待处理文档是否属于特定类别，可以减少人工投入，并且通过对基于判断模型判定为不属于特定类别的文档进行复检，不仅可以识别误判为不属于特定类别的文档，还可以基于识别为误判的文档对判断模型进行增量训练，以提高模型准确率。
附图说明
13.通过结合附图对本公开示例性实施方式进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显，其中，在本公开示例性实施方式中，相同的参考标号通常代表相同部件。
14.图1示出了根据本公开一个实施例的文档处理方法的示意性流程图。
15.图2示出了根据本公开一个实施例的对档案库中档案是否涉密进行审核的示意性流程图。
16.图3示出了对档案库中档案是否涉密进行判断的示意性流程图。
17.图4示出了根据本公开一个实施例的判断模型的结构示意图。
18.图5示出了图4所示判断模型的一种具体结构示意图。
19.图6示出了根据本公开一个实施例性的档案处理系统的结构框图。
20.图7示出了根据本公开一个实施例性的文档处理装置的结构框图。
21.图8示出了根据本公开一个实施例的计算设备的结构示意图。
具体实施方式
22.下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式，然而应该理解，可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。
23.图1示出了根据本公开一个实施例的文档处理方法的示意性流程图。图1所示的方法可部分或完全通过计算机程序以软件方式实现，还可通过特定配置的计算装置来执行图1所示的方法。
24.参见图1，在步骤s110，使用判断模型判断待处理文档是否属于特定类别。
25.文档可以是任何记录有文字信息的文本。例如，文档可以包括但不限于档案馆收集、保存的档案；互联网中基于自然语言的文本信息；以及通过对图片、音频、视频等多媒体资源进行语义识别得到的文本识别结果。
26.判断模型可以通过对输入进行处理，得到用于表征输入是否属于特定类别的输出，即判断模型的输出为用于表征输入是否属于特定类别的判断结果。例如，判断模型的输出可以是用于表征输入的属于特定类别概率的数值。
27.本公开述及的特定类别可以是用于指示文档是否适于公开的类别，如可以包括但不限于涉密、涉暴、涉欺诈等类别。
28.可以将至少部分文档内容作为判断模型的输入，以得到判断模型输出的用于表征输入是否属于特定类别的判断结果。若文档中存在被判定为属于特定类别的内容，则可以判定文档属于特定类别。
29.作为示例，可以将文档划分为多个文档内容(如可以对文档进行逐句划分，得到多个句子)，将这多个文档内容分批次(如逐个)输入判断模型，以得到判断模型针对各个文档内容输出的是否属于特定类别的判断结果。
30.对文档进行划分得到的多个文档内容可以包括文档的标题以及文档中的语句。文档中的语句可以是文档正文部分包括的所有句子，由此可以通过对文档进行逐句判断的方式审核文档是否属于特定类别。
31.在步骤s120，对判定为不属于特定类别的文档进行复核。
32.步骤s110的文档是否属于特定类别的判断是基于判断模型实现的。因此，判断模型的准确性将会影响步骤s110的文档是否属于特定类别的判定结果。
33.以特定类别为涉密、涉暴、涉欺诈等不适于公开的类别为例，对于判定为不属于特定类别的文档，如果不对其进行复核，可能会因判断模型的误判导致不好的后果。例如，在本公开用于对文档是否涉密进行判断时，如果因判断模型将原本涉密的文档判定为不涉密，那么如果不对其进行复核，则会因公开该文档而导致文档中涉密内容的泄密。
34.因此，可以对步骤s110的判定为不属于特定类别的文档进行复核。其中，可以使用人工审核的方式对判定为不属于特定类别的文档进行复核。例如，可以将判定为不属于特定类别的文档发送给复核人员使用的客户端，由复核人员通过客户端对判定为不属于特定类别的文档进行复核。
35.以特定类别为涉密、涉暴、涉欺诈等不适于公开的类别为例，对于经步骤s110被判定为属于特定类别的文档可以不对其进行复核，以减少工作量。这是因为，经步骤s110被判定为属于特定类别的文档可以限制其公开，如此可以从根本上杜绝因误判导致不适于公开内容被公开的可能，从而也无需对判定为属于特定类别的文档进行复核。
36.换言之，即使由于判断模型的误判使得原本不属于特定类别的文档被判定为属于特定类别的文档，进而使得该文档不被公开，也不会造成不良影响。因此，为了减少人工投入，本公开可以不再考虑(特别是在前期不再考虑)被误判为属于特定类别的文档，即对于被判定为属于特定类别的文档，可以不对其进行复核。
37.若复核结果为文档不属于特定类别，则可以公开该文档。
38.在步骤s130，若复核结果为文档属于特定类别，则可以基于文档，对判断模型进行增量训练，以更新判断模型。
39.例如，可以以文档中的属于特定类别的内容(该内容可以在复核阶段确认)为训练样本，以用于指示训练样本属于特定类别的结果数据(如具体所属的类别)为样本标签，对判断模型进行增量训练。
40.在对判断模型进行增量训练后，可以更新判断模型，并使用更新后的判断模型执行图1所示流程，以审核其他文档是否属于特定类别。
41.由此，整个方案是一个基于模型的自动化审核与人工复核的智能闭环，通过迭代执行图1所示流程，可以不断提高判断模型的准确率。
42.即可以通过迭代执行使用判断模型判断文档是否属于特定类别的步骤(步骤s110)、对判定为不属于特定类别的文档进行复核的步骤(步骤s120)、对判断模型进行增量训练的步骤(步骤s130)，审核其他文档是否属于特定类别。
43.迭代终止条件可以是迭代执行次数超过一定阈值(为了便于区分，可以称为第三
阈值)，或者是通过增量训练得到的判断模型的准确率超过一定阈值(为了便于区分，可以称为第四阈值)。
44.满足迭代终止条件下的判断模型可以视为一个可信赖模型，因此在满足迭代终止条件时可以去除方案中的复核步骤及增量训练步骤(即步骤s120、步骤s130)，此时方案将衍变为一个自动化审核过程。
45.即，在满足迭代终止条件的情况下，可以基于最终得到的判断模型审核文档是否属于特定类别。此时对于判定为不属于特定类别的文档可以直接将其公开，而无需再对其进行复核，对于判定为属于特定类别的文档则可以限制其公开。
46.在本公开中，判断模型为一个准确率不断提升的模型。满足迭代终止条件下的判断模型可以视为一个可信赖模型。而在此之前，使用判断模型判定为属于特定类别的文档中可能存在误判的文档。
47.以判断模型用于判断文档是否涉密为例，误判为涉密的文档不会公开，但这对受众来说是一种损失。因此在满足迭代终止条件时，可以基于最终得到的判断模型对迭代终止之前基于判断模型判定为属于特定类别的文档进行复核，以识别其中误判为属于特定类别的文档。此处述及的复核流程，也即使用最终得到的判断模型判断迭代终止之前使用判断模型被判定为属于特定类别的文档是否属于特定类别。若判定结果为文档不属于特定类别，则可以认为该文档为误判文档。对于识别出的误判文档，可以将其公开。
48.图2示出了根据本公开一个实施例的对档案库中档案是否涉密进行审核的示意性流程图。图2所示流程可以包括判断模型的学习(即增量训练)阶段和学习完毕的自动化审核阶段。
49.1、判断模型的学习阶段
50.学习阶段主要包括迭代执行步骤s1、步骤s3、步骤s4以及步骤s5，每轮次的执行流程与图1所示流程相对应。
51.在步骤s1，利用判断模型对档案库中待处理档案是否涉密进行判断。
52.图3示出了对档案库中档案是否涉密进行判断的示意性流程图。
53.如图3所示，档案库中档案可以包括但不限于涉密文件、上级文件、会议纪要、纪检监察司法、干部人事、特殊运动、统计报表、基建材料、自然资源材料、信访材料、提案纪要等多种类型的档案，具体可以包括但不限于涉外统战、国家安全等材料、省外责任者材料、重要领导人讲话、文稿、工作总结、汇报、印章、证章、部门票证、明确不能开放的档案、密码电报和暗记印模、区域边界纠纷材料、各类介绍存根、便笺、手书、底稿、草稿、会计档案等。
54.对于上述诸多档案，可以通过判断模型对档案进行标题粒度、句子粒度的涉密判断，并对涉密内容打上相应的标签(即涉密类别)，涉密类别也可以称为涉密规则，可以包括但不限于标题密字、干部履历、非直接责任单位、涉及负面运动等等。
55.即，可以对整个档案(文档)从标题开始，逐句给出涉密判断结果。涉密判断结果可以是包括是否涉密以及涉密类型的分类结果，如此涉密判断结果可以作为依据，供复审人快速定位到问题源头。
56.关于利用判断模型对档案库中档案是否涉密进行判断的具体实现过程，可以参考上文针对图1中步骤s110的相关描述，此处不再赘述。
57.在步骤s3、步骤s4，对于利用判断模型判定为不涉密的档案，可以通过人工复核的
方式来进一步确定该档案是否涉密。
58.在步骤s5，如果复核结果为档案涉密，则可以基于该档案中的涉密内容及涉密类型对判断模型进行增量训练，以提高模型准确率。关于复核及增量训练的相关细节可以参见上文相关描述，此处不再赘述。
59.通过迭代执行上述步骤s1、步骤s3、步骤s4以及步骤s5，可以在对档案库中档案是否涉密进行审核的过程中，不断完善判断模型。
60.即，判断模型的训练和档案审核可以同步进行。
61.2、学习完毕后的自动化审核阶段
62.通过不断学习，可以提高判断模型的准确率。在判断模型的准确率足够高的情况下，可以认为判断模型可信。此时可以利用判断模型实现对档案是否涉密的自动审核，即自动审核流程不再包括人工复核和模型学习步骤。
63.学习完毕后的自动化审核阶段主要包括步骤s1、步骤s2、步骤s3。可选地，还可以包括步骤s6。步骤s1、步骤s2、步骤s3为利用学习完毕后的判断模型对档案库中其他未审核档案进行审核的过程，其中对于审核结果为不涉密的档案可以直接公开。步骤s6为利用学习完毕后的判断模型对学习阶段基于判断模型判定为涉密的档案进行复核的流程。
64.根据图2可知，本公开可以实现为一个基于模型的自动化审核与人工复核的智能闭环，通过不断迭代执行，在审核文档的同时，可以不断提高判断模型的准确率。并且在模型准确率得到保证的情况下，方案可以衍变为脱离了人工复核的自动化审核方案。
65.考虑到判断模型是一个准确率不断提升的模型，且初始阶段判断模型的准确率可能较低。本公开提出，在基于判断模型判断文档是否属于特定类别时，可以在初始阶段将判断模型的预定阈值设置为一个较高值，即只有判断模型能够非常明确地将输入识别为属于特定类别时才将输入判定为属于特定类别。如此初始阶段需要复核的文档将会比较多，而这会起到对判断模型的更新速度进行正向激励的作用，使判断模型的准确率能够得到较快的提升。
66.随着经复核纠正的文档数量越来越多，判断模型的准确率会越来越高，因此可以逐渐放宽(即降低)预定阈值。
67.判断模型输出的用于表征输入是否属于特定类别的判断结果通常是一个用于表征输入的属于特定类别概率的数值(即概率值)，该数值用于表征输入属于特定类别的概率大小。
68.可以将预定阈值作为评判判断模型的输入是否属于特定类别的标准。即，可以将基于判断模型得到的用于表征输入的属于特定类别概率的数值与预定阈值进行比较，若数值大于或等于预定阈值，则可以判定输入属于特定类别，反之可以判定输入不属于特定类别。其中，预定阈值可以是取值空间内随时间递减的变量。取值空间可以是约定的一个合理的取值范围，如0.7～0.99。预定阈值在取值空间内随时间递减，可以是指预定阈值随时间(或迭代次数)有规律或无规律地减小。例如，预定阈值的大小可以与时间负相关，即，时间越往后预定阈值的大小可以越小。关于预定阈值与时间参数的具体关系表达式，本公开不做限定。
69.作为示例，预定阈值可以包括第一阈值和第二阈值，第一阈值大于第二阈值。在第一时间段，若基于判断模型得到的用于表征输入的属于特定类别概率的数值超过第一阈
值，则将输入判定为属于特定类别；以及在第二时间段，若基于判断模型得到的用于表征输入的属于特定类别概率的数值超过第二阈值，则将输入判定为属于特定类别，其中，第一时间段位于第二时间段之前。
70.如上文所述，特定类别可以包括涉密、涉暴、涉欺诈等多种类别，而涉密具体又可以包括多种不适于公开的类型或原因，如标题密字、干部履历、非直接责任单位、涉及负面运动等特定类型。为了使相关人员(如复核人员、文档管理人员)能够快速定位到问题源头，判断模型可以是能够对多种特定类别进行识别的模型。
71.具体地，判断模型可以是一个能够识别多种特定类别的多分类模型，也可以是多个二分类模型。即，判断模型可以包括多个二分类模型，也可以包括一个或多个多分类模型。
72.以判断模型包括多个二分类模型为例，每个二分类模型可以对应一种特定类别，二分类模型用于判断输入是否属于与该二分类模型对应的特定类别，由此在使用判断模型判断文档是否属于特定类别时，可以将至少部分文档内容分别输入多个二分类模型，以得到至少部分文档内容在不同特定类别下的判断结果。其中，二分类模型可以输出输入属于该二分类模型对应的特定类别的概率。
73.以判断模型包括一个或多个多分类模型为例，多分类模型可以对应多种特定类别，多分类模型用于获取输入在多种特定类别下的判断结果。在使用判断模型判断文档是否属于特定类别时，可以将至少部分文档内容作为多分类模型的输入，以得到多分类模型输出的至少部分文档内容在多种特定类别下的判断结果。其中，多分类模型可以输出输入分别在多种特定类别下的概率。
74.判断模型可以是基于机器学习技术训练得到的文本分类模型。关于判断模型的结构本公开不做限定。例如，判断模型可以是基于转换器的双向编码表征模型(bert)、基于卷积神经网络的文本分类模型(textcnn)、长短期记忆网络模型(lstm)、词向量与文本分类模型(fasttext)、或者基于多个文本分类模型的集合模型等。
75.图4示出了根据本公开一个实施例的判断模型的结构示意图。
76.如图4所示，以判断模型为基于多个模型的集合模型为例，判断模型可以包括向量化组件、多个模型组件、结合策略组件以及输出组件。其中，模型组件可以是但不限于文本分类模型。
77.向量化组件用于将输入的文档内容(如标题、语句)转化为向量化表示。向量化组件可以是但不限于词向量组件，词向量组件用于将输入的文本中的字词转化为词向量。
78.每个模型组件可以视为一个学习器。多个模型组件可以是多个不同结构的模型，如可以包括但不限于cnn、dnn、lstm。向量化组件的输出(输入的向量化表示)可以分别作为多个模型组件的输入，由模型组件对输入的向量化表示进行处理。
79.结合策略组件可以基于特定的结合策略(如平均法、投票法、stacking)将多个模型组件的输出结合起来。结合策略组件的输出为输出组件的输入。输出组件可以用于输出输入所属特定类别的判断结果。其中，判断结果可以是用于表征输入的内容在一个或多个特定类别下的概率。
80.图5示出了图4所示判断模型的一种具体结构示意图。
81.如图5所示，向量化组件可以是指词向量层。多个模型组件可以包括长短期记忆网
络(lstm)、深度神经网络(dnn)以及卷及神经网络(cnn)。结合策略组件可以包括连接层(concat)和丢弃层(dropout)。输出组件可以是一个分类器。其中，lstm、dnn、cnn的输出分别与全连接层连接，dnn可以包括池化层(average)、激活函数(relu)。
82.至此，结合图1至图5就本公开的文档处理方法的实现流程做了详细说明。以应用于档案审核为例，本公开还可以实现为一种档案处理系统。档案处理系统可以应用于档案馆智能化项目中，如可以实现为一种能够对档案进行智能筛选的档案智能筛选机器人。
83.图6示出了根据本公开示例性实施例的档案处理系统的结构框图。其中，档案处理系统的功能单元可以由实现本公开原理的硬件、软件或硬件和软件的结合来实现。本领域技术人员可以理解的是，图6所描述的功能单元可以组合起来或者划分成子单元，从而实现上述发明的原理。因此，本文的描述可以支持对本文描述的功能单元的任何可能的组合、或者划分、或者更进一步的限定。
84.下面就档案处理系统可以具有的功能单元以及各功能单元可以执行的操作做简要说明，对于其中涉及的细节部分可以参见上文相关描述，这里不再赘述。
85.参见图6，档案处理系统600包括判断模块610、发送模块620、接收模块630以及增量训练模块640。
86.判断模块610用于使用判断模型判断待处理档案是否属于特定类别。发送模块620用于将判定为不属于特定类别的档案发送给一个或多个客户端，由客户端对接收到的档案进行复核。接收模块630用于接收客户端上传的复核结果。若复核结果为档案属于特定类别，则增量训练模块640可以基于档案对判断模型进行增量训练，以更新判断模型。
87.判断模块610可以将至少部分档案内容作为判断模型的输入，得到判断模型输出的用于表征输入是否属于特定类别的判断结果；若档案中存在被判定为属于特定类别的内容，则判定档案属于特定类别。
88.判断模块610可以将基于判断模型得到的用于表征输入的属于特定类别概率的数值与预定阈值进行比较，若数值大于或等于预定阈值，则判定输入属于特定类别，其中，预定阈值为取值空间内随时间递减的变量。
89.作为示例，在第一时间段，若基于判断模型得到的用于表征输入的属于特定类别概率的数值超过第一阈值，则判断模块610将输入判定为属于特定类别；以及在第二时间段，若基于判断模型得到的用于表征输入的属于特定类别概率的数值超过第二阈值，则判断模块610将输入判定为属于特定类别，其中，第一时间段位于第二时间段之前，第一阈值大于第二阈值。
90.判断模块610、发送模块620、接收模块630以及增量训练模块640可以通过迭代执行使用判断模型判断待处理档案是否属于特定类别的操作、对判定为不属于特定类别的档案进行复核的操作、对判断模型进行增量训练的操作，审核其他档案是否属于特定类别。
91.在满足迭代终止条件的情况下，判断模块610可以基于最终得到的判断模型审核文档是否属于特定类别；以及/或者在满足迭代终止条件的情况下，判断模块610可以基于最终得到的判断模型对迭代终止之前基于判断模型判定为属于特定类别的档案进行复核，以识别其中被误判为属于特定类别的档案。
92.本公开的文档处理方法还可以实现为一种文档处理装置。图7示出了根据本公开示例性实施例的文档处理装置的结构框图。其中，文档处理装置的功能单元可以由实现本
公开原理的硬件、软件或硬件和软件的结合来实现。本领域技术人员可以理解的是，图7所描述的功能单元可以组合起来或者划分成子单元，从而实现上述发明的原理。因此，本文的描述可以支持对本文描述的功能单元的任何可能的组合、或者划分、或者更进一步的限定。
93.下面就文档处理装置可以具有的功能单元以及各功能单元可以执行的操作做简要说明，对于其中涉及的细节部分可以参见上文相关描述，这里不再赘述。
94.参见图7，文档处理装置700包括判断模块710、复核模块720以及增量训练模块730。
95.判断模块710用于使用判断模型判断文档是否属于特定类别。复核模块720用于对判定为不属于特定类别的文档进行复核。增量训练模块730用于若复核结果为文档属于特定类别，则基于文档对判断模型进行增量训练，以更新判断模型。
96.判断模块710可以将至少部分文档内容作为判断模型的输入，得到判断模型输出的用于表征输入是否属于特定类别的判断结果；若文档中存在被判定为属于特定类别的内容，则判定文档属于特定类别。
97.判断模块710可以将基于判断模型得到的用于表征输入的属于特定类别概率的数值与预定阈值进行比较，若数值大于或等于预定阈值，则判定输入属于特定类别，其中，预定阈值为取值空间内随时间递减的变量。
98.作为示例，在第一时间段，若基于判断模型得到的用于表征输入的属于特定类别概率的数值超过第一阈值，则判断模块710将输入判定为属于特定类别；以及在第二时间段，若基于判断模型得到的用于表征输入的属于特定类别概率的数值超过第二阈值，则判断模块710将输入判定为属于特定类别，其中，第一时间段位于第二时间段之前，第一阈值大于第二阈值。
99.文档处理装置700还可以包括划分模块，用于将文档划分为多个文档内容，其中判断模块710可以将多个文档内容分批次地输入判断模型，以得到判断模型针对文档内容输出的特定类别判断结果。
100.文档处理装置700还可以包括公开模块，用于若复核结果为文档不属于特定类别，则公开文档。
101.判断模块710、复核模块720以及增量训练模块730可以通过迭代执行使用判断模型判断文档是否属于特定类别的操作、对判定为不属于特定类别的文档进行复核的操作、对判断模型进行增量训练的操作，审核其他文档是否属于特定类别。
102.在满足迭代终止条件的情况下，可以基于最终得到的判断模型审核文档是否属于特定类别；以及/或者在满足迭代终止条件的情况下，还可以基于最终得到的判断模型对迭代终止之前基于判断模型判定为属于特定类别的文档进行复核，以识别其中被误判为属于特定类别的文档。
103.图8示出了根据本公开一实施例可用于实现上述文档处理方法的计算设备的结构示意图。
104.参见图8，计算设备800包括存储器810和处理器820。
105.处理器820可以是一个多核的处理器，也可以包含多个处理器。在一些实施例中，处理器820可以包含一个通用的主处理器以及一个或多个特殊的协处理器，例如图形处理器(gpu)、数字信号处理器(dsp)等等。在一些实施例中，处理器820可以使用定制的电路实
现，例如特定用途集成电路(asic，application specific integrated circuit)或者现场可编程逻辑门阵列(fpga，field programmable gate arrays)。
106.存储器810可以包括各种类型的存储单元，例如系统内存、只读存储器(rom)，和永久存储装置。其中，rom可以存储处理器820或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中，永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中，永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备，例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外，存储器810可以包括任意计算机可读存储媒介的组合，包括各种类型的半导体存储芯片(dram，sram，sdram，闪存，可编程只读存储器)，磁盘和/或光盘也可以采用。在一些实施方式中，存储器810可以包括可读和/或写的可移除的存储设备，例如激光唱片(cd)、只读数字多功能光盘(例如dvd-rom，双层dvd-rom)、只读蓝光光盘、超密度光盘、闪存卡(例如sd卡、min sd卡、micro-sd卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
107.存储器810上存储有可执行代码，当可执行代码被处理器820处理时，可以使处理器820执行上文述及的文档处理方法或信息审核方法。
108.上文中已经参考附图详细描述了根据本发明的文档处理方法及装置、档案处理系统及计算设备。
109.此外，根据本发明的方法还可以实现为一种计算机程序或计算机程序产品，该计算机程序或计算机程序产品包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。
110.或者，本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质)，其上存储有可执行代码(或计算机程序、或计算机指令代码)，当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时，使所述处理器执行根据本发明的上述方法的各个步骤。
111.本领域技术人员还将明白的是，结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
112.附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
113.以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨
在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种命令风险评定方法及相关设备与流程

文档处理方法、装置及档案处理系统与流程

相关文献

最热文献