一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文档处理方法、装置及档案处理系统与流程

2022-06-01 11:13:26 来源:中国专利 TAG:

技术特征:
1.一种文档处理方法,包括:使用判断模型判断待处理文档是否属于特定类别;对判断为不属于特定类别的文档进行复核;若复核结果为所述文档属于特定类别,则基于所述文档对所述判断模型进行增量训练,以更新所述判断模型。2.根据权利要求1所述的方法,其中,所述使用判断模型判断待处理文档是否属于特定类别的步骤包括:将至少部分文档内容作为所述判断模型的输入,得到所述判断模型输出的用于表征所述输入是否属于特定类别的判断结果;以及若所述文档中存在被判定为特定类别的内容,则判定所述文档属于特定类别。3.根据权利要求2所述的方法,其中,将基于所述判断模型得到的用于表征所述输入属于特定类别概率的数值与预定阈值进行比较,若所述属于特定类别概率的数值大于或等于所述预定阈值,则判定所述输入属于特定类别,其中,所述预定阈值为取值空间内随时间递减的变量。4.根据权利要求2所述的方法,其中,在第一时间段,若基于所述判断模型得到的用于表征所述输入属于特定类别概率的数值超过第一阈值,则将所述输入判定为属于特定类别;以及在第二时间段,若基于所述判断模型得到的用于表征所述输入属于特定类别概率的数值超过第二阈值,则将所述输入判定为属于特定类别,其中,所述第一时间段位于所述第二时间段之前,所述第一阈值大于所述第二阈值。5.根据权利要求2所述的方法,还包括:将所述文档划分为多个文档内容,其中,将至少部分文档内容作为所述判断模型的输入的步骤包括:将所述多个文档内容分批次地输入所述判断模型。6.根据权利要求5所述的方法,其中,所述多个文档内容包括:所述文档的标题;以及所述文档中的语句。7.根据权利要求2所述的方法,其中,所述判断模型包括多个二分类模型,每个所述二分类模型对应一种特定类别,所述二分类模型用于判断输入是否属于与所述二分类模型对应的特定类别,将至少部分文档内容作为所述判断模型的输入的步骤包括:将至少部分文档内容分别输入所述多个二分类模型。8.根据权利要求2所述的方法,其中,所述判断模型包括一个或多个多分类模型,所述多分类模型对应多种特定类别,所述多分类模型用于获取输入在所述多种特定类别下的判断结果,将至少部分文档内容作为所述判断模型的输入的步骤包括:将将至少部分文档内容输入所述多分类模型。9.根据权利要求1所述的方法,还包括:通过迭代执行使用判断模型判断文档是否属于特定类别的步骤、对判定为不属于特定类别的文档进行复核的步骤、对所述判断模型进行增量训练的步骤,审核其他文档是否属于特定类别。10.根据权利要求9所述的方法,还包括:
在满足迭代终止条件的情况下,基于最终得到的判断模型审核文档是否属于特定类别;以及/或者在满足迭代终止条件的情况下,基于最终得到的判断模型对迭代终止之前基于所述判断模型判定为属于特定类型的文档进行复核,以识别其中被误判为属于特定类别的文档。11.根据权利要求10所述的方法,其中,所述迭代终止条件包括:迭代执行的次数超过第三阈值;和/或所述判断模型的准确率超过第四阈值。12.一种档案处理系统,包括:判断模块,用于使用判断模型判断待处理档案是否属于特定类别;发送模块,用于将判定为不属于特定类别的档案发送给一个或多个客户端,由所述客户端对接收到的档案进行复核;接收模块,用于接收所述客户端上传的复核结果;增量训练模块,用于若复核结果为所述档案属于特定类别,则基于所述档案对所述判断模型进行增量训练,以更新所述判断模型。13.一种文档处理装置,包括:判断模块,用于使用判断模型判断待处理文档是否属于特定类别;复核模块,用于对判定为不属于特定类别的文档进行复核;增量训练模块,用于若复核结果为所述文档特定类别,则基于所述文档,对所述判断模型进行增量训练,以更新所述判断模型。14.一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1至11中任何一项所述的方法。15.一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1至11中任何一项所述的方法。

技术总结
公开了一种文档处理方法、装置及档案处理系统。使用判断模型判断文档是否属于特定类别;对判定为不属于特定类别的文档进行复核;若复核结果为文档属于特定类别,则基于文档对判断模型进行增量训练,以更新判断模型。由此,在减少人工投入的同时,可以提高模型准确率。可以提高模型准确率。可以提高模型准确率。


技术研发人员:王雅芳 周芷慧
受保护的技术使用者:阿里巴巴集团控股有限公司
技术研发日:2020.11.26
技术公布日:2022/5/31
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献