技术新讯 > 计算推算,计数设备的制造及其应用技术 > 文本数据的处理方法及装置与流程  >  正文

文本数据的处理方法及装置与流程

  • 国知局
  • 2024-10-15 09:56:58

本公开涉及数据处理,尤其涉及文本数据的处理,具体涉及一种文本数据的处理方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

背景技术:

1、随着互联网业务与用户量的增长,基于在线的文档工具越来越普及。其中一些是企业内网的在线文档工具,还有一些是针对所有互联网用户的在线文档工具,比如有道笔记、印象笔记等。

2、在线文档在便利了人们的内容编辑与共享交流的同时,也暴露出来了一些问题,比如文档创作者可能会在共享文档中存放业务平台登录密码、访问凭证、在线支付密码等不宜出现的信息。这些信息的内容一旦存放到在线文档中,容易泄露,从而造成用户不必要的损失。

3、在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

1、本公开提供了一种文本数据的处理方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

2、根据本公开的一方面,提供了一种文本数据的处理方法,包括:对待处理文本进行关键词检索,以确定待处理文本是否包括预设的关键词集合中的关键词;响应于确定待处理文本包括关键词集合中的至少一个关键词,将待处理文本输入到文本分类模型中,根据文本分类模型的预测结果确定待处理文本是否为包含重要信息的文本;响应于确定待处理文本为包含重要信息的文本,至少根据待处理文本包括的关键词确定待处理文本的相关系数;以及根据相关系数对待处理文本中的至少部分字符进行隐藏处理。

3、根据本公开的另一方面,提供了一种文本数据的处理装置,包括:第一检索单元,配置成对待处理文本进行关键词检索,以确定待处理文本是否包括预设的关键词集合中的关键词;分类单元,配置成响应于确定待处理文本包括关键词集合中的至少一个关键词,将待处理文本输入到文本分类模型中,根据文本分类模型的预测结果确定待处理文本是否为包含重要信息的文本;确定单元,配置成响应于确定待处理文本为包含重要信息的文本,至少根据待处理文本包括的关键词确定待处理文本的相关系数;以及处理单元,配置成根据相关系数对待处理文本中的至少部分字符进行隐藏处理。

4、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的方法。

5、根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行根据上述的方法。

6、根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现上述的方法。

7、根据本公开的一个或多个实施例,不仅可以检测判断待处理文本是否为包含重要信息的文本,还可以根据检测结果对文本中的重要信息进行一定程度的安全保护处理,从而进一步确保了在线文本的安全性。

8、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征:

1.一种文本数据的处理方法,包括:

2.根据权利要求1所述的方法,其中,所述至少根据所述待处理文本包括的所述关键词确定所述待处理文本的相关系数包括:

3.根据权利要求2所述的方法,其中,所述根据所述待处理文本包括的所述关键词的数量以及所述文本分类模型针对所述待处理文本输出的置信度两者共同确定所述待处理文本的相关系数包括:

4.根据权利要求1-3中任一项所述的方法,其中,在所述将所述待处理文本进行文本分类,以确定所述待处理文本是否为包含重要信息的文本之前还包括:

5.根据权利要求4所述的方法,其中,所述预设类型的字符串包括以下至少一种:

6.根据权利要求5所述的方法,还包括:

7.根据权利要求4所述的方法,其中,所述根据所述相关系数对所述待处理文本中的至少部分字符进行隐藏处理包括:

8.一种文本数据的处理装置,包括:

9.根据权利要求8所述的装置,其中,所述确定单元还配置成:

10.根据权利要求9所述的装置,其中,所述确定单元还包括:

11.根据权利要求8-10中任一项所述的装置,还包括:

12.根据权利要求11所述的装置,还包括:

13.根据权利要求11所述的装置,其中,所述处理单元还配置成:

14.一种电子设备,包括:

15.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

16.一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现权利要求1-7中任一项所述的方法。

技术总结本公开提供了一种文本数据的处理方法及装置,涉及数据处理技术领域,尤其涉及文本数据的处理。实现方案为:对待处理文本进行关键词检索,以确定所述待处理文本是否包括预设的关键词集合中的关键词;响应于确定所述待处理文本包括所述关键词集合中的至少一个关键词,将所述待处理文本输入到文本分类模型中,根据所述文本分类模型的预测结果确定所述待处理文本是否为包含重要信息的文本;响应于确定所述待处理文本为包含重要信息的文本,至少根据所述待处理文本包括的所述关键词确定所述待处理文本的相关系数;以及根据所述相关系数对所述待处理文本中的至少部分字符进行隐藏处理。技术研发人员:于强受保护的技术使用者:北京百度网讯科技有限公司技术研发日:技术公布日:2024/10/10

本文地址:https://www.jishuxx.com/zhuanli/20241015/315838.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。