技术新讯 > 计算推算,计数设备的制造及其应用技术 > 消息的过滤方法、装置、电子设备及存储介质与流程  >  正文

消息的过滤方法、装置、电子设备及存储介质与流程

  • 国知局
  • 2024-07-31 22:45:51

本技术涉及信息处理,尤其涉及一种消息的过滤方法、装置、电子设备及存储介质。

背景技术:

1、相关技术中,通常采用关键词过滤的方式对信息进行过滤,即对信息进行内容进行识别,确定是否包含预设的关键字词。但这种方法过滤的准确性较低。

技术实现思路

1、本技术旨在至少在一定程度上解决相关技术中的技术问题之一。

2、第一方面,本技术提出一种消息的过滤方法,包括:获取待处理消息;对所述待处理消息进行特征提取,获取所述待处理消息的消息特征;基于所述消息特征构建所述待处理消息对应的集成图;其中,所述集成图用于表征所述待处理消息中句子和词语之间的特征关系;基于所述消息特征和所述集成图,确定所述待处理消息的消息级别;基于所述集成图和所述消息级别,确定所述待处理消息的消息分类标签;基于所述待处理消息的消息分类标签,对所述待处理消息进行过滤。

3、在一种实现方式中,所述消息特征包括以下至少一项:所述待处理消息中所述句子之间的第一关联关系;所述待处理消息中不同所述词语之间的第二关联关系;所述待处理消息中所述词语的词性;所述待处理消息中所述词语的语义;所述待处理消息中的命名实体;所述待处理消息中的共指消解信息。

4、在一种可选地实现方式中,所述基于所述消息特征构建所述待处理消息对应的集成图,包括:基于所述第一关联关系,构建所述待处理消息对应的分层图;基于所述待处理消息中不同所述词语之间的第二关联关系,以及所述待处理消息中的所述词语的语义,构建所述待处理消息对应的知识图谱;将所述分层图和所述知识图谱进行融合,获取所述集成图。

5、可选地,所述基于所述第一关联关系,构建所述待处理消息对应的分层图,包括:基于所述待处理消息中的所述句子,生成所述待处理消息对应的第一节点;基于所述待处理消息中所述句子之间的第一关联关系,生成所述待处理消息对应的第一节点之间的边;基于所述待处理消息对应的第一节点和所述待处理消息对应的第一节点之间的边,构建所述待处理消息对应的一层图像;基于所述待处理消息对应的一层图像,获取所述分层图。

6、可选地,所述基于所述待处理消息中不同所述词语之间的第二关联关系,以及所述待处理消息中的所述词语的语义,构建所述待处理消息对应的知识图谱,包括:基于所述待处理消息中的所述词语,生成待处理消息对应的第二节点;基于所述待处理消息中的所述词语的语义和所述待处理消息中的词语的第二关联关系,生成待处理消息对应的第二节点之间的边;基于所述待处理消息对应的第二节点和所述待处理消息对应的第二节点之间的边,构建所述待处理消息对应的知识图谱。

7、在一种实现方式中,所述基于所述消息特征和所述集成图,确定所述待处理消息的消息级别,包括:基于所述消息特征,获取所述集成图中每个第三节点的文本特征向量;基于所述集成图,获取所述集成图中每个所述第三节点的聚合矩阵;基于每个所述第三节点的文本特征向量和每个所述第三节点的聚合矩阵,确定所述待处理消息的消息级别。

8、在一种可选地实现方式中,所述基于所述消息特征,获取所述集成图中每个第三节点的文本特征向量,包括:基于所述消息特征,获取所述集成图中每个所述第三节点的第一文本特征;获取所述集成图中每个所述第三节点的相邻节点;基于所述消息特征,获取所述集成图中每个所述第三节点的相邻节点的第二文本特征;将每个所述第三节点的第一文本特征和每个所述第三节点的相邻节点的第二文本特征进行拼接,获取每个所述第三节点对应的拼接文本特征;将每个所述第三节点对应的拼接文本特征输入预先训练的向量生成模型,获取每个所述第三节点的文本特征向量;其中,所述向量生成模型已经预先学习得到基于输入的特征值生成相应的特征向量的能力。

9、可选地,所述基于每个所述第三节点的文本特征向量和每个所述第三节点的聚合矩阵,确定所述待处理消息的消息级别,包括:获取所述集成图中每个所述第三节点的相邻节点;基于每个所述第三节点的相邻节点的文本特征向量,采用图学习的方式确定每个所述第三节点的聚合表示向量;基于每个所述第三节点的聚合表示向量,获取每个所述第三节点的注意力权重;基于每个所述第三节点的注意力权重和每个所述第三节点的聚合表示向量,获取每个第三节点的表示向量;基于每个所述第三节点的表示向量,确定所述待处理消息的消息级别。

10、可选地,所述获取所述集成图中每个所述第三节点的相邻节点,包括:获取每个所述第三节点与所述集成图中其他节点之间的距离值;获取所述其他节点中与所述第三节点之间的所述距离值小于或等于预设的距离阈值的目标节点,作为所述第三节点的相邻节点。

11、在一种实现方式中,所述基于所述集成图和所述消息级别,确定所述待处理消息的消息分类标签,包括:基于所述集成图获取所述待处理消息的消息向量;将所述待处理消息的消息向量和所述消息级别进行拼接,获取所述待处理消息对应的拼接向量;获取预设的候选分类标签;基于所述待处理消息对应的拼接向量和所述候选分类标签,确定所述待处理消息的消息分类标签。

12、在一种实现方式中,所述待处理消息为多个,所述基于所述待处理消息的消息分类标签,对所述待处理消息进行过滤,包括:基于所述待处理消息的消息分类标签对所述待处理消息进行分类,获取至少一个类别的分类待处理消息;基于所述分类待处理消息对应的所述消息分类标签,对所述分类待处理消息进行过滤。

13、第二方面,本技术提出一种消息的过滤装置,包括:获取模块,用于获取待处理消息;特征提取模块,用于对所述待处理消息进行特征提取,获取所述待处理消息的消息特征;第一处理模块,用于基于所述消息特征构建所述待处理消息对应的集成图;其中,所述集成图用于表征所述待处理消息中句子和词语之间的特征关系;第二处理模块,用于基于所述消息特征和所述集成图,确定所述待处理消息的消息级别;第三处理模块,用于基于所述集成图和所述消息级别,确定所述待处理消息的消息分类标签;过滤模块,用于基于所述待处理消息的消息分类标签,对所述待处理消息进行过滤。

14、在一种实现方式中,所述消息特征包括以下至少一项:所述待处理消息中所述句子之间的第一关联关系;所述待处理消息中不同所述词语之间的第二关联关系;所述待处理消息中所述词语的词性;所述待处理消息中所述词语的语义;所述待处理消息中的命名实体;所述待处理消息中的共指消解信息。

15、在一种可选地实现方式中,所述第一处理模块用于:基于所述第一关联关系,构建所述待处理消息对应的分层图;基于所述待处理消息中不同所述词语之间的第二关联关系,以及所述待处理消息中的所述词语的语义,构建所述待处理消息对应的知识图谱;将所述分层图和所述知识图谱进行融合,获取所述集成图。

16、可选地,所述第一处理模块具体用于:基于所述待处理消息中的所述句子,生成所述待处理消息对应的第一节点;基于所述待处理消息中所述句子之间的第一关联关系,生成所述待处理消息对应的第一节点之间的边;基于所述待处理消息对应的第一节点和所述待处理消息对应的第一节点之间的边,构建所述待处理消息对应的一层图像;基于所述待处理消息对应的一层图像,获取所述分层图。

17、可选地,所述第一处理模块具体用于:基于所述待处理消息中的所述词语,生成待处理消息对应的第二节点;基于所述待处理消息中的所述词语的语义和所述待处理消息中的词语的第二关联关系,生成待处理消息对应的第二节点之间的边;基于所述待处理消息对应的第二节点和所述待处理消息对应的第二节点之间的边,构建所述待处理消息对应的知识图谱。

18、在一种实现方式中,所述第二处理模块具体用于:基于所述消息特征,获取所述集成图中每个第三节点的文本特征向量;基于所述集成图,获取所述集成图中每个所述第三节点的聚合矩阵;基于每个所述第三节点的文本特征向量和每个所述第三节点的聚合矩阵,确定所述待处理消息的消息级别。

19、在一种可选地实现方式中,所述第二处理模块具体用于:基于所述消息特征,获取所述集成图中每个所述第三节点的第一文本特征;获取所述集成图中每个所述第三节点的相邻节点;基于所述消息特征,获取所述集成图中每个所述第三节点的相邻节点的第二文本特征;将每个所述第三节点的第一文本特征和每个所述第三节点的相邻节点的第二文本特征进行拼接,获取每个所述第三节点对应的拼接文本特征;将每个所述第三节点对应的拼接文本特征输入预先训练的向量生成模型,获取每个所述第三节点的文本特征向量;其中,所述向量生成模型已经预先学习得到基于输入的特征值生成相应的特征向量的能力。

20、可选地,所述第二处理模块具体用于:获取所述集成图中每个所述第三节点的相邻节点;基于每个所述第三节点的相邻节点的文本特征向量,采用图学习的方式确定每个所述第三节点的聚合表示向量;基于每个所述第三节点的聚合表示向量,获取每个所述第三节点的注意力权重;基于每个所述第三节点的注意力权重和每个所述第三节点的聚合表示向量,获取每个第三节点的表示向量;基于每个所述第三节点的表示向量,确定所述待处理消息的消息级别。

21、可选地,所述第二处理模块具体用于:获取每个所述第三节点与所述集成图中其他节点之间的距离值;获取所述其他节点中与所述第三节点之间的所述距离值小于或等于预设的距离阈值的目标节点,作为所述第三节点的相邻节点。

22、在一种实现方式中,所述第三处理模块具体用于:基于所述集成图获取所述待处理消息的消息向量;将所述待处理消息的消息向量和所述消息级别进行拼接,获取所述待处理消息对应的拼接向量;获取预设的候选分类标签;基于所述待处理消息对应的拼接向量和所述候选分类标签,确定所述待处理消息的消息分类标签。

23、在一种实现方式中,所述待处理消息为多个,所述过滤模块具体用于:基于所述待处理消息的消息分类标签对所述待处理消息进行分类,获取至少一个类别的分类待处理消息;基于所述分类待处理消息对应的所述消息分类标签,对所述分类待处理消息进行过滤。

24、第三方面,本技术提出一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的消息的过滤方法。

25、第四方面,本技术提出一种计算机可读存储介质,用于存储有指令,当所述指令被执行时,使如第一方面所述的方法被实现。

26、第五方面,本技术提出一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如第一方面所述的消息的过滤方法的步骤。

27、本技术提供的消息的过滤方法、装置、电子设备及存储介质,可以基于待处理消息的消息特征,构建集成图,以根据待处理消息的消息特征和集成图确定待处理消息的消息分类标签,从而基于待处理消息的消息分类标签对待处理消息进行过滤。能够提高对待处理消息进行过滤的准确率。

28、本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。

本文地址:https://www.jishuxx.com/zhuanli/20240730/194471.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。