技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种面向层级化分类体系的事件检测方法与流程  >  正文

一种面向层级化分类体系的事件检测方法与流程

  • 国知局
  • 2024-07-31 22:58:29

本发明涉及一种事件检测方法,一种面向层级化分类体系的事件检测方法。

背景技术:

1、事件检测是指从文本数据中识别表示事件发生的触发词,并将其分类为预定义的事件类型。事件检测是事件提取的重要组成部分。

2、事件类型的定义粒度有粗细之分。例如:“强降雨致局部地区出现山体滑坡”,触发词“山体滑坡”触发了“地质灾害”的事件类型,如果定义为更粗的类型,如“突发事件”也是成立的。前者是更为精确的类型,后者则是更为一般的类型。因此,事件类型构成了一个树状结构,顶部是更粗的类型,底部是更细的类型。如图2所示。

3、事件类型可能有不同粒度的定义,所以并不独立。事实上,事件间的上下位关系构成了一颗树状分类体系,同一层的事件有着同样的粒度,同一分支的事件有相似的语义。

4、之前的研究并没有考虑类型的分类体系,而是将事件检测作为一个类型间独立的多分类问题。由于没有充分利用事件类型间的层级关系,对于事件类型的语义把握不够准确,这样就导致在事件类型较多时(例如,cameo包含318个事件类型,参考:schrodt p a,yilmaz o,gerner d j,et al.the cameo(conflict and mediation eventobservations)actor coding framework[c]//2008annual meeting of theinternational studies association.2008),算法分类准确率很难保证。

技术实现思路

1、发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种面向层级化分类体系的事件检测方法。

2、为了解决上述技术问题,本发明公开了一种面向层级化分类体系的事件检测方法,包括以下步骤;

3、步骤1,对事件分类体系进行结构扩展,构建一个有向无环图,用于分类路径排序;

4、步骤2,构建事件检测神经网络,包括:上下文编码模块、事件类型编码模块、事件类型评分模块和事件类型预测模块,其中:

5、上下文编码模块,将输入语句进行编码,得到输入语句的编码表示;

6、事件类型编码模块,学习步骤1中扩展后的事件分类体系中的事件类型层次结构,得到事件类型的编码表示;

7、事件类型评分模块,计算每个事件类型与输入语句的相关性评分;

8、事件类型预测模块,根据相关性评分,在有向无环图上,选择最高评分的分类路径作为识别结果,即检测得到的事件类型;

9、步骤3,定义事件检测损失函数,并依据该损失函数训练并优化步骤2中构建的事件检测神经网络;其中,所述的事件检测损失函数为有向无环图的路径上每个事件类型的损失函数之和;

10、步骤4,使用训练好的事件检测神经网络,对待检测的文本数据,进行事件检测。

11、进一步的,步骤1中所述的对事件分类体系进行结构扩展,即在现有的事件分类体系中进行结构扩展,具体包括:

12、步骤1-1,增加root节点和none节点,其中,none节点代表没有任意预先定义的事件类型,将其设置在event节点的同一层,none节点是可预测的实际节点;root节点,为所有路径的最开始节点,是虚拟节点;

13、步骤1-2,增加停止节点,每层都增加一个公共停止节点,对于每个实际节点,都连接到其下一层的停止节点。

14、进一步的,步骤2中所述的上下文编码模块,将输入的句子中的每个词转化成一个连续的向量,具体包括:

15、设输入的句子为s=(w1,w2,…,wn),其中,wn表示句子中第n个词;将其输入至句子编码器即bert编码器中,获取每个词的编码h1,…,hn,表示如下:

16、h1,…,hn=sentencoder(w1,…,wn)

17、其中,sentencoder表示bert编码器编码,然后对每个词的编码,执行线性变换和非线性gelu变换,获取其上下文表示ci,表示如下:

18、ci=gelu(whi+b)

19、其中,hi表示第i个词的编码,whi+b表示对hi进行线性变化,w和b分别是要学习的权重矩阵和权重向量,gelu表示非线性gelu变换,ci表示第i个词的上下文表示即所述的编码表示。

20、进一步的,步骤2中所述的事件类型编码模块,使用rnn网络来捕获事件类型间的相似性关系,获取事件类型的编码表示,即对经过步骤1扩展后的事件分类体系中的每个类型学习一个事件类型的编码表示r,其中,表示在事件分类体系中第k层的第j个事件类型,sreal表示实际节点,svirtual表示虚拟节点。

21、进一步的,所述的获取事件类型的编码表示,具体方法包括:

22、通过bert编码器获取事件类型在事件分类体系中的分类路径中每个节点的类型编码,并顺序输入rnn网络,使用最后一步的隐含表示作为事件类型的编码表示表示如下:

23、

24、其中,表示在事件分类体系中第k层的第j个事件类型。

25、进一步的,步骤2中所述的事件类型评分模块,用于计算事件分类体系中的每个事件类型与原始的输入语句的相关性,具体包括:

26、将上下文编码模块中获取的词的编码表示c输入到一个2层的前馈神经网络,并通过tanh非线性变换,将其映射到与事件类型编码模块获取的事件类型的编码表示r相同的空间,具体如下:

27、

28、其中,ffnn表示前馈神经网络,表示经过上下文编码之后词的向量,·表示内积运算。

29、进一步的,步骤2中所述的事件类型预测模块,具体包括:

30、计算输入语句与事件分类体系中每层中的各个事件类型的相关性评分;

31、对于上述每个事件类型计算分类路径,即在层级化分类体系中,以该类型为起点,递归查找其父节点,直到根节点为止;

32、计算分类路径的评分,即将分类路径中每个节点的相关性评分相乘作为该分类路径的评分;

33、选择最高评分的分类路径作为预测结果。

34、进一步的,所述的事件类型预测模块中,计算输入语句与事件分类体系中每层中的各个类型的相关性评分,具体方法如下:

35、对于第k层的每个类型评分其中|t(k)|表示k层事件类型数量,使用softmax函数来进行评分归一化,具体如下:

36、

37、其中,表示归一化之后的结果,exp表示以e为底的指数函数。

38、进一步的,所述的事件类型预测模块中,计算分类路径的评分,具体如下:

39、

40、其中,表示分量分类路径为path的评分。

41、进一步的,步骤3中所述的定义事件检测损失函数,具体包括:

42、

43、其中,l为事件检测损失函数,表示分类路径上每个事件类型的损失函数之和,l(k)表示分类路径上第k层节点的损失。

44、有益效果:

45、本发明通过充分利用事件类型的分类体系,将建模事件检测问题建模为路径评分过程。路径是从顶部到事件类型的一条链,最高评分路径对应的事件类型就是预测结果。与现有将每个事件作为孤立节点的传统事件检测技术相比,显著优点是:由于充分利用了事件类型的上下位语义信息,在事件类型较多时(例如,cameo包含318个事件类型),算法分类的准确率更高。

本文地址:https://www.jishuxx.com/zhuanli/20240730/195548.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。