一种基于时空图神经网络的半导体晶圆制造异常检测方法及装置
- 国知局
- 2024-08-05 11:58:30
本发明涉及机器学习领域,特别是涉及一种基于时空图神经网络的半导体晶圆制造异常检测方法及装置。
背景技术:
1、早期的时间序列异常检测方法主要采用基于无监督统计学习和机器学习,如arima/var,但这些方法在处理复杂且非线性的多维时间序列数据时存在一定的局限性。随着深度学习的发展,时间序列异常检测也得到重大发展,park等人提出了一种结合变分自编码器(variational autoencoder,vae)和长短期记忆网络(long short-term memory,lstm)的多维时间序列异常检测模型。该模型利用lstm作为vae架构中的推断网络和生成网络,以捕捉时间相关性。su等人提出的omnianomaly模型是一种随机递归神经网络,它结合了门控循环单元(gated recurrent unit,gru)和变分自动编码器(vae),通过利用gru捕获多元时间序列的时间依赖性,并通过随机变量连接对潜在空间中的随机变量进行建模,以增强多元时间序列异常事件的检测能力。audibert等人提出的usad模型包含一个编码器和两个解码器,通过两阶段的对抗训练框架来增大异常输入的重构误差,以提高了模型对异常样本的识别能力。虽然提出的深度学习框架能有效地处理高维多元时间序列数据,但它只考虑了数据在时间维度上的依赖性,而忽略了空间维度上的依赖关系。这种偏向可能削弱了其检测异常事件的能力。
2、近年来,由于图神经网络的快速发展,极大程度解决了复杂时空数据建模的问题,并将其应用于多元时间序列异常检测任务。deng等人提出了基于图注意力网络的异常检测模型gdn,通过学习不同变量之间的相关性,然后使用基于图注意力网络的方法预测未来的值,根据预测值与真实值偏差确定异常。zhao等人提出的mtad-gat模型采用两个并行的图注意力层,以此来获取相应空间和时间的依赖关系,然后联合优化了基于预测的模型和基于重建的模型,通过单时间戳预测和整个时间序列的重构相结合,从而得到更好的时间表示,最后得出异常。这些方法只捕获了每个变量直接邻居的空间依赖性,可能会导致丢失来自多跳邻居的重要信息,并且没有对每个单变量时间关系进行建模,可能无法充分捕获时间序列数据的动态变化,从而影响其性能。
3、因此,上述时间序列异常检测方法应用到半导体晶圆制造异常检测中,性能不足,精准度不够。
技术实现思路
1、有鉴于现有技术的上述的一部分缺陷,本发明所要解决的技术问题是提供一种基于时空图神经网络的半导体晶圆制造异常检测方法及装置,旨在提高半导体晶圆制造异常检测的精准度。
2、为实现上述目的,本发明第一方面公开了一种基于时空图神经网络的半导体晶圆制造异常检测方法,所述方法包括:
3、步骤s1、获得第一晶圆制造训练数据集及对应的第一迭代次数,对所述第一晶圆制造训练数据集分别进行移动窗口输入处理和节点嵌入输入处理,获得对应的晶圆制造移动窗口数据集和晶圆制造节点嵌入数据集;
4、步骤s2、将所述晶圆制造移动窗口数据集和晶圆制造节点嵌入数据集输入时间卷积神经网络进行训练并进行所述第一迭代次数的迭代,获得所述晶圆制造移动窗口数据集和晶圆制造节点嵌入数据集中各个变量节点对应的时间特征;
5、步骤s3、根据所述晶圆制造节点嵌入数据集中的所述变量节点的依赖关系,构建静态图,计算获得所述静态图对应的静态矩阵;
6、步骤s4、根据所述时间特征、所述晶圆制造移动窗口数据集以及晶圆制造节点嵌入数据集,采用注意力机制进行权重分配,计算获得动态图对应的初始动态权重矩阵;根据初始动态权重矩阵,采用注意力扩散机制,计算获得多跳动态权重矩阵;
7、步骤s5、根据所述静态矩阵和所述多跳动态权重矩阵,分别获得对应的静态特征和动态特征;将所述静态特征和所述动态特征输入多层感知机进行训练,获得用于预测当前时刻数据对应下一时刻数据的第一训练模型;
8、步骤s6、将第一晶圆制造测试数据集输入所述第一训练模型,获得所述第一晶圆制造测试数据集对应下一时刻的预测数据集;
9、步骤s7、根据所述第一晶圆制造测试数据集的下一时刻真实数据集和所述预测数据集,进行计算获得异常分数;
10、步骤s8、判断所述异常分数是否大于预设阈值,若是,则输出所述第一晶圆制造测试数据集的下一时刻为异常时刻;若否,则输出所述第一晶圆制造测试数据集的下一时刻为正常时刻。
11、可选的,所述步骤s1中对所述第一晶圆制造训练数据集进行移动窗口输入处理,获得对应的晶圆制造移动窗口数据集,包括:
12、根据训练需求,确定所述第一晶圆制造训练数据集对应的窗口大小和窗口间步长;
13、根据所述窗口大小和所述窗口间步长,对所述第一晶圆制造训练数据集进行数据处理和划分,获得所述晶圆制造移动窗口数据集。
14、可选的,所述步骤s1中对所述第一晶圆制造训练数据集进行节点嵌入输入处理,获得对应的晶圆制造节点嵌入数据集,包括:
15、将所述第一晶圆制造训练数据集中的数据进行节点嵌入处理,以使所述第一晶圆制造训练数据集中的数据向低维向量转化,获得所述晶圆制造节点嵌入数据集。
16、可选的,所述步骤s3包括:
17、采用所述晶圆制造节点嵌入数据集中各个所述变量节点之间的两两依赖关系构建所述静态图,设置学习层自适应学习获得所述静态图对应的静态矩阵。
18、可选的,所述步骤s5中,将所述静态特征和所述动态特征输入多层感知机进行训练,获得用于预测当前时刻数据对应下一时刻数据的第一训练模型,包括:
19、通过门控融合机制将所述静态特征和所述动态特征进行融合,获得最终特征;
20、将所述最终特征输入多层感知机进行训练,获得用于预测当前时刻数据对应下一时刻数据的第一训练模型。
21、可选的,所述步骤s7包括:
22、计算获得所述真实数据集中各个真实数据和所述预测数据集中预设数据之间的归一化平均绝对误差向量;
23、对所述归一化平均绝对误差向量进行重构,计算获得误差分数;
24、根据所述误差分数,计算获得异常分数。
25、可选的,在步骤s1中,所述方法还包括:
26、采用前向和后向平均插值对所述第一晶圆制造训练数据集进行缺失值的填充;
27、删除所述第一晶圆制造训练数据集中不合格的数据;
28、对所述第一晶圆制造训练数据集进行噪声处理。
29、可选的,所述预设阈值根据晶圆制造异常数据进行计算获得。
30、本发明第二方面公开了一种基于时空图神经网络的半导体晶圆制造异常检测装置,所述装置包括:数据预处理模块、时间特征获取模块、静态矩阵获取模块、动态矩阵获取模块、模型训练模块、测试输入模块、异常分数获得模块以及异常判断模块;
31、所述数据预处理模块,用于获得第一晶圆制造训练数据集及对应的第一迭代次数,对所述第一晶圆制造训练数据集分别进行移动窗口输入处理和节点嵌入输入处理,获得对应的晶圆制造移动窗口数据集和晶圆制造节点嵌入数据集;
32、所述时间特征获取模块,用于将所述晶圆制造移动窗口数据集和晶圆制造节点嵌入数据集输入时间卷积神经网络进行训练并进行所述第一迭代次数的迭代,获得所述晶圆制造移动窗口数据集和晶圆制造节点嵌入数据集中各个变量节点对应的时间特征;
33、所述静态矩阵获取模块,用于根据所述晶圆制造节点嵌入数据集中的所述变量节点的依赖关系,构建静态图,计算获得所述静态图对应的静态矩阵;
34、所述动态矩阵获取模块,用于根据所述时间特征、所述晶圆制造移动窗口数据集以及晶圆制造节点嵌入数据集,采用注意力机制进行权重分配,计算获得动态图对应的初始动态权重矩阵;根据初始动态权重矩阵,采用注意力扩散机制,计算获得多跳动态权重矩阵;
35、所述模型训练模块,用于根据所述静态矩阵和所述多跳动态权重矩阵,分别获得对应的静态特征和动态特征;将所述静态特征和所述动态特征输入多层感知机进行训练,获得用于预测当前时刻数据对应下一时刻数据的第一训练模型;
36、所述测试输入模块,用于将第一晶圆制造测试数据集输入所述第一训练模型,获得所述第一晶圆制造测试数据集对应下一时刻的预测数据集;
37、所述异常分数获得模块,用于根据所述第一晶圆制造测试数据集的下一时刻真实数据集和所述预测数据集,进行计算获得异常分数;
38、所述异常判断模块,用于判断所述异常分数是否大于预设阈值,若是,则输出所述第一晶圆制造测试数据集的下一时刻为异常时刻;若否,则输出所述第一晶圆制造测试数据集的下一时刻为正常时刻。
39、可选的,所述数据预处理模块具体用于:
40、根据训练需求,确定所述第一晶圆制造训练数据集对应的窗口大小和窗口间步长;
41、根据所述窗口大小和所述窗口间步长,对所述第一晶圆制造训练数据集进行数据处理和划分,获得所述晶圆制造移动窗口数据集。
42、可选的,所述数据预处理模块具体用于:
43、将所述第一晶圆制造训练数据集中的数据进行节点嵌入处理,以使所述第一晶圆制造训练数据集中的数据向低维向量转化,获得所述晶圆制造节点嵌入数据集。
44、可选的,所述静态矩阵获取模块具体用于:
45、采用所述晶圆制造节点嵌入数据集中各个所述变量节点之间的两两依赖关系构建所述静态图,设置学习层自适应学习获得所述静态图对应的静态矩阵。
46、可选的,所述模型训练模块具体用于:
47、通过门控融合机制将所述静态特征和所述动态特征进行融合,获得最终特征;
48、将所述最终特征输入多层感知机进行训练,获得用于预测当前时刻数据对应下一时刻数据的第一训练模型。
49、可选的,所述异常分数获得模块具体用于:
50、计算获得所述真实数据集中各个真实数据和所述预测数据集中预设数据之间的归一化平均绝对误差向量;
51、对所述归一化平均绝对误差向量进行重构,计算获得误差分数;
52、根据所述误差分数,计算获得异常分数。
53、可选的,所述装置还包括:训练数据处理模块,
54、所述训练装置处理模块用于:采用前向和后向平均插值对所述第一晶圆制造训练数据集进行缺失值的填充;删除所述第一晶圆制造训练数据集中不合格的数据;对所述第一晶圆制造训练数据集进行噪声处理。
55、可选的,所述预设阈值根据晶圆制造异常数据进行计算获得。
56、本发明的有益效果:1、本发明获得第一晶圆制造训练数据集及对应的第一迭代次数,对第一晶圆制造训练数据集分别进行移动窗口输入处理和节点嵌入输入处理,获得对应的晶圆制造移动窗口数据集和晶圆制造节点嵌入数据集;将晶圆制造移动窗口数据集和晶圆制造节点嵌入数据集输入时间卷积神经网络进行训练并进行第一迭代次数的迭代,获得晶圆制造移动窗口数据集和晶圆制造节点嵌入数据集中各个变量节点对应的时间特征;根据晶圆制造节点嵌入数据集中的变量节点的依赖关系,构建静态图,计算获得静态图对应的静态矩阵;根据时间特征、晶圆制造移动窗口数据集以及晶圆制造节点嵌入数据集,采用注意力机制进行权重分配,计算获得动态图对应的初始动态权重矩阵;根据初始动态权重矩阵,采用注意力扩散机制,计算获得多跳动态权重矩阵;根据静态矩阵和多跳动态权重矩阵,分别获得对应的静态特征和动态特征;将静态特征和动态特征输入多层感知机进行训练,获得用于预测当前时刻数据对应下一时刻数据的第一训练模型。本发明通过上述方式生成的对应第一训练模型可以更好地挖掘各个变量节点的依赖关系,能够通过多跳动态权重矩阵发现多跳邻居的重要信息,并对每个变量节点时间关系进行建模,可以充分捕获时间序列数据的动态变化。这样可以提高第一训练模型的性能,进而提高半导体晶圆制造异常检测的精准度。2、本发明通过对第一晶圆制造训练数据集进行移动窗口输入处理和节点嵌入输入处理,可以更加容易捕捉到全局数据之间以及局部数据之间的关联,进而提高半导体晶圆制造异常检测的精准度。3、本发明可以对第一晶圆制造训练数据集进行缺失值填补,以使训练数据更加完整,使得训练获得的第一训练模型具有更高的精度。
57、综上,本发明可以有效提高半导体晶圆制造异常检测的精准度。
本文地址:https://www.jishuxx.com/zhuanli/20240802/260398.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。