一种风电机组风速-功率数据处理方法
- 国知局
- 2024-09-11 14:54:22
本发明属于风电机组scada数据处理与分析领域,具体涉及一种风电机组风速-功率数据处理方法。
背景技术:
1、随着大数据和机器学习技术的快速发展,数据采集与监视控制(scada)系统在风力发电领域的作用越来越重要,通过对风电机组scada数据进行分析进而判断风电机组的运行状态或进行故障预警、预测具有重要意义。
2、风电机组利用叶轮从自然风中获取能量,通过传动系统带动发电机发电从而产生电能。风电机组的风速-功率运行曲线体现了机组整体能量输入与输出的关系,机组的各类运行状况均会在风速-功率运行曲线上得到体现,所以通过对风速-功率数据进行分析可以判断风电机组的运行状态或进行故障预警、预测。
3、现有技术中,如cn 115659568 a中公开的一种风电机组scada异常运行数据处理方法,考虑限电异常数据的分布特征,基于边缘检测算法和霍夫变换算法建立限电数据辨识算法,在保证辨识结果精确度的情况下大大减少风电机组异常运行数据辨识的时间。但是现有技术中,在对风电机组的风速-功率数据进行异常数据清洗时,由于额定功率数据点的密度相对低于其他正常数据,甚至接近于部分噪声数据,这就使得额定功率数据常常会被大量误清洗,这会对风电机组运行状态识别和故障预警、预测产生干扰。
技术实现思路
1、本发明的目的是提出一种风电机组风速-功率数据处理方法,解决现有技术中额定功率数据容易被误清晰的问题。
2、为此,本发明提供一种风电机组风速-功率数据处理方法,包括以下步骤:
3、s1、建立风电机组scada数据集;
4、s2、处理停机数据;
5、s3、初步处理噪声数据;
6、s4、数据切割,将数据切割为额定功率数据和非额定功率数据两部分;
7、s5、处理非额定功率数据部分的噪声数据;
8、s6、将拆分后的额定功率数据与剔除噪声数据后的非额定功率数据合并。
9、优选的,在步骤s1中,所述的风电机组scada数据集,采用数据-图像映射方法,建立风电机组的风速-功率曲线。
10、优选的,在步骤s2中,基于停机数据的数值特征,建立停机数据识别算法模型,标记并剔除风速-功率曲线中的停机数据。停机数据是指在数据层面显示为实际的风速大于设定的切入风速值,但是风机并没有能量的输出,即输出的功率为0kw。通过停机数据识别算法模型可以识别出风速-功率曲线中输出功率为0的数据,将其标记并剔除。
11、优选的,在步骤s3中,根据噪声数据与正常数据的密度差异,建立噪声数据识别算法模型,标记并剔除噪声数据。
12、优选的,所述噪声数据识别算法模型通过dbscan聚类算法,剔除噪声数据。通过dbscan聚类算法,将高密度的数据保留,低密度的数据去除,在确保额定功率数据不损失或少损失的条件下清洗掉尽可能多的异常数据点。
13、优选的,在步骤s4中,所述数据切割的步骤为:按照若干个功率单位将风速-功率曲线拆分为若干个横向的小区间,从上到下依次找出每个区间内所有数据的风速最大值,找出首个风速最大值小于设定的阈值的区域,且该区间的密度中点在额定风速附近,将该区间的上边缘作为拆分线。经过步骤s3中的噪声处理,将低密度的噪声数据进行去除,剩余的高密度数据可直接进行数据切割,根据额定功率数据与非额定功率数据的分布特征,将数据切割为额定功率数据和非额定功率数据。
14、优选的,在步骤s5中,根据噪声数据与正常数据的分布差异,标记并剔除非额定功率数据部分的噪声数据。
15、优选的,利用肖维勒准则将数据中的噪声数据剔除。肖维勒准则是指在n次实验中,统计待处理数据点误差值出现的可能性为0的点的个数,并计算其概率值。
16、优选的,在使用肖维勒准则剔除噪声数据之前,先进通过box_cox变换将数据转换为正态分布,剔除噪声数据后通过box_cox反变换将数据还原为原先的形式。由于风速-功率数据并非是严格意义上的正态分布,需要先对数据进行box_cox变换,将其转变为正态分布的形式。
17、优选的,所述的利用肖维勒准则将数据中的噪声数据剔除,需要将数据按照功率拆分为若干等份,对每一份进行分别处理,调整份数与相关参数反复执行,直至最佳。
18、有益效果:
19、1.本发明提供了一种风电机组风速-功率数据处理方法,可以有效解决风电机组scada数据中噪声数据密度过高时数据预处理过程中容易误清洗额定功率数据的问题。
20、2.现有技术中由于额定功率数据点的密度相对低于其他正常数据,甚至接近于部分噪声数据,这就使得额定功率数据常常会被大量误清洗,这会对风电机组运行状态识别和故障预警、预测产生干扰。本发明中,通过将数据切割成额定功率数据和非额定功率数据,保留额定功率数据并将非额定功率数据中的噪声数据剔除,再将额定功率数据与剔除噪声数据后的非额定功率数据合并得到最终的数据,防止额定功率数据被误清洗,保证数据的质量。
21、3.由于数据较多,如何准确的将额定功率数据与非额定功率数据进行分割是一个难点。本发明在初步处理噪声数据步骤中,通过dbscan聚类算法,将高密度的数据保留,低密度的数据去除,在确保额定功率数据不损失或少损失的条件下清洗掉尽可能多的异常数据点,低密度的噪声数据去除后,剩余的高密度数据可直接进行数据切割,根据额定功率数据与非额定功率数据的分布特征,将数据切割为额定功率数据和非额定功率数据。
22、4.本发明中在对非额定功率数据部分的噪声数据进行去除时,采用肖维勒准则,适用于样本数较大的场合,提升噪声数据去除的准确性。但是由于风速-功率数据并非是严格意义上的正态分布,并不能直接使用肖维勒准则进行计算,所以本发明先将数据进行box_cox变换,将其转变为正态分布的形式,去除噪声数据后再通过box_cox反变换将数据还原为原先的形式,使其可以适用于肖维勒准则的计算。
23、5.在进行box-cox变换时,数据不能包含非正数或零,因为对数变换在这些情况下是未定义的。而本申请在步骤s2中先通过建立停机数据识别算法模型,标记并剔除风速-功率曲线中的停机数据,将为0的数据去除,在剔除了停机数据的同时便于后续非额定功率数据进行box_cox变换。
技术特征:1.一种风电机组风速-功率数据处理方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种风电机组风速-功率数据处理方法,其特征在于,在步骤s1中,所述的风电机组scada数据集,采用数据-图像映射方法,建立风电机组的风速-功率曲线。
3.根据权利要求2所述的一种风电机组风速-功率数据处理方法,其特征在于,在步骤s2中,基于停机数据的数值特征,建立停机数据识别算法模型,标记并剔除风速-功率曲线中的停机数据。
4.根据权利要求1所述的一种风电机组风速-功率数据处理方法,其特征在于,在步骤s3中,根据噪声数据与正常数据的密度差异,建立噪声数据识别算法模型,标记并剔除噪声数据。
5.根据权利要求4所述的一种风电机组风速-功率数据处理方法,其特征在于,所述噪声数据识别算法模型通过dbscan聚类算法,剔除噪声数据。
6.根据权利要求1所述的一种风电机组风速-功率数据处理方法,其特征在于,在步骤s4中,所述数据切割的步骤为:按照若干个功率单位将风速-功率曲线拆分为若干个横向的小区间,从上到下依次找出每个区间内所有数据的风速最大值,找出首个风速最大值小于设定的阈值的区域,且该区间的密度中点在额定风速附近,将该区间的上边缘作为拆分线。
7.根据权利要求1所述的一种风电机组风速-功率数据处理方法,其特征在于,在步骤s5中,根据噪声数据与正常数据的分布差异,标记并剔除非额定功率数据部分的噪声数据。
8.根据权利要求7所述的一种风电机组风速-功率数据处理方法,其特征在于,利用肖维勒准则将数据中的噪声数据剔除。
9.根据权利要求8所述的一种风电机组风速-功率数据处理方法,其特征在于,在使用肖维勒准则剔除噪声数据之前,先进通过box_cox变换将数据转换为正态分布,剔除噪声数据后通过box_cox反变换将数据还原为原先的形式。
10.根据权利要求8所述的一种风电机组风速-功率数据处理方法,其特征在于,所述的利用肖维勒准则将数据中的噪声数据剔除,需要将数据按照功率拆分为若干等份,对每一份进行分别处理,调整份数与相关参数反复执行,直至最佳。
技术总结本发明公开了一种风电机组风速‑功率数据处理方法,包括以下步骤S1、建立风电机组SCADA数据集;S2、处理停机数据;S3、初步处理噪声数据;S4、数据切割,将数据切割为额定功率数据和非额定功率数据两部分;S5、处理非额定功率数据部分的噪声数据;S6、将拆分后的额定功率数据与剔除噪声数据后的非额定功率数据合并。本发明提供了一种风电机组风速‑功率数据处理方法,可以有效解决风电机组SCADA数据中噪声数据密度过高时数据预处理过程中容易误清洗额定功率数据的问题。技术研发人员:李忠虎,柳源,王金明,朱彦民,张继红,芦建文受保护的技术使用者:内蒙古科技大学技术研发日:技术公布日:2024/9/9本文地址:https://www.jishuxx.com/zhuanli/20240911/292524.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表