一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种组合方式下对风电场有功功率进行短期预测的方法

2022-06-11 15:11:16 来源:中国专利 TAG:


1.本发明涉及功率预测技术领域,特别是涉及一种组合方式下对风电场有功功率进行短期预测的方法。


背景技术:

2.风电场功率预测技术是指对未来一段时间内风电场所能输出的功率大小进行预测,以便安排调度计划。由于风力发电具有间歇性和波动性等缺点,随着风力发电的装机容量不断增加和大量并网应用,其在电网中的比重不断提高,风电并网必定会带来诸如系统稳定性、电能质量和电力系统调度等方面的问题。运用高校合理的预测技术对风场有功输出进行监视,降低电网的备用容量与运行成本,也可提前定制检修和停机维护计划,使风电场的利益得到保证。
3.组合模型预测技术在风电场功率预测技术里应用广泛,其技术精确度较单一模型下也更高。组合方法利用不同模型提供的信息并发挥各自优势,选择合适的加权平均形式得到组合预测模型。其中,物理方法根据风电场周围等高线、粗糙度、障碍物、气压、气温等信息,采用数值天气预报(nwp)模型预测风速,通常将其结果作为其他统计模型的输入量或用于新建风电场的功率预测;统计和学习方法通常不考虑风速变化的物理过程,而是在历史统计数据与风电场输出功率之间建立一种映射关系进行预测。
4.短期预测技术可安排机组组合和发电计划,用于电力系统实时调度;受各种不确定因素如:太阳耀斑、地月引力、气压差变化剧烈等影响,风速变化趋势不规律,中长期尺度的风电预测技术相对较少,也比较困难。短期预测时,基于风电功率的预测方法将风电场中所有风机历史功率作为输入数据,即风电功率预测模型输入数据的信息更加全面,从而在降低数据采集成本的同时可提高预测精度。


技术实现要素:

5.针对现有技术中存在的上述技术问题,本发明提出了一种组合方式下对风电场有功功率进行短期预测的方法,设计合理,克服了现有技术的不足,具有良好的效果。
6.为了实现上述目的,本发明采用如下技术方案:一种组合方式下对风电场有功功率进行短期预测的方法,具体包括如下步骤:步骤s1:对原始功率、风速数据进行预处理;步骤s2:根据整理好的功率数据,运用密度峰值聚类算法,进行风机分簇;步骤s3:采用优化后的门控循环神经网络,对通过密度峰值聚类算法整理出来的风机分簇中的每簇分别进行短期预测,得到总的预测功率。
7.优选地,在步骤s1中,具体包括如下步骤:步骤s11:根据风速、功率剔除常数数据;步骤s12:根据风速、功率剔除越限数据;步骤s13:采用四分法剔除离群偏差数据。
8.优选地,在步骤s2中,具体包括如下步骤:步骤s21:对输入的待聚类风电场有功功率序列进行归一化;步骤s22:输入功率序列后,根据功率数据特点选取欧氏距离计算每个风机功率序列之间的相似距离,形成距离矩阵;步骤s23:对相似距离序列排序后,确定截断距离dc;步骤s24:根据所选取的截断距离dc,利用gaussian核逐一得出功率序列的局部密度ρ;步骤s25:在处理局部密度ρ最大的数据点基础上,生成δ和经过加权优化后的γ数组,构造出空间二维决策图;步骤s26:根据决策图选定分类簇数,进行聚类。
9.优选地,在步骤s3中,具体包括如下步骤:步骤s31:针对聚类形成的每个类别,分别建立不同的训练集和测试集;步骤s32:根据各簇数据的特点,确定循环神经网络的拓扑结构;步骤s33:应用mea思维进化算法进行参数迭代寻优,寻找门控循环神经网络的最优权值和阈值;步骤s34:使用寻找到的最优权值和阈值对训练集进行训练,通过测试集计算预测功率与测试功率的误差,误差小于设定值,则此权值和阈值为最优权值和阈值;误差大于设定值,则继续进行参数寻优。
10.优选地,在步骤s11中,根据功率pi=pi 1=pi 2=...=pi k和风速vi=vi 1=vi 2=...=vi k且k》10来剔除常数数据;具体为:输入风速及其对应功率矩阵,判断是否含有pi=pi 1=pi 2=...=pi k或vi=vi 1=vi 2=...=vi k且k》10,将判断为常数的风速功率数据对剔除,即功率或风速在连续时间内未发生变化,此时,功率与其对应的风速、风速与其对应的功率都为应剔除的风速功率数据对,在曲线图上一般处于中部或底部,大致显示为直线,通常是由弃风限电、叶片覆冰等原因造成,这样的功率数据会对预测形成较大的干扰。
11.优选地,在步骤s12中,根据功率p在0至额定风速pt之间,且风速v在0至切出风速vout之间,两个区间内来剔除越限数据;具体为:若功率功率p在0至额定风速pt之间并且风速v在0至切出风速vout之间,则不剔除越限数据;若不在此范围内,则剔除越限数据。
12.优选地,在步骤s13中,根据四分法求出区间内限保留非离群偏差数据;具体为:对于一个风速区间内的n个功率样本,对其进行升序排列得到样本{p1,p2,p3,....,pn},四分法的中位数p2为:
ꢀꢀ
(2);四分位p1和p3为:当n为偶数时,两个分位点就是以p2为中心的左右两部分的中位数;当n为奇数时:
ꢀꢀ
(3);所以,其内限为(2.5p1-1.5p3,2.5p3-1.5p1),超过区间即为离群偏差数据。
13.优选地,在步骤s21中,根据公式(4)对功率数据进行归一化处理:
ꢀꢀ
(4);式中,x为归一化后的功率值,xmax为功率最大值,xmin为功率最小值。
14.优选地,在步骤s22中,依据功率数据特点采用欧式距离来度量序列距离相似性,并用子序列匹配法,来寻求序列对之间的最佳欧式距离,如公式(6)所示:序列x=(x1,x2,...,xn)与序列y=(y1,y2,...,yn)的欧氏距离为:
ꢀꢀ
(6);其中,n》m, d1,d2,...,dn-m为序列每次匹配得到的欧氏距离;d为子序列匹配法得到的两个功率时间序列的最小欧式距离,此值可以作为两个序列的最终欧氏距离。
15.优选地,在步骤s23中,对具有n个风机也就是n个功率序列的数据矩阵,其截断距离为:
ꢀꢀ
(7);在步骤s24中,局部密度表示一个序列与其周围序列的离散程度,利用高斯核函数衡量各个序列的离散情况,表示为:
ꢀꢀ
(8);在步骤s25中, 处理局部密度也就是选定聚类中心距离δi,在将所有局部密度降序排列的基础上,对于局部密度最大点,δi实际上是该点和其他所有点距离值的最大值;对于其他序列的聚类中心距离,δi表示为:
ꢀꢀ
(9);其中,dij为每两个时间序列之间的欧氏距离,其中i、j代表不同功率时间序列;下标j特指大于当前序列i的局部密度的序列序号标签,ρi、ρj为不同时间序列的局部密度。
16.本发明所带来的有益技术效果:
本发明可以在在地形复杂多变的风电场中,无需对地形进行建模,只要依靠风电场本身所拥有的诸多风机测点上传的风速与功率数据,通过对历史数据的分析,将功率序列进行聚类,其反应的也就是对风机进行分类,也就是在对具有出力相似性的风机分类基础上,通过优化的门控循环神经网络分类预测,每个种类具由各自的权值和阈值,这样避免了笼统性的使用总功率进行预测所出现的使用单一权值和阈值使预测精准度降低的问题;在拥有大量历史数据的风电场,可以使用本方法来进行功率预测,对数据进行分析相对于搭建地形、气象等各种模型,更为经济性,在提高预测精度的同时,减少支出成本,提高风电在市场上的竞争力。
17.本发明主要可用于风速变化复杂、地形复杂、具有大量历史数据的风电场进行短期功率预测;提高了风电场有功功率预测的准确性。
附图说明
18.图1为本发明方法的整体流程图。
19.图2为本发明方法的详细流程图。
20.图3为本发明所用功率数据处理方法功率在处理前后的对比图。
21.图4为优化前的密度峰值聚类算法的决策图。
22.图5为优化后的密度峰值聚类算法的决策图。
23.图6为思维进化算法优化循环神经网络的流程图。
24.图7为组合模式下功率真实值与预测值对比图。
具体实施方式
25.下面结合附图以及具体实施方式对本发明作进一步详细说明:本发明一种改进的密度峰值聚类分析与优化后的门控循环神经网络作为组合预测模型的方法(其流程如图1所示),具体包括如下步骤:步骤s1:将方法所用到的原始功率、风速数据进行预处理;步骤s2:根据整理好的功率数据运用密度峰值聚类算法进行数据分析;步骤s3:采用优化后的门控循环神经网络对聚类算法整理出来的每簇分别进行预测,得到总的预测功率。
26.下面对各个步骤进行详细论述(其算法具体流程如图2所示):步骤s1:将方法所用到的原始功率、风速数据进行预处理。
27.在实际工程应用中,风机风速功率公式可以表示为:
ꢀꢀ
(1);式中,vin为切入风速,vout为切出风速,vr为额定风速,pr为额定功率。
28.风电场由于传感器的安装位置处于开放甚至严酷的环境中,因此传感器会产生不准确的数据;另一方面,由于风机故障检修或者弃风,也会产生不良数据。直接采用原始数
据进行预测或者进行功率曲线建模,将会影响预测精度。因此,通过对原始功率数据进行数据预处理,会提高原始功率数据的可靠性(对功率数据预处理的对比如图3所示,在风速功率曲线上,此前存在的常数数据、离群偏差数据、越限数据都能被准确的识别出来)。
29.具体包括:步骤s11:根据风速、功率剔除常数数据。常数数据在风速功率图中表现为条横的数据簇,一般集中在图像的底端或中间。其判断和剔除流程为:输入风速及其对应功率矩阵、判断是否含有pi=pi 1=pi 2=...=pi k或vi=vi 1=vi 2=...=vi k且k》10、将判断为常数的风速功率数据对剔除。
30.步骤s12:根据风速、功率剔除越限数据。越限数据主要是根据功率p在0至额定风速pt之间,且风速v在0至切出风速vout之间,两个区间内来剔除越限数据。
31.步骤s13:采用四分法剔除离群偏差数据。对于一个风速区间内的n个功率样本,对其进行升序排列得到样本{p1,p2,p3,....,pn},四分法的中位数p2为:
ꢀꢀ
(2);四分位p1和p3为:当n为偶数时,两个分位点就是以p2为中心的左右两部分的中位数。
32.当n为奇数时:
ꢀꢀ
(3);所以,其内限为(2.5p1-1.5p3,2.5p3-1.5p1),超过区间即为离群偏差数据。
33.步骤s2:根据整理好的功率序列运用密度峰值聚类算法进行风机分簇。
34.在进行实际风场功率预测时,如果直接采用风场总输出功率进行整体预测,由于风场风机在实际布置时,并不是整体整齐排列,其安装排列要根据地势地形来进行,再者,每个风机实际的机械性能、功率转化率也是不一样的,所以每个风机在同一时刻其出力是不一样的,如果使用总功率来进行预测,其偏差会较大。所以,可以在获得并处理全部风机机组功率数据的基础上,对所有风机根据功率时序进行聚类,根据每类的出力功率特点进行分别预测,这样在进行预测时,其每簇的阈值和权值是不一样的,更能反应每一簇功率的真实水平,同时也更能真实的预测整体的功率。
35.具体包括:步骤s21:对输入的待聚类风电场有功功率序列进行归一化。
36.功率数据归一化,不仅仅是为了加快算法的收敛速度,而是在进行分簇预测时使用神经网络,其算法激活函数需要输入输出在一定区间内,尽管在进行完功率数据预处理后,其功率被限制在一定区域;同时,可以提高精度,这在涉及到一些距离计算的算法时效果显著。
37.ꢀꢀ
(4);式中,x为归一化后的功率值,xmax为功率最大值,xmin为功率最小值。
38.步骤s22:输入功率序列后,根据功率数据特点选取欧氏距离计算每个风机功率序列之间的相似距离,形成距离矩阵。
39.在度量多个功率序列相似性的问题上,所用功率数据相对较为完整,可以直接使用欧氏距离来计算相似性度量矩阵,也就是距离矩阵。其一般表现形式为:在n维空间中,序列x=(x1,x2,...,xn)与序列y=(y1,y2,...,yn)的欧氏距离为: (5);在此,缺少部分功率数据的情况下,采用子序列匹配的方法,找出长序列中与短序列最相似的部分,此时,序列x=(x1,x2,...,xn)与序列y=(y1,y2,...,yn)的欧氏距离(其中n》m)为:
ꢀꢀ
(6);其中,n》m, d1,d2,...,dn-m为序列每次匹配得到的欧氏距离;d为子序列匹配法得到的两个功率时间序列的最小欧式距离,此值可以作为两个序列的最终欧氏距离。也就是公式(5)中的d(x,y)。对所有序列对进行计算后,可得到距离矩阵。
40.步骤s23:对相似距离序列排序后,确定截断距离。
41.截断距离的选取影响到聚类的效果,在进行功率序列聚类时,达到的效果不是要求分离出离群点,而是在选择合适阶段距离的基础上,将所有功率都进行分类而不出现halo离群点,这样在进行分组功率预测时会减少单个离群点进行单独预测的现象,大大减少计算量。在不断尝试的结果下,对具有n个风机也就是n个功率序列的数据矩阵,其截断距离为:
ꢀꢀꢀ
(7);步骤s24:根据所选取的截断距离,利用gaussian核逐一得出功率序列的局部密度。
42.局部密度表示一个序列与其周围序列的离散程度,利用高斯核函数衡量各个序列的离散情况,表示为:
(8);其中,i=1,2,....n;j=1,2,....n且i≠j;并且,dij为每两个时间序列之间的欧氏距离,其中i、j代表不同功率时间序列,下标j特指大于当前序列i的局部密度的序列序号标签;dc为截断距离;e为自然对数的底数;步骤s25:在处理局部密度最大的数据点基础上,生成经过加权优化后的数组,构造出空间二维决策图(其优化前后的决策图如图4、图5所示,优化后可十分清晰的确定聚类中心)。
43.处理局部密度也就是选定聚类中心距离δi,在将所有局部密度降序排列的基础上,对于局部密度最大点,δi实际上是该点和其他所有点距离值的最大值;对于其他序列的聚类中心距离,可以表示为:
ꢀꢀ
(9);其中,dij为每两个时间序列之间的欧氏距离,其中i、j代表不同功率时间序列;下标j特指大于当前序列i的局部密度的序列序号标签,ρi、ρj为不同时间序列的局部密度。
44.步骤s26:根据决策图选定分类簇数,进行聚类。
45.步骤s3:采用优化后的门控循环神经网络对聚类算法整理出来的每簇分别进行预测,得到总的预测功率(其流程如图6所示)。
46.门控循环神经网络在简单循环神经网络的基础上对网络的结构做了调整,加入了门控机制,用来控制神经网络中信息的传递。门控机制可以用来控制记忆单元中的信息有多少需要保留,有多少需要丢弃,新的状态信息又有多少需要保存到记忆单元中等。这使得门控循环神经网络可以学习跨度相对较长的依赖关系,而不会出现梯度消失和梯度爆炸的问题。从数学的角度来理解,一般结构的循环神经网络中,网络的状态和之间是非线性的关系,并且参数w在每个时间步共享,这是导致梯度爆炸和梯度消失的根本原因。门控循环神经网络解决问题的方法就是在状态和之间添加一个线性的依赖关系,从而避免梯度消失或梯度爆炸的问题。
47.具体包括:步骤s31:针对聚类形成的每个类别,分别建立不同的训练集和测试集。
48.在步骤s21中已经对功率数据进行了归一化,所以在这里直接用数据集中前6个月的数据作为训练集,最后50h的数据作为测试集。
49.步骤s32:根据各簇数据的特点,确定循环神经网络的拓扑结构。
50.在gru门控循环神经网络中,更新门用来控制当前时刻输出的状态ht中要保留多少历史状态ht-1,以及保留多少当前时刻的候选状态ht,更新门可表示为:
ꢀꢀ
(10);重置门主要决定了到底有多少过去的信息需要遗忘,可以使用以下表达式计算:
ꢀꢀꢀ
(11);其最终输出为:
ꢀꢀꢀ
(12);上述公式中,z
t
为更新门;r
t
为重置门;σ在此处为sigmoid函数;xt为第t个时间步的输入向量,即输入功率序列的第t个分量;ht-1保存的是前一个时间步t-1的信息;wz、uz、wr、ur分别为更新门和重置门的两个权值;bz、br为更新门、重置门的阈值。
51.在敲定其拓扑结构后,就是通过队训练集不断训练对其权值和阈值进行参数寻优。
52.步骤s33:应用mea思维进化算法进行参数迭代寻优,寻找门控循环神经网络的最优权值和阈值。
53.mea 属于进化算法的一种延续了遗传算法的一些基本概念,还引入了一些新概念,如公告板、趋同和异化操作等。其优化流程大体为:定义最大迭代次数iter、定义初始种群大小popsize,定义临时子群体 tempsize和优胜子群体bestsize的大小。子群体sg大小为sg =popsize/(bestsize tempsize);选取各个个体和种群的得分函数 val,val= 1/se,val=1/se。式中:a2为每次计算后的输出值,t为期望输出,se为均方差。不断迭代,得到循环神经网络的最优权值和阈值。
54.步骤s34:使用寻找到的最优权值和阈值对训练集进行训练,通过测试集计算预测功率与测试功率的误差,误差小于设定值,则此权值和阈值为最优权值和阈值;误差大于设定值,则继续进行参数寻优。通过对所有类簇所预测的功率反归一化后进行叠加,得到总的预测功率(其预测效果如图7所示,其中实线为真实值,虚线为预测值,从整体预测效果看,在预测略有延迟的结果下,其预测曲线的起伏波动与真实值曲线的起伏波动整体是吻合的)。
55.当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献