基于增强卷积去噪算法的风电机组数据清洗方法及装置与流程

专利查询1月前  25



1.本公开属于风电机组数据处理技术领域,具体涉及一种基于增强卷积去噪算法的风电机组数据清洗方法及装置。


背景技术:

2.可再生能源的开发和利用已成为能源转型下电力行业的核心要务之一。风能作为一种清洁、无污染的可再生能源,其巨大的发展和应用潜力已经引起了全球的广泛关注。近几年中,风电装机容量持续增长,分布范围广泛。然而,绝大多数风力发电厂都位于偏远的山区或海上,此类地区环境恶劣,风机受外界影响的扰动加剧。与此同时,风机的叶片、轴承、齿轮、发电机部件经过长时间的损耗,都容易发生故障,这将给风机的稳定运行带来更多的不确定性因素。
3.风电机组的状态监测和异常检测以及长短期风电功率预测等都是提高风机运行安全稳定的必要技术措施。不仅可以保证风机的可靠性,避免灾难性事故的发生。还有利于制定维护计划,为电网调度提供参考,提高风电并网下的电网调节能力,并进一步减少经济损失,促进风电产业的发展。而上述技术措施几乎都依赖于对风电机组运行数据的特征提取和分析。数据采集与监控(scada)系统广泛应用于电力、冶金、石油、化工、燃气、铁路等领域。操作设备由scada远程监控,包括数据采集、测量、参数调整和各种信号报警。风电机组中的scada系统包含基本状态信息,它可以收集大量与运行状态相关的参数,包括部件温度、风速、电流、电压和功率等。然而scada系统中收集到的数据一般受环境变化、外界扰动或风机机械磨损的影响,存在数据含有噪声,数据重复以及数据无效等问题。因此需通过数据清洗方法预先对其进行处理。数据清洗一般包括数据一致性检查,噪声去除、缺失值填补和无效值处理等,随着智能算法的发展,数据清洗方法也层出不穷,具有极大的发展空间。


技术实现要素:

4.本公开旨在至少解决现有技术中存在的技术问题之一,提供一种基于增强卷积去噪算法的风电机组数据清洗方法及装置。
5.本公开的一方面,提供一种基于增强卷积去噪算法的风电机组数据清洗方法,所述方法包括:
6.基于scada系统,采集风电机组的风电数据;
7.对所述风电机组的风电数据,采用模糊c均值fcm进行数据聚类;
8.对聚类处理后的所述风电数据,基于增强卷积神经网络进行数据去噪;
9.对去噪处理后的所述风电数据,基于布谷鸟算法进行数据缺失值填补和无效值处理,完成风电机组数据清洗。
10.在一些实施方式中,所述基于scada系统,采集风电机组的风电数据,包括:
11.以t为采样间隔获取风电机组运行过程中的n个可测变量的n组实际运行数据存入所述scada系统,采样数据需尽可能包含风机在不同环境条件、时间尺度、服役时长下的运
行请况;
12.通过主元法筛选所述scada系统中各变量数据,最终得到待清洗的m个变量作为数据清洗过程的输入变量{x1,x2,

,xm}。
13.在一些实施方式中,所述对所述风电机组的风电数据,采用模糊c均值fcm进行数据聚类,包括:
14.定义如下目标函数(1):
[0015][0016]
其中:α为加权模糊性参数,c为聚类数,xc为聚类中心,为输入xi相对聚类c的隶属度:
[0017][0018]
随机初始化xc并通过下式(3)计算μ
ic

[0019][0020]
采用下式(4)更新聚类中心向量xc:
[0021][0022]
采用下式(5)计算适应度函数增量:
[0023][0024]
当δ小于一个小的预设常值ε时,迭代过程结束,得到全部聚类。
[0025]
在一些实施方式中,所述对聚类处理后的所述风电数据,基于增强卷积神经网络进行数据去噪,包括:
[0026]
训练数据集的获取:任选一个聚类中数据xi,基于均值为0,方差为σ2的高斯分布随机生成高斯噪声与xi各项相加得到带有噪声的数据信号即然后对其余所有聚类重复上述操作,得到包含c个含噪声的聚类的数据集
[0027]
所构建的方法由路径网络结构相同的去噪通道和提议通道基网络构成;其中去噪通道主要用于训练去噪模型,拟合提议通道则通过基于xi的编码-解码,生成
隐藏层的辅助监督信息,以达到增强原有卷积神经网络性能的效果;
[0028]
假设每个基网络f(
·
)由l个隐藏层组成,其中去噪通道和提议通道的网络参数分别表示为θ={θ1,θ2,


l
}和第i层前的全部网络参数简记为θ1→i=θi和φ1→i=φi;
[0029]
采用下式(6)进行提议通道训练:
[0030][0031]
基于上式(6)求得最优解φ
*
,然后定义损失函数训练去噪通道模型,如下式(7):
[0032][0033]
其中:ω代表根据上述最优解φ
*
计算得到的隐藏层索引集合,为第j层的建议损失;上式求得的最优解记为θ
*

[0034]
增强卷积去噪模型的训练:基于上述两个优化目标,通过下式(8)和(9)所示每层参数的梯度对算法进行优化:
[0035][0036][0037]
其中:li为第i个去噪通道的损失,为第i个和提议通道的损失;
[0038]
新数据去噪预测:基于训练所得去噪模型对新输入的数据信号进行去噪处理,首先判断该数据所属聚类,然后对相应的去噪数据进行预测。
[0039]
在一些实施方式中,所述对去噪处理后的所述风电数据,基于布谷鸟算法进行数据缺失值填补和无效值处理,完成风电机组数据清洗,包括:
[0040]
参数初始化:定义布谷鸟种群规模n
p
,最大迭代次数max;随机初始化鸟窝的位置和鸟群中每个布谷鸟个体的位置并计算其适应度;
[0041]
根据莱维飞行更新布谷鸟个体和相应鸟窝位置并计算更新后的适应度值;
[0042][0043]
ξ=ξ0(x
j,k-x
i,k
)
ꢀꢀ
(11)
[0044]
l(β)=s
×
(x
k-x
best,k
)
ꢀꢀ
(12)
[0045]
其中:x
i,k
为布谷鸟个体i在迭代时刻k的位置,ξ为迭代步长系数,ξ0为步长控制量,l(β)为莱维分布,s是服从参数的莱维分布随机数,x
best,k
为当前最优解;
[0046]
根据上一步计算所得位置更新后的适应度确定当前的最优解,并通过贪婪选择更新全局最优解,并记录当前鸟窝位置;
[0047]
判断是否达到最大迭代次数max或满足其他终止条件,若满足则输出并记录待辨识的数据关系模型的参数;否则,执行上述步骤继续寻优;
[0048]
将风电机组运行数据输入辨识所得模型,结合模型输出判断实际运行数据的异常
值和缺失值,进行进一步的数据清洗。
[0049]
本公开的另一方面,提供一种基于增强卷积去噪算法的风电机组数据清洗装置,所述装置包括:
[0050]
采集模块,用于基于scada系统,采集风电机组的风电数据;
[0051]
聚类模块,用于对所述风电机组的风电数据,采用模糊c均值fcm进行数据聚类;
[0052]
去噪模块,用于对聚类处理后的所述风电数据,基于增强卷积神经网络进行数据去噪;
[0053]
处理模块,用于对去噪处理后的所述风电数据,基于布谷鸟算法进行数据缺失值填补和无效值处理,完成风电机组数据清洗。
[0054]
在一些实施方式中,所述采集模块,具体还用于:
[0055]
以t为采样间隔获取风电机组运行过程中的n个可测变量的n组实际运行数据存入所述scada系统,采样数据需尽可能包含风机在不同环境条件、时间尺度、服役时长下的运行请况;
[0056]
通过主元法筛选所述scada系统中各变量数据,最终得到待清洗的m个变量作为数据清洗过程的输入变量{x1,x2,

,xm}。
[0057]
在一些实施方式中,所述聚类模块,具体还用于:
[0058]
定义如下目标函数(1):
[0059][0060]
其中:α为加权模糊性参数,c为聚类数,xc为聚类中心,为输入xi相对聚类c的隶属度:
[0061][0062]
随机初始化xc并通过下式(3)计算μ
ic

[0063][0064]
采用下式(4)更新聚类中心向量xc:
[0065][0066]
采用下式(5)计算适应度函数增量:
[0067]
[0068]
当δ小于一个小的预设常值ε时,迭代过程结束,得到全部聚类。
[0069]
在一些实施方式中,所述去噪模块,具体还用于:
[0070]
训练数据集的获取:任选一个聚类中数据xi,基于均值为0,方差为σ2的高斯分布随机生成高斯噪声与xi各项相加得到带有噪声的数据信号即然后对其余所有聚类重复上述操作,得到包含c个含噪声的聚类的数据集
[0071]
所构建的方法由路径网络结构相同的去噪通道和提议通道基网络构成;其中去噪通道主要用于训练去噪模型,拟合提议通道则通过基于xi的编码-解码,生成隐藏层的辅助监督信息,以达到增强原有卷积神经网络性能的效果;
[0072]
假设每个基网络f(
·
)由l个隐藏层组成,其中去噪通道和提议通道的网络参数分别表示为θ={θ1,θ2,


l
}和第i层前的全部网络参数简记为θ1→i=θi和φ1→i=φi;
[0073]
采用下式(6)进行提议通道训练:
[0074][0075]
基于上式(6)求得最优解φ
*
,然后定义损失函数训练去噪通道模型,如下式(7):
[0076][0077]
其中:ω代表根据上述最优解φ
*
计算得到的隐藏层索引集合,为第j层的建议损失;上式求得的最优解记为θ
*

[0078]
增强卷积去噪模型的训练:基于上述两个优化目标,通过下式(8)和(9)所示每层参数的梯度对算法进行优化:
[0079][0080][0081]
其中:li为第i个去噪通道的损失,为第i个和提议通道的损失;
[0082]
新数据去噪预测:基于训练所得去噪模型对新输入的数据信号进行去噪处理,首先判断该数据所属聚类,然后对相应的去噪数据进行预测。
[0083]
在一些实施方式中,所述处理模块,具体还用于:
[0084]
参数初始化:定义布谷鸟种群规模n
p
,最大迭代次数max;随机初始化鸟窝的位置和鸟群中每个布谷鸟个体的位置并计算其适应度;
[0085]
根据莱维飞行更新布谷鸟个体和相应鸟窝位置并计算更新后的适应度值;
[0086]
[0087]
ξ=ξ0(x
j,k-x
i,k
)
ꢀꢀ
(11)
[0088]
l(β)=s
×
(x
k-x
best,k
)
ꢀꢀ
(12)
[0089]
其中:x
i,k
为布谷鸟个体i在迭代时刻k的位置,ξ为迭代步长系数,ξ0为步长控制量,l(β)为莱维分布,s是服从参数的莱维分布随机数,x
best,k
为当前最优解;
[0090]
根据上一步计算所得位置更新后的适应度确定当前的最优解,并通过贪婪选择更新全局最优解,并记录当前鸟窝位置;
[0091]
判断是否达到最大迭代次数max或满足其他终止条件,若满足则输出并记录待辨识的数据关系模型的参数;否则,执行上述步骤继续寻优;
[0092]
将风电机组运行数据输入辨识所得模型,结合模型输出判断实际运行数据的异常值和缺失值,进行进一步的数据清洗。
[0093]
本公开的风电机组数据清洗方法及装置,为保证风电机组的运行可靠性以及风电并网下的电网稳定性,提出了基于增强卷积去噪算法的风电机组数据清洗方法,为风电机组的状态监测和异常检测以及长短期风电功率预测等奠定了良好的基础。此外,本公开在风机数据去噪中引入了增强卷积神经网络方法,并且在神经网络隐藏层的输出附加辅助监督信息作为正则化约束,可有效提高数据去噪的效率和精确性。
附图说明
[0094]
图1为本公开一实施例的基于增强卷积去噪算法的风电机组数据清洗方法的流程图;
[0095]
图2为本公开另一实施例的基于增强卷积去噪算法的风电机组数据清洗方法的流程图;
[0096]
图3为本公开另一实施例的增强卷积神经网络的结构示意图;
[0097]
图4为本公开另一实施例的基于增强卷积去噪算法的风电机组数据清洗装置的结构示意图。
具体实施方式
[0098]
为使本领域技术人员更好地理解本公开的技术方案,下面结合附图和具体实施方式对本公开作进一步详细描述。
[0099]
本实施例的一方面,如图1所示,涉及一种基于增强卷积去噪算法的风电机组数据清洗方法s100,所述方法s100包括:
[0100]
s110、基于scada系统,采集风电机组的风电数据。
[0101]
具体地,在本步骤中,scada系统在风电厂的应用十分广泛,以计算机为基础对现场的运行设备进行监视和控制实现发电过程控制与调度自动化系统。在保障电网运行的可靠性、安全性与经济性,减轻调度员负担,提高调度效率和水平方面具有不可替代的作用。
[0102]
具体地,步骤s110可以包括以下具体步骤:
[0103]
s111、以t为采样间隔获取风电机组运行过程中的n个可测变量的n组实际运行数据存入所述scada系统,采样数据需尽可能包含风机在不同环境条件、时间尺度、服役时长下的运行请况。
[0104]
具体地,在本步骤中,可以以15min为采样间隔t获取风电机组运行过程中的n个可
测变量的n=100000组实际运行数据存入scada系统。
[0105]
s112、通过主元法筛选所述scada系统中各变量数据,最终得到待清洗的m个变量作为数据清洗过程的输入变量{x1,x2,

,xm}。本实施例中选取风机输出功率、风机叶片转速、桨距角、环境温度、风速、风向这6个变量为待清洗数据,则m=6。
[0106]
s120、对所述风电机组的风电数据,采用模糊c均值fcm进行数据聚类。
[0107]
具体地,在本步骤中,步骤s110中得到的风机数据涵盖了机组大范围的运行工况,而机组运行数据在不同外界环境或机组硬件特性下往往呈现出不同的关系,因此需先对数据集进行聚类,基于此,步骤s120可具体化为:
[0108]
s121、定义如下目标函数(1):
[0109][0110]
其中:α为加权模糊性参数,本实施例中可以取0.6,c为聚类数,xc为聚类中心,为输入xi相对聚类c的隶属度:
[0111][0112]
s122、随机初始化xc并通过下式(3)计算μ
ic

[0113][0114]
s123、采用下式(4)更新聚类中心向量xc:
[0115][0116]
s124、采用下式(5)计算适应度函数增量:
[0117][0118]
s125、当δ小于一个小的预设常值ε时,ε可以取值为10-3
,迭代过程结束,得到全部聚类。
[0119]
s130、对聚类处理后的所述风电数据,基于增强卷积神经网络进行数据去噪。
[0120]
具体地,在本步骤中,基于步骤s120所得到的聚类数据,在本步骤中构建如图3所示的增强卷积神经网络进行数据去噪。
[0121]
s131、训练数据集的获取。任选一个聚类中数据xi,基于均值为0,方差为σ2的高斯分布随机生成高斯噪声与xi各项相加得到带有噪声的数据信号即
然后对其余所有聚类重复上述操作,得到包含c个含噪声的聚类的数据集
[0122]
所构建的方法由路径网络结构相同的去噪通道和提议通道基网络构成;其中去噪通道主要用于训练去噪模型,拟合提议通道则通过基于xi的编码-解码,生成隐藏层的辅助监督信息,以达到增强原有卷积神经网络性能的效果。
[0123]
假设每个基网络f(
·
)由l个隐藏层(l可以取值为4)组成,其中去噪通道和提议通道的网络参数分别表示为θ={θ1,θ2,


l
}和第i层前的全部网络参数简记为θ1→i=θi和φ1→i=φi;
[0124]
采用下式(6)进行提议通道训练:
[0125][0126]
基于上式(6)求得最优解φ
*
,然后定义损失函数训练去噪通道模型,如下式(7):
[0127][0128]
其中:ω代表根据上述最优解φ
*
计算得到的隐藏层索引集合,为第j层的建议损失;上式求得的最优解记为θ
*

[0129]
s132、增强卷积去噪模型的训练。基于上述两个优化目标,通过下式(8)和(9)所示每层参数的梯度对算法进行优化:
[0130][0131][0132]
其中:li为第i个去噪通道的损失,为第i个和提议通道的损失。
[0133]
s133、新数据去噪预测:基于训练所得去噪模型对新输入的数据信号进行去噪处理,首先判断该数据所属聚类,然后对相应的去噪数据进行预测。
[0134]
s140、对去噪处理后的所述风电数据,基于布谷鸟算法进行数据缺失值填补和无效值处理,完成风电机组数据清洗。
[0135]
具体地,在本步骤中,步骤s130中的增强卷积神经网络模型可有效去除风电机组运行数据中的噪声。但还需对该去噪数据中的异常值或缺失值进行处理以实现进一步的数据清洗。可在步骤s140中通过布谷鸟算法辨识得到数据间的关系模型,通过预测输出校正异常值并对缺失值进行填补。
[0136]
基于布谷鸟优化算法辨识所得的风电机组数据间关系模型的数据清洗过程如下:
[0137]
s141、参数初始化:定义布谷鸟种群规模n
p
,(例如,n
p
=100)最大迭代次数max(例如,max=30);随机初始化鸟窝的位置和鸟群中每个布谷鸟个体的位置并计算其适应度。
[0138]
s142、根据莱维飞行更新布谷鸟个体和相应鸟窝位置并计算更新后的适应度值;
[0139][0140]
ξ=ξ0(x
j,k-x
i,k
)
ꢀꢀ
(11)
[0141]
l(β)=s
×
(x
k-x
best,k
)
ꢀꢀ
(12)
[0142]
其中:x
i,k
为布谷鸟个体i在迭代时刻k的位置,ξ为迭代步长系数,本实施例汇总取0.5,ξ0为步长控制量,l(β)为莱维分布,s是服从参数的莱维分布随机数,x
best,k
为当前最优解。
[0143]
s143、根据上一步计算所得位置更新后的适应度确定当前的最优解,并通过贪婪选择更新全局最优解,并记录当前鸟窝位置。
[0144]
s144、判断是否达到最大迭代次数max或满足其他终止条件,若满足则输出并记录待辨识的数据关系模型的参数;否则,执行上述步骤s142继续寻优。
[0145]
s145、将风电机组运行数据输入辨识所得模型,结合模型输出判断实际运行数据的异常值和缺失值,进行进一步的数据清洗。
[0146]
可选地,为验证该方法的可行性和有效性,如图1和图2所示,还包括s150、所设计的风电机组数据清洗方法的有效性验证的步骤。
[0147]
具体地,本实施例在s150中依托python编程软件进行算法仿真测试,具体过程如下:
[0148]
s151:整理经数据聚类和清洗后的风电机组运行数据。
[0149]
s152:依托python编程软件实现上述算法的程序编写并定义算法性能量化指标,本实施例中以数据拟合度、清洗后数据的特征保留程度为性能指标。
[0150]
s153:进行数值仿真测试,记录各性能指标并和其他数据清洗方法进行对比分析以验证算法性能。
[0151]
本公开实施例的风电机组数据清洗方法,为保证风电机组的运行可靠性以及风电并网下的电网稳定性,提出了基于增强卷积去噪算法的风电机组数据清洗方法,为风电机组的状态监测和异常检测以及长短期风电功率预测等奠定了良好的基础。此外,本公开在风机数据去噪中引入了增强卷积神经网络方法,并且在神经网络隐藏层的输出附加辅助监督信息作为正则化约束,可有效提高数据去噪的效率和精确性。
[0152]
本公开的另一方面,如图4所示,提供一种基于增强卷积去噪算法的风电机组数据清洗装置100,该装置100可以适用于前文记载的方法,具体可以参考前文相关记载,在此不作赘述。所述装置100包括:
[0153]
采集模块110,用于基于scada系统,采集风电机组的风电数据;
[0154]
聚类模块120,用于对所述风电机组的风电数据,采用模糊c均值fcm进行数据聚类;
[0155]
去噪模块130,用于对聚类处理后的所述风电数据,基于增强卷积神经网络进行数据去噪;
[0156]
处理模块140,用于对去噪处理后的所述风电数据,基于布谷鸟算法进行数据缺失值填补和无效值处理,完成风电机组数据清洗。
[0157]
本公开实施例的风电机组数据清洗装置,为保证风电机组的运行可靠性以及风电并网下的电网稳定性,提出了基于增强卷积去噪算法的风电机组数据清洗装置,为风电机
组的状态监测和异常检测以及长短期风电功率预测等奠定了良好的基础。此外,本公开在风机数据去噪中引入了增强卷积神经网络方法,并且在神经网络隐藏层的输出附加辅助监督信息作为正则化约束,可有效提高数据去噪的效率和精确性。
[0158]
在一些实施方式中,所述采集模块110,具体还用于:
[0159]
以t为采样间隔获取风电机组运行过程中的n个可测变量的n组实际运行数据存入所述scada系统,采样数据需尽可能包含风机在不同环境条件、时间尺度、服役时长下的运行请况;
[0160]
通过主元法筛选所述scada系统中各变量数据,最终得到待清洗的m个变量作为数据清洗过程的输入变量。
[0161]
在一些实施方式中,所述聚类模块120,具体还用于:
[0162]
定义如下目标函数(1):
[0163][0164]
其中:α为加权模糊性参数,c为聚类数,xc为聚类中心,为输入xi相对聚类c的隶属度:
[0165][0166]
随机初始化xc并通过下式(3)计算μ
ic

[0167][0168]
采用下式(4)更新聚类中心向量xc:
[0169][0170]
采用下式(5)计算适应度函数增量:
[0171][0172]
当δ小于一个小的预设常值ε时,迭代过程结束,得到全部聚类。
[0173]
在一些实施方式中,所述去噪模块130,具体还用于:
[0174]
训练数据集的获取:任选一个聚类中数据xi,基于均值为0,方差为σ2的高斯分布随机生成高斯噪声与xi各项相加得到带有噪声的数据信号,即然后对其余所有聚类重复上述操作,得到包含c个含噪声的聚类
的数据集
[0175]
所构建的方法由路径网络结构相同的去噪通道和提议通道基网络构成;其中去噪通道主要用于训练去噪模型,拟合提议通道则通过基于xi的编码-解码,生成隐藏层的辅助监督信息,以达到增强原有卷积神经网络性能的效果;
[0176]
假设每个基网络f(
·
)由l个隐藏层组成,其中去噪通道和提议通道的网络参数分别表示为θ={θ1,θ2,


l
}和第i层前的全部网络参数简记为θ1→i=θi和φ1→i=φi;
[0177]
采用下式(6)进行提议通道训练:
[0178][0179]
基于上式(6)求得最优解φ
*
,然后定义损失函数训练去噪通道模型,如下式(7):
[0180][0181]
其中:ω代表根据上述最优解φ
*
计算得到的隐藏层索引集合,为第j层的建议损失;上式求得的最优解记为θ
*

[0182]
增强卷积去噪模型的训练:基于上述两个优化目标,通过下式(8)和(9)所示每层参数的梯度对算法进行优化:
[0183][0184][0185]
其中:li为第i个去噪通道的损失,为第i个和提议通道的损失;
[0186]
新数据去噪预测:基于训练所得去噪模型对新输入的数据信号进行去噪处理,首先判断该数据所属聚类,然后对相应的去噪数据进行预测。
[0187]
在一些实施方式中,所述处理模块140,具体还用于:
[0188]
参数初始化:定义布谷鸟种群规模n
p
,最大迭代次数max;随机初始化鸟窝的位置和鸟群中每个布谷鸟个体的位置并计算其适应度;
[0189]
根据莱维飞行更新布谷鸟个体和相应鸟窝位置并计算更新后的适应度值;
[0190][0191]
ξ=ξ0(x
j,k-x
i,k
)
ꢀꢀ
(11)
[0192]
l(β)=s
×
(x
k-x
best,k
)
ꢀꢀ
(12)
[0193]
其中:x
i,k
为布谷鸟个体i在迭代时刻k的位置,ξ为迭代步长系数,ξ0为步长控制量,l(β)为莱维分布,s是服从参数的莱维分布随机数,x
best,k
为当前最优解;
[0194]
根据上一步计算所得位置更新后的适应度确定当前的最优解,并通过贪婪选择更新全局最优解,并记录当前鸟窝位置;
[0195]
判断是否达到最大迭代次数max或满足其他终止条件,若满足则输出并记录待辨识的数据关系模型的参数;否则,执行上述步骤继续寻优;
[0196]
将风电机组运行数据输入辨识所得模型,结合模型输出判断实际运行数据的异常值和缺失值,进行进一步的数据清洗。
[0197]
可以理解的是,以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式,然而本公开并不局限于此。对于本领域内的普通技术人员而言,在不脱离本公开的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本公开的保护范围。

技术特征:
1.一种基于增强卷积去噪算法的风电机组数据清洗方法,其特征在于,所述方法包括:基于scada系统,采集风电机组的风电数据;对所述风电机组的风电数据,采用模糊c均值fcm进行数据聚类;对聚类处理后的所述风电数据,基于增强卷积神经网络进行数据去噪;对去噪处理后的所述风电数据,基于布谷鸟算法进行数据缺失值填补和无效值处理,完成风电机组数据清洗。2.根据权利要求1所述的方法,其特征在于,所述基于scada系统,采集风电机组的风电数据,包括:以t为采样间隔获取风电机组运行过程中的n个可测变量的n组实际运行数据存入所述scada系统,采样数据需尽可能包含风机在不同环境条件、时间尺度、服役时长下的运行请况;通过主元法筛选所述scada系统中各变量数据,最终得到待清洗的m个变量作为数据清洗过程的输入变量{x1,x2,

,x
m
}。3.根据权利要求1所述的方法,其特征在于,所述对所述风电机组的风电数据,采用模糊c均值fcm进行数据聚类,包括:定义如下目标函数(1):其中:α为加权模糊性参数,c为聚类数,x
c
为聚类中心,为输入x
i
相对聚类c的隶属度:随机初始化x
c
并通过下式(3)计算μ
ic
:采用下式(4)更新聚类中心向量x
c
:采用下式(5)计算适应度函数增量:当δ小于一个小的预设常值ε时,迭代过程结束,得到全部聚类。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述对聚类处理后的所述风电数据,基于增强卷积神经网络进行数据去噪,包括:训练数据集的获取:任选一个聚类中数据x
i
,基于均值为0,方差为σ2的高斯分布随机生成高斯噪声与x
i
各项相加得到带有噪声的数据信号即然后对其余所有聚类重复上述操作,得到包含c个含噪声的聚类的数据集所构建的方法由路径网络结构相同的去噪通道和提议通道基网络构成;其中去噪通道主要用于训练去噪模型,拟合提议通道则通过基于x
i
的编码-解码,生成隐藏层的辅助监督信息,以达到增强原有卷积神经网络性能的效果;假设每个基网络f(
·
)由l个隐藏层组成,其中去噪通道和提议通道的网络参数分别表示为θ={θ1,θ2,

,θ
l
}和第i层前的全部网络参数简记为θ1→
i
=θ
i
和φ1→
i
=φ
i
;采用下式(6)进行提议通道训练:基于上式(6)求得最优解φ
*
,然后定义损失函数训练去噪通道模型,如下式(7):其中:ω代表根据上述最优解φ
*
计算得到的隐藏层索引集合,为第j层的建议损失;上式求得的最优解记为θ
*
;增强卷积去噪模型的训练:基于上述两个优化目标,通过下式(8)和(9)所示每层参数的梯度对算法进行优化:的梯度对算法进行优化:其中:l
i
为第i个去噪通道的损失,为第i个和提议通道的损失;新数据去噪预测:基于训练所得去噪模型对新输入的数据信号进行去噪处理,首先判断该数据所属聚类,然后对相应的去噪数据进行预测。5.根据权利要求1至3任一项所述的方法,其特征在于,所述对去噪处理后的所述风电数据,基于布谷鸟算法进行数据缺失值填补和无效值处理,完成风电机组数据清洗,包括:参数初始化:定义布谷鸟种群规模n
p
,最大迭代次数max;随机初始化鸟窝的位置和鸟群中每个布谷鸟个体的位置并计算其适应度;根据莱维飞行更新布谷鸟个体和相应鸟窝位置并计算更新后的适应度值;
ξ=ξ0(x
j,k-x
i,k
)
ꢀꢀ
(11)l(β)=s
×
(x
k-x
best,k
) (12)其中:x
i,k
为布谷鸟个体i在迭代时刻k的位置,ξ为迭代步长系数,ξ0为步长控制量,l(β)为莱维分布,s是服从参数的莱维分布随机数,x
best,k
为当前最优解;根据上一步计算所得位置更新后的适应度确定当前的最优解,并通过贪婪选择更新全局最优解,并记录当前鸟窝位置;判断是否达到最大迭代次数max或满足其他终止条件,若满足则输出并记录待辨识的数据关系模型的参数;否则,执行上述步骤继续寻优;将风电机组运行数据输入辨识所得模型,结合模型输出判断实际运行数据的异常值和缺失值,进行进一步的数据清洗。6.一种基于增强卷积去噪算法的风电机组数据清洗装置,其特征在于,所述方法包括:采集模块,用于基于scada系统,采集风电机组的风电数据;聚类模块,用于对所述风电机组的风电数据,采用模糊c均值fcm进行数据聚类;去噪模块,用于对聚类处理后的所述风电数据,基于增强卷积神经网络进行数据去噪;处理模块,用于对去噪处理后的所述风电数据,基于布谷鸟算法进行数据缺失值填补和无效值处理,完成风电机组数据清洗。7.根据权利要求6所述的装置,其特征在于,所述采集模块,具体还用于:以t为采样间隔获取风电机组运行过程中的n个可测变量的n组实际运行数据存入所述scada系统,采样数据需尽可能包含风机在不同环境条件、时间尺度、服役时长下的运行请况;通过主元法筛选所述scada系统中各变量数据,最终得到待清洗的m个变量作为数据清洗过程的输入变量{x1,x2,

,x
m
}。8.根据权利要求6所述的装置,其特征在于,所述聚类模块,具体还用于:定义如下目标函数(1):其中:α为加权模糊性参数,c为聚类数,x
c
为聚类中心,为输入x
i
相对聚类c的隶属度:随机初始化x
c
并通过下式(3)计算μ
ic

采用下式(4)更新聚类中心向量x
c
:采用下式(5)计算适应度函数增量:当δ小于一个小的预设常值ε时,迭代过程结束,得到全部聚类。9.根据权利要求6至8任一项所述的装置,其特征在于,所述去噪模块,具体还用于:训练数据集的获取:任选一个聚类中数据x
i
,基于均值为0,方差为σ2的高斯分布随机生成高斯噪声与x
i
各项相加得到带有噪声的数据信号即然后对其余所有聚类重复上述操作,得到包含c个含噪声的聚类的数据集所构建的方法由路径网络结构相同的去噪通道和提议通道基网络构成;其中去噪通道主要用于训练去噪模型,拟合提议通道则通过基于x
i
的编码-解码,生成隐藏层的辅助监督信息,以达到增强原有卷积神经网络性能的效果;假设每个基网络f(
·
)由l个隐藏层组成,其中去噪通道和提议通道的网络参数分别表示为θ={θ1,θ2,

,θ
l
}和第i层前的全部网络参数简记为θ1→
i
=θ
i
和φ1→
i
=φ
i
;采用下式(6)进行提议通道训练:基于上式(6)求得最优解φ
*
,然后定义损失函数训练去噪通道模型,如下式(7):其中:ω代表根据上述最优解φ
*
计算得到的隐藏层索引集合,为第j层的建议损失;上式求得的最优解记为θ
*
;增强卷积去噪模型的训练:基于上述两个优化目标,通过下式(8)和(9)所示每层参数的梯度对算法进行优化:的梯度对算法进行优化:
其中:l
i
为第i个去噪通道的损失,为第i个和提议通道的损失;新数据去噪预测:基于训练所得去噪模型对新输入的数据信号进行去噪处理,首先判断该数据所属聚类,然后对相应的去噪数据进行预测。10.根据权利要求6至8任一项所述的装置,其特征在于,所述处理模块,具体还用于:参数初始化:定义布谷鸟种群规模n
p
,最大迭代次数max;随机初始化鸟窝的位置和鸟群中每个布谷鸟个体的位置并计算其适应度;根据莱维飞行更新布谷鸟个体和相应鸟窝位置并计算更新后的适应度值;ζ=ξ0(x
j,k-x
i,k
)
ꢀꢀ
(11)l(β)=s
×
(x
k-x
best,k
) (12)其中:x
i,k
为布谷鸟个体i在迭代时刻k的位置,ξ为迭代步长系数,ξ0为步长控制量,l(β)为莱维分布,s是服从参数的莱维分布随机数,x
best,k
为当前最优解;根据上一步计算所得位置更新后的适应度确定当前的最优解,并通过贪婪选择更新全局最优解,并记录当前鸟窝位置;判断是否达到最大迭代次数max或满足其他终止条件,若满足则输出并记录待辨识的数据关系模型的参数;否则,执行上述步骤继续寻优;将风电机组运行数据输入辨识所得模型,结合模型输出判断实际运行数据的异常值和缺失值,进行进一步的数据清洗。

技术总结
本公开提供一种基于增强卷积去噪算法的风电机组数据清洗方法及装置。所述方法包括:基于SCADA系统,采集风电机组的风电数据;对所述风电机组的风电数据,采用模糊C均值FCM进行数据聚类;对聚类处理后的所述风电数据,基于增强卷积神经网络进行数据去噪;对去噪处理后的所述风电数据,基于布谷鸟算法进行数据缺失值填补和无效值处理,完成风电机组数据清洗。本公开的风电机组数据清洗,为风电机组的状态监测和异常检测以及长短期风电功率预测等奠定了良好的基础。在风机数据去噪中引入了增强卷积神经网络方法,并且在神经网络隐藏层的输出附加辅助监督信息作为正则化约束,可有效提高数据去噪的效率和精确性。高数据去噪的效率和精确性。高数据去噪的效率和精确性。


技术研发人员:麻红波 杨继明 张澈 曹利蒲 陈岩磊 王传鑫 王军 田长风
受保护的技术使用者:北京华能新锐控制技术有限公司
技术研发日:2021.11.08
技术公布日:2022/3/7

最新回复(0)