一种可分布式能源并网与储能优化选择方法

专利查询8月前  74



1.本发明涉及微电网电能优化的技术领域,尤其涉及到一种可分布式能源并网与储能优化选择方法。


背景技术:

2.当前形势下,社会对电力需求的不断增长,电网的复杂性和规模不断增加,发电方单纯采用加大发电容量实时满足用电需求的传统方法显然造成巨大的浪费。智能微电网包括着分布式可再生发电电源,对电网电源是巨大的、有益补充。但分布式可再生发电电源,其对外界气候天气因素比较敏感,因此分布式可再生能源发电的功率难以控制,具有随机性、波动性等劣势特性。
3.为此,一个稳定、安全且工程意义上最优的工程调度方案亟需被设计出来,作为控制信号施加到下级储能设备中。然而,复杂微电网下,电网模型的建立与分析尤为困难,需要借助人工智能技术,实现微电网电能的科学调度,而现有的优化调度技术中,存在着以下缺点:
4.(1)当前储能设备优化方面的研究比较缓慢,所提出的算法大多是基于离线优化或静态优化(如线性规划等)。
5.(2)用电环节在不断智能化的同时,也加大了电网负荷侧的不确定性,使得传统的基于模型的静态优化算法越来越不适用。
6.(3)现有算法的收敛性缺乏往往无法得到保证,成为现有技术方案的应用瓶颈。


技术实现要素:

7.本发明的目的在于克服现有技术的不足,提供一种可分布式能源并网与储能优化选择方法,对分布式能源电量并网与否,是否考虑自行建设储能电站,对企业自建储能电站如何调度、优化使用(充放电时机选择和储能电池保护等)的研究,实现所述储能电站中储能设备在充放电控制过程中,不过充过放、不超过额定工况,且能实现经济效益最优。
8.为实现上述目的,本发明所提供的技术方案为:
9.一种可分布式能源并网与储能优化选择方法,包括以下步骤:
10.s1、采集待调度的电网区域的历史用电数据和待调度的电网区域的历史电价c
t
,其中,用电数据为一个企业用电的有功功率数据{p
l,t
};
11.s2、建立深度确定性策略梯度模型,并初始化其参数;
12.s3、定义一个企业用户的电能优化指标;
13.s4、求取给定用电设备下的基准控制策略数据;
14.s5、基于基准控制策略数据,训练深度确定性策略梯度模型的参数;
15.s6、结合企业用户的的电能优化指标,对深度确定性策略梯度模型进行在线优化训练;
16.s7、将步骤s6在线优化训练完成的深度确定性策略梯度模型求取最优解,并根据
最优解,对储能电站展开相应的控制,以控制储能设备的充放电功率,当到达t+1时刻时,返回步骤s4,继续进行优化调度。
17.进一步地,所述步骤s2中,建立的深度确定性策略梯度模型包括评判网络、目标评判网络、执行网络、目标执行网络;
18.初始化深度确定性策略梯度模型中评判网络的参数θq、目标评判网络的参数θq′
、执行网络的参数θ
μ
、目标执行网络的参数θ
μ

,其中,
19.θq=θq′
20.θ
μ
=θ
μ

21.且:
22.||θq||

≤0.1
23.||θ
μ
||

≤0.1
24.θq和θ
μ
的元素均匀分布。
25.进一步地,所述步骤s3中,定义一个企业用户的电能优化指标具体包括:
[0026][0027][0028][0029][0030]
j=j1+j2+j3+j4[0031][0032]
其中,t为调度的时间区间,c
con
为蓄电池的建造成本,n
cycle
为蓄电池可循环充放电的次数,c
cap
为蓄电池容量,μ为罚函数系数,β为蓄电池的期望平均电量,j1为用户电价的指标项、j2为考虑蓄电池寿命的指标项、j3为限制电网取电最大功率的指标项、j4抑制蓄电池过充和过放的指标项,j为总的指标项,p
b,t
为蓄电池的充放电功率,正数为放点,负数为充电,ηc为蓄电池的充电效率,ηd为蓄电池的放电效率,soc
t
为蓄电池的荷电状态,e
b,rate
为蓄电池的额定电量。
[0033]
进一步地,所述步骤s4具体包括:
[0034]
设定{u1,u2,

,u
t
}表示蓄电池的控制策略,即:u
t
=p
b,t
,其中蓄电池的充放电功率边界为u
max
和u
min
,即:
[0035]umin
≤u
t
≤u
max
,t=1,2,

,t
[0036]
同时在做蓄电池的决策时,蓄电池的soc在soc
min
和soc
max
之间,即:
[0037]
soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1
[0038]
过程包括:
[0039]
s4-1、记录循环次数j=1,并给定最大循环次数nj;
[0040]
s4-2、随机选取u
min
≤u
t
≤u
max
,t=1,2,

,t;
[0041]
s4-3、对于如果u
t
≤u
min
,则u
t
=u
min
;对于如果u
t
≤u
max
,则u
t
=u
max

[0042]
s4-4、对于采取步骤s4-3得到的u
t
;由式得soc
t+1
,若soc
t+1
不满足式soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1的约束,则不改变u
t
的符号,减小|u
t
|,使得soc
t+1
=soc
min
或soc
t+1
=soc
max

[0043]
s4-5、计算第j次的指标函数数值j,记录第j次实验的新能源发电输出功率、蓄电池的荷电状态、用电负荷功率,以及蓄电池的充放电功率序列
[0044]
s4-6、若j≤nj,j=j+1,返回步骤s4-2;否则结束。
[0045]
进一步地,所述步骤s5具体训练基准的评判网络参数和执行网络参数,过程包括:
[0046]
在步骤s4所采集的基准控制策略数据中,选取指标值在前30%的样本序列,选取过程如下,其中前30%的指标值满足要求为被选取的样本中最大的指标值:
[0047]
s5-1、令i=1,对于第i个序列t=1,2,

,t,若其指标则选取其作为基准控制策略的训练样本,否则抛弃该组数据;记被选取的i的序号在子集i中;
[0048]
s5-2、若i≤nj,i=i+1,则回到步骤s5-1;
[0049]
s5-3、对于所有的i∈i,以为执行网络的输入样本,作为执行网络的输出样本,采用监督式学习的方式训练执行网络;
[0050]
s5-4、对于所有的i∈i,以为评判网络的输入样本,作为评判网络的输出样本,采用监督式学习的方式训练评判网络。
[0051]
进一步地,所述步骤s6中,保持评判网络和目标评判网络的权重不变,利用采集到的系统状态循环修正执行网络权值,直到找到能够使当前评判网络的输出最小的控制策略;基于更新的执行网络权重,首先检验其是否满足电能调度的安全性要求,若满足,更新执行网络的权重和目标执行网络的权重;若不满足,不更新执行网络的权重。
[0052]
进一步地,所述步骤s6具体如下:
[0053]
s6-1、在t时刻,记录测量到的蓄电池的soc
t
的数值,以及光伏发电的输出功率p
pv,t
、p
pv,t-1
,动态电价c
t
、c
t-1
,用户的用电负荷p
l,t
、p
l,t-1
,评判网络的输出可表示为
[0054]
s6-2、计算当前蓄电池电量下的充放电策略:
[0055][0056]
s6-3、检查步骤s6-2得出的是否满足约束u
min
≤u
t
≤u
max
,t=1,2,

,t和soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1;
[0057]
s6-4、如果则如果则u
t*
=u
max

[0058]
s6-5、采取步骤s4-3中的得到的由公式得soc
t+1
,若soc
t+1
不满足公式soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1的约束,则不改变的符号,减小使得soc
t+1
=soc
min
或soc
t+1
=soc
max

[0059]
s6-6、更新执行网络的参数;以{p
r,t-1
,p
l,t-1
,c
t-1
,soc
t
}为执行网络的输入样本,作为执行网络的输出样本,修改执行网络的权重参数θ
μ
;并根据下式更新目标执行网络权重:
[0060]
θ
μ


τaθ
μ
+(1-τa)θ
μ

[0061]
其中τa为动量因子;
[0062]
s6-7、更新执行网络的参数;计算
[0063][0064]
以{p
r,t-1
,p
l,t-1
,c
t-1
,soc
t
}为评判网络的输入样本,作为评判网络的输出样本,修改执行网络的权重参数θq;并根据下式更新目标执行网络权重:
[0065]
θq′

τcθq+(1-τc)θq′

[0066]
与现有技术相比,本方案原理及优点如下:
[0067]
1)本方案基于人工智能技术,考虑智能微网,特别是企业储能电站的运行特征,提出用户侧可分布式能源并网与储能优化选择的方法。突破传统的基于模型的、静态优化方法,设计基于深度确定性策略梯度模型,提出能够使得算法收敛的参数训练过程,计算智能微电网中储能电站最优充放电功率,以实现智能微电网电能最优调度。
[0068]
2)本方案对企业自建储能电站充分考量了储能电站的运行特征,实现储能电站中储能设备在充放电控制过程中,不过充过放、不超过额定工况,实现经济效益最优。
[0069]
3)本方案在降低用户用电电量的峰谷差的同时,降低用户的用电成本。还特别考虑了蓄电池的寿命衰减,降低电能储存的长期开支。
附图说明
[0070]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0071]
图1为本发明一种可分布式能源并网与储能优化选择方法的原理流程图;
[0072]
图2为深度确定性策略梯度模型的基本框架。
具体实施方式
[0073]
下面结合具体实施例对本发明作进一步说明:
[0074]
如图1和图2所示,本实施例所述的一种可分布式能源并网与储能优化选择方法,包括以下步骤:
[0075]
s1、采集待调度的电网区域的历史用电数据和待调度的电网区域的历史电价c
t
,其中,用电数据为一个企业用电的有功功率数据{p
l,t
};
[0076]
s2、建立深度确定性策略梯度模型,并初始化其参数;
[0077]
建立的深度确定性策略梯度模型包括评判网络、目标评判网络、执行网络、目标执行网络;
[0078]
初始化深度确定性策略梯度模型中评判网络的参数θq、目标评判网络的参数θq′
、执行网络的参数θ
μ

、目标执行网络的参数θ
μ

,其中,
[0079]
θq=θq′
[0080]
θ
μ
=θ
μ

[0081]
且:
[0082]
||θq||

≤0.1
[0083]
||θ
μ
||

≤0.1
[0084]
θq和θ
μ
的元素均匀分布。
[0085]
s3、定义一个企业用户的电能优化指标,包括:
[0086][0087][0088][0089][0090]
j=j1+j2+j3+j4[0091][0092]
其中,t为调度的时间区间,c
con
为蓄电池的建造成本,n
cycle
为蓄电池可循环充放电的次数,c
cap
为蓄电池容量,μ为罚函数系数,β为蓄电池的期望平均电量,j1为用户电价的指
标项、j2为考虑蓄电池寿命的指标项、j3为限制电网取电最大功率的指标项、j4抑制蓄电池过充和过放的指标项,j为总的指标项,p
b,t
为蓄电池的充放电功率,正数为放点,负数为充电,ηc为蓄电池的充电效率,ηd为蓄电池的放电效率,soc
t
为蓄电池的荷电状态,e
b,rate
为蓄电池的额定电量。
[0093]
s4、求取给定用电设备下的基准控制策略数据;
[0094]
设定{u1,u2,

,u
t
}表示蓄电池的控制策略,即:u
t
=p
b,t
,其中蓄电池的充放电功率边界为u
max
和u
min
,即:
[0095]umin
≤u
t
≤u
max
,t=1,2,

,t
[0096]
同时在做蓄电池的决策时,蓄电池的soc在soc
min
和soc
max
之间,即:
[0097]
soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1
[0098]
过程包括:
[0099]
s4-1、记录循环次数j=1,并给定最大循环次数nj;
[0100]
s4-2、随机选取u
min
≤u
t
≤u
max
,t=1,2,

,t;
[0101]
s4-3、对于如果u
t
≤u
min
,则u
t
=u
min
;对于如果u
t
≤u
max
,则u
t
=u
max

[0102]
s4-4、对于采取步骤s4-3得到的u
t
;由式得soc
t+1
,若soc
t+1
不满足式soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1的约束,则不改变u
t
的符号,减小|u
t
|,使得soc
t+1
=soc
min
或soc
t+1
=soc
max

[0103]
s4-5、计算第j次的指标函数数值j,记录第j次实验的新能源发电输出功率、蓄电池的荷电状态、用电负荷功率,以及蓄电池的充放电功率序列
[0104]
s4-6、若j≤nj,j=j+1,返回步骤s4-2;否则结束。
[0105]
s5、基于基准控制策略数据,训练深度确定性策略梯度模型的参数;
[0106]
本步骤具体训练基准的评判网络参数和执行网络参数,过程包括:
[0107]
在步骤s4所采集的基准控制策略数据中,选取指标值在前30%的样本序列,选取过程如下,其中前30%的指标值满足要求为被选取的样本中最大的指标值:
[0108]
s5-1、令i=1,对于第i个序列t=1,2,

,t,若其指标则选取其作为基准控制策略的训练样本,否则抛弃该组数据;记被选取的i的序号在子集i中;
[0109]
s5-2、若i≤nj,i=i+1,则回到步骤s5-1;
[0110]
s5-3、对于所有的i∈i,以为执行网络的输入样本,作为执行网络的输出样本,采用监督式学习的方式训练执行网络;
[0111]
s5-4、对于所有的i∈i,以为评判网络的输入样本,
作为评判网络的输出样本,采用监督式学习的方式训练评判网络。
[0112]
s6、结合企业用户的的电能优化指标,对深度确定性策略梯度模型进行在线优化训练;
[0113]
其中,保持评判网络和目标评判网络的权重不变,利用采集到的系统状态循环修正执行网络权值,直到找到能够使当前评判网络的输出最小的控制策略;基于更新的执行网络权重,首先检验其是否满足电能调度的安全性要求,若满足,更新执行网络的权重和目标执行网络的权重;若不满足,不更新执行网络的权重。
[0114]
具体过程如下:
[0115]
s6-1、在t时刻,记录测量到的蓄电池的soc
t
的数值,以及光伏发电的输出功率p
pv,t
、p
pv,t-1
,动态电价c
t
、c
t-1
,用户的用电负荷p
l,t
、p
l,t-1
,评判网络的输出可表示为
[0116]
s6-2、计算当前蓄电池电量下的充放电策略:
[0117][0118]
s6-3、检查步骤s6-2得出的是否满足约束u
min
≤u
t
≤u
max
,t=1,2,

,t和soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1;
[0119]
s6-4、如果则如果则u
t*
=umax;
[0120]
s6-5、采取步骤s4-3中的得到的由公式得soc
t+1
,若soc
t+1
不满足公式soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1的约束,则不改变的符号,减小使得soc
t+1
=soc
min
或soc
t+1
=soc
max

[0121]
s6-6、更新执行网络的参数;以{p
r,t-1
,p
l,t-1
,c
t-1
,soc
t
}为执行网络的输入样本,作为执行网络的输出样本,修改执行网络的权重参数θ
μ
;并根据下式更新目标执行网络权重:
[0122]
θ
μ


τaθ
μ
+(1-τa)θ
μ

[0123]
其中τa为动量因子;
[0124]
s6-7、更新执行网络的参数;计算
[0125]
[0126]
以{p
r,t-1
,p
l,t-1
,c
t-1
,soc
t
}为评判网络的输入样本,作为评判网络的输出样本,修改执行网络的权重参数θq;并根据下式更新目标执行网络权重:
[0127]
θq′

τcθq+(1-τc)θq′

[0128]
s7、将步骤s6在线优化训练完成的深度确定性策略梯度模型求取最优解,并根据最优解,对储能电站展开相应的控制,以控制储能设备的充放电功率,当到达t+1时刻时,返回步骤s4,继续进行优化调度。
[0129]
以上所述之实施例子只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

技术特征:
1.一种可分布式能源并网与储能优化选择方法,其特征在于,包括以下步骤:s1、采集待调度的电网区域的历史用电数据和待调度的电网区域的历史电价c
t
,其中,用电数据为企业用电的有功功率数据{p
l,t
};s2、建立深度确定性策略梯度模型,并初始化其参数;s3、定义企业用户的电能优化指标;s4、求取给定用电设备下的基准控制策略数据;s5、基于基准控制策略数据,训练深度确定性策略梯度模型的参数;s6、结合企业用户的的电能优化指标,对深度确定性策略梯度模型进行在线优化训练;s7、将步骤s6在线优化训练完成的深度确定性策略梯度模型求取最优解,并根据最优解,对储能电站展开相应的控制,以控制储能设备的充放电功率,当到达下一小时时,返回步骤s4,继续进行优化调度。2.根据权利要求1所述的一种可分布式能源并网与储能优化选择方法,其特征在于,所述步骤s2中,建立的深度确定性策略梯度模型包括评判网络、目标评判网络、执行网络、目标执行网络;初始化深度确定性策略梯度模型中评判网络的参数θ
q
、目标评判网络的参数θ
q

、执行网络的参数θ
μ
、目标执行网络的参数θ
μ

,其中,θ
q
=θ
q

θ
μ
=θ
μ

且:||θ
q
||

≤0.1||θ
μ
||

≤0.1θ
q
和θ
μ
的元素均匀分布。3.根据权利要求2所述的一种可分布式能源并网与储能优化选择方法,其特征在于,所述步骤s3中,定义一个企业用户的电能优化指标具体包括:述步骤s3中,定义一个企业用户的电能优化指标具体包括:述步骤s3中,定义一个企业用户的电能优化指标具体包括:述步骤s3中,定义一个企业用户的电能优化指标具体包括:j=j1+j2+j3+j4其中,t为调度的时间区间,c
con
为蓄电池的建造成本,n
cycle
为蓄电池可循环充放电的次数,c
cap
为蓄电池容量,μ为罚函数系数,β为蓄电池的期望平均电量,j1为用户电价的指标项、j2为考虑蓄电池寿命的指标项、j3为限制电网取电最大功率的指标项、j4抑制蓄电池过充和过放的指标项,j为总的指标项,p
b,t
为蓄电池的充放电功率,正数为放点,负数为充电,
η
c
为蓄电池的充电效率,η
d
为蓄电池的放电效率,soc
t
为蓄电池的荷电状态,e
b,rate
为蓄电池的额定电量。4.根据权利要求3所述的一种可分布式能源并网与储能优化选择方法,其特征在于,所述步骤s4具体包括:设定{u1,u2,

,u
t
}表示蓄电池的控制策略,即:u
t
=p
b,t
,其中蓄电池的充放电功率边界为u
max
和u
min
,即:u
min
≤u
t
≤u
max
,t=1,2,

,t同时在做蓄电池的决策时,蓄电池的soc在soc
min
和soc
max
之间,即:soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1过程包括:s4-1、记录循环次数j=1,并给定最大循环次数n
j
;s4-2、随机选取u
min
≤u
t
≤u
max
,t=1,2,

,t;s4-3、对于如果u
t
≤u
min
,则u
t
=u
min
;对于如果u
t
≤u
max
,则u
t
=u
max
;s4-4、对于采取步骤s4-3得到的u
t
;由式得soc
t+1
,若soc
t+1
不满足式soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1的约束,则不改变u
t
的符号,减小|u
t
|,使得soc
t+1
=soc
min
或soc
t+1
=soc
max
;s4-5、计算第j次的指标函数数值j,记录第j次实验的新能源发电输出功率、蓄电池的荷电状态、用电负荷功率,以及蓄电池的充放电功率序列s4-6、若j≤n
j
,j=j+1,返回步骤s4-2;否则结束。5.根据权利要求4所述的一种可分布式能源并网与储能优化选择方法,其特征在于,所述步骤s5具体训练基准的评判网络参数和执行网络参数,过程包括:在步骤s4所采集的基准控制策略数据中,选取指标值在前30%的样本序列,选取过程如下,其中前30%的指标值满足要求0%的指标值满足要求为被选取的样本中最大的指标值:s5-1、令i=1,对于第i个序列若其指标则选取其作为基准控制策略的训练样本,否则抛弃该组数据;记被选取的i的序号在子集i中;s5-2、若i≤n
j
,i=i+1,则回到步骤s5-1;s5-3、对于所有的i∈i,以为执行网络的输入样本,作为执行网络的输出样本,采用监督式学习的方式训练执行网络;s5-4、对于所有的i∈i,以为评判网络的输入样本,作为评判网络的输出样本,采用监督式学习的方式训练评判网络。6.根据权利要求5所述的一种可分布式能源并网与储能优化选择方法,其特征在于,所述步骤s6中,保持评判网络和目标评判网络的权重不变,利用采集到的系统状态循环修正
执行网络权值,直到找到能够使当前评判网络的输出最小的控制策略;基于更新的执行网络权重,首先检验其是否满足电能调度的安全性要求,若满足,更新执行网络的权重和目标执行网络的权重;若不满足,不更新执行网络的权重。7.根据权利要求6所述的一种可分布式能源并网与储能优化选择方法,其特征在于,所述步骤s6具体如下:s6-1、在t时刻,记录测量到的蓄电池的soc
t
的数值,以及光伏发电的输出功率p
pv,t
、p
pv,t-1
,动态电价c
t
、c
t-1
,用户的用电负荷p
l,t
、p
l,t-1
,评判网络的输出可表示为s6-2、计算当前蓄电池电量下的充放电策略:s6-3、检查步骤s6-2得出的是否满足约束u
min
≤u
t
≤u
max
,t=1,2,

,t和soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1;s6-4、如果则如果则s6-5、采取步骤s4-3中的得到的由公式得soc
t+1
,若soc
t+1
不满足公式soc
min
≤soc
t
≤soc
max
,t=1,2,

,t+1的约束,则不改变的符号,减小使得soc
t+1
=soc
min
或soc
t+1
=soc
max
;s6-6、更新执行网络的参数;以{p
r,t-1
,p
l,t-1
,c
t-1
,soc
t
}为执行网络的输入样本,作为执行网络的输出样本,修改执行网络的权重参数θ
μ
;并根据下式更新目标执行网络权重:θ
μ


τ
a
θ
μ
+(1-τ
a

μ

其中τ
a
为动量因子;s6-7、更新执行网络的参数;计算以{p
r,t-1
,p
l,t-1
,c
t-1
,soc
t
}为评判网络的输入样本,作为评判网络的输出样本,修改执行网络的权重参数θ
q
;并根据下式更新目标执行网络权重:θ
q


τ
c
θ
q
+(1-τ
c

q



技术总结
本发明公开了一种可分布式能源并网与储能优化选择方法,基于人工智能技术,考虑智能微网,特别是企业储能电站的运行特征,提出用户侧可分布式能源并网与储能优化选择的方法。突破传统的基于模型的、静态优化方法,设计基于深度确定性策略梯度模型,提出能够使得算法收敛的参数训练过程,计算智能微电网中储能电站最优充放电功率,以实现智能微电网电能最优调度。对企业自建储能电站充分考量了储能电站的运行特征,实现储能电站中储能设备在充放电控制过程中,不过充过放、不超过额定工况,实现经济效益最优。在降低用户用电电量的峰谷差的同时,降低用户的用电成本。还特别考虑了蓄电池的寿命衰减,降低电能储存的长期开支。降低电能储存的长期开支。降低电能储存的长期开支。


技术研发人员:苏梓骏
受保护的技术使用者:广东工业大学
技术研发日:2021.12.13
技术公布日:2022/3/8

最新回复(0)