1.本技术涉及电力故障检测技术领域,特别是涉及一种基于加权极限学习机的电力故障预测方法、装置、计算机设备和存储介质。
背景技术:
2.近年来,大数据成为一种新兴生产力,而电网是最为庞大复杂的物联网系统,电网中的各种电力检测数据出现了海量增长。传统技术中,根据电力检测数据生成训练数据集,并通过采用机器学习方法构建现有电力故障预测的极限学习机分类模型,从而实现对电力故障进行预测。然而,现有电力故障预测的极限学习机分类模型在进行故障预测时识别效果较差以及准确度较低,从而导致无法及时预测出相应的电力故障并予以处理。
技术实现要素:
3.基于此,有必要针对上述技术问题,提供一种能够提升电力故障预测时识别效果和准确度的加权极限学习机的电力故障预测方法、装置、计算机设备和存储介质。
4.第一方面,提供了一种基于加权极限学习机的电力故障预测方法,所述方法包括:
5.根据电力系统的故障检测特征数据,构建模型训练的样本数据集;
6.遍历样本数据集,得到样本数据集中各样本的样本类别、样本数据集的样本总数、样本数据集的正类样本的总数以及样本数据集的负类样本的总数;其中,样本类别包括正类样本和负类样本;
7.为各样本分配与样本的样本类别所对应的样本权重,并根据各样本的样本类别所对应的样本权重生成加权矩阵;其中,正类样本的样本权重根据第一目标比例的对数的倒数确定;负类样本的样本权重根据第二目标比例的对数的倒数确定;第一目标比例是指正类样本的总数和样本总数的比例;第二目标比例是指负类样本的总数和样本总数的比例;
8.基于改进加权elm模型iwelm算法,根据加权矩阵和样本数据集进行训练处理,得到加权极限学习机分类模型;
9.根据加权极限学习机分类模型,对电力系统的电力故障进行预测,并输出预测结果。
10.在其中一个实施例中,基于以下表达式得到样本的样本类别所对应的样本权重:
[0011][0012]
其中,w
ii
为所述样本的样本类别所对应的样本权重;λ为调整因子,且λ》1;#(ti)为样本的样本类别所对应的样本总数;为样本总数。
[0013]
在其中一个实施例中,根据电力系统的故障检测特征数据,构建模型训练的样本数据集的步骤包括:获取电力系统的初始检测数据;初始检测数据包括pms数据、客服工单
数据、在线监测数据、线路巡视数据、辅助监控数据和历史故障数据中的任意一种或任意组合;对初始检测数据进行数据抽取、数据清洗转换和数据加载处理,生成故障检测特征数据。
[0014]
在其中一个实施例中,方法还包括:根据预测结果,确定是否进行电力故障预警。
[0015]
第二方面,提供了一种基于加权极限学习机的电力故障预测装置,所述装置包括数据集构建模块、统计分析模块、权重分配模块、模型训练模块和故障预测模块。
[0016]
其中,数据集构建模块用于根据电力系统的故障检测特征数据,构建模型训练的样本数据集;统计分析模块用于遍历样本数据集,得到样本数据集中各样本的样本类别、样本数据集的样本总数、样本数据集的正类样本的总数以及样本数据集的负类样本的总数;其中,样本类别包括正类样本和负类样本;权重分配模块用于为各样本分配与样本的样本类别所对应的样本权重,并根据各样本的样本类别所对应的样本权重生成加权矩阵;其中,正类样本的样本权重根据第一目标比例的对数的倒数确定;负类样本的样本权重根据第二目标比例的对数的倒数确定;第一目标比例是指正类样本的总数和样本总数的比例;第二目标比例是指负类样本的总数和样本总数的比例;模型训练模块用于基于改进加权elm模型iwelm算法,根据加权矩阵和样本数据集进行训练处理,得到加权极限学习机分类模型;故障预测模块用于根据加权极限学习机分类模型,对电力系统的电力故障进行预测,并输出预测结果。
[0017]
在其中一个实施例中,权重分配模块基于以下表达式得到样本的样本类别所对应的样本权重:
[0018][0019]
其中,w
ii
为所述样本的样本类别所对应的样本权重;λ为调整因子,且λ》1;#(ti)为样本的样本类别所对应的样本总数;为样本总数。
[0020]
在其中一个实施例中,数据集构建模块包括数据获取单元和数据处理单元。
[0021]
其中,数据获取单元用于获取电力系统的初始检测数据;初始检测数据包括pms数据、客服工单数据、在线监测数据、线路巡视数据、辅助监控数据和历史故障数据中的任意一种或任意组合;数据处理单元用于对初始检测数据进行数据抽取、数据清洗转换和数据加载处理,生成故障检测特征数据。
[0022]
在其中一个实施例中,所述装置还包括故障预警模块。
[0023]
其中,故障预警模块用于根据预测结果,确定是否进行电力故障预警。
[0024]
第三方面,提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行所述计算机程序时实现上述方法实施例中任一方法的步骤。
[0025]
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中任一方法的步骤。
[0026]
上述基于加权极限学习机的电力故障预测方法、装置、计算机设备和存储介质,通过根据电力系统的故障检测特征数据,构建模型训练的样本数据集;而后,遍历样本数据
集,得到样本数据集中各样本的样本类别、样本数据集的样本总数、样本数据集的正类样本的总数以及样本数据集的负类样本的总数;接着,为各样本分配与样本的样本类别所对应的样本权重,并根据各样本的样本类别所对应的样本权重生成加权矩阵;且,正类样本的样本权重根据第一目标比例的对数的倒数确定,以及负类样本的样本权重根据第二目标比例的对数的倒数确定;然后,基于改进加权elm模型iwelm算法,根据加权矩阵和样本数据集进行训练处理,得到加权极限学习机分类模型;最后,根据加权极限学习机分类模型,对电力系统的电力故障进行预测,并输出准确的预测结果。可以理解的是,通过对样本的样本类别所对应的样本总数和样本总数的比例求取对数的倒数处理,能够有效地控制某样本类别所对应的样本总数的增长率,避免正类样本和负类样本对应的总数差别过大的问题,也就是说能够避免样本数据集中样本不均衡的问题。上述方法相对于仅将对样本的样本类别所对应的样本总数和样本总数的比例求取倒数作为样本权重,使得加权极限学习机分类模型的性能最优,提升了电力故障预测时的识别效果和准确度。
附图说明
[0027]
图1为一个实施例中基于加权极限学习机的电力故障预测方法的第一流程示意图;
[0028]
图2为一个实施例中根据电力系统的故障检测特征数据,构建模型训练的样本数据集的步骤的流程示意图;
[0029]
图3为另一个实施例中基于加权极限学习机的电力故障预测方法的第二流程示意图;
[0030]
图4为一个实施例中基于加权极限学习机的电力故障预测装置的第一结构框图;
[0031]
图5为一个实施例中数据集构建模块的结构框图;
[0032]
图6为另一个实施例中基于加权极限学习机的电力故障预测装置的第二结构框图;
[0033]
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
[0034]
为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
[0035]
在一个实施例中,如图1所示,提供了一种基于加权极限学习机的电力故障预测方法,本实施例以该方法应用于计算机设备进行举例说明。本实施例中,该方法包括以下步骤102至步骤110。
[0036]
步骤102,根据电力系统的故障检测特征数据,构建模型训练的样本数据集。
[0037]
其中,计算机设备中可以设置有故障检测特征数据库,故障检测特征数据库中存储有电力系统的故障检测特征数据。计算机设备可以根据电力系统的故障检测特征数据,即可构建模型训练的样本数据集。
[0038]
在其中一个实施例中,如图2所示,根据电力系统的故障检测特征数据,构建模型训练的样本数据集的步骤包括步骤201和步骤202。
[0039]
步骤201,获取电力系统的初始检测数据。
[0040]
其中,初始检测数据包括pms数据、客服工单数据、在线监测数据、线路巡视数据、辅助监控数据和历史故障数据中的任意一种或任意组合。在电力系统中设置有各类检测设备,各类检测设备用于分别采集pms数据、客服工单数据、在线监测数据、线路巡视数据和辅助监控数据。计算机设备中可以设置初始检测数据库,该初始检测数据库用于获取和存储各类检测设备采集的pms数据、客服工单数据、在线监测数据、线路巡视数据和辅助监控数据,初始检测数据库还用于存储历史故障数据。
[0041]
步骤202,对初始检测数据进行数据抽取、数据清洗转换和数据加载处理,生成故障检测特征数据。
[0042]
其中,计算机设备对上述初始检测数据进行数据抽取、数据清洗转换和数据加载处理,即可生成故障检测特征数据。
[0043]
在本实施例中,通过获取包括pms数据、客服工单数据、在线监测数据、线路巡视数据、辅助监控数据和历史故障数据中的任意一种或任意组合的初始检测数据,并通过对初始检测数据进行数据抽取、数据清洗转换和数据加载处理,即可生成准确的故障检测特征数据,也就提升了电力故障预测时的识别效果和准确度。
[0044]
步骤104,遍历样本数据集,得到样本数据集中各样本的样本类别、样本数据集的样本总数、样本数据集的正类样本的总数以及样本数据集的负类样本的总数。
[0045]
其中,样本数据集中各样本的样本类别包括正类样本和负类样本。正类样本是指样本数据集中故障检测特征数据大于故障检测特征数据阈值的样本。负类样本是指样本数据集中故障检测特征数据小于故障检测特征数据阈值的样本。计算机设备通过遍历样本数据集,从而完成对样本数据集中各样本的统计分析,也就可以得到样本数据集中各样本的样本类别、样本数据集的样本总数、样本数据集的正类样本的总数以及样本数据集的负类样本的总数。
[0046]
步骤106,为各样本分配与样本的样本类别所对应的样本权重,并根据各样本的样本类别所对应的样本权重生成加权矩阵。
[0047]
其中,正类样本的样本权重根据第一目标比例的对数的倒数确定;负类样本的样本权重根据第二目标比例的对数的倒数确定;第一目标比例是指正类样本的总数和样本总数的比例;第二目标比例是指负类样本的总数和样本总数的比例。
[0048]
计算机设备可以根据样本数据集中的各样本分配与样本的样本类别所对应的样本权值。可以理解的是,若样本对应的样本类型为正类样本,则给该样本分配的样本权重为根据第一目标比例的对数的倒数确定的正类样本的样本权重;若样本对应的样本类型为负类样本,则给该样本分配的样本权重为根据第二目标比例的对数的倒数确定的负类样本的样本权重。计算机设备根据样本数据集中各样本的样本类别所对应的样本权重即可生成加权矩阵。
[0049]
在其中一个实施例中,基于以下表达式得到样本的样本类别所对应的样本权重:
[0050]
[0051]
其中,w
ii
为所述样本的样本类别所对应的样本权重;λ为调整因子,且λ>1;#(ti)为样本的样本类别所对应的样本总数;为样本总数。
[0052]
在本实施例中,样本权重的表达式中通过对样本的样本类别所对应的样本总数和样本总数的比例求取对数的处理,能够有效地控制某样本类别所对应的样本总数的增长率,避免正类样本和负类样本对应的总数差别过大的问题;同时,在计算权重加上调整因子λ,能有效避免对数出现负数和零的情况而不能获得正确的样本权重。因此,提升了电力故障预测时的识别效果和准确度。
[0053]
步骤108,基于改进加权elm模型iwelm算法,根据加权矩阵和样本数据集进行训练处理,得到加权极限学习机分类模型。
[0054]
其中,计算机设备根据各样本的样本类别所对应的样本权重即可生成加权矩阵。而后,计算机设备可以基于改进加权elm模型iwelm算法,根据加权矩阵和样本数据集进行训练处理,即可得到准确的加权极限学习机分类模型。
[0055]
在一个具体示例中,改进加权elm模型iwelm算法是一类基于前馈神经网络构建的机器学习方法,广泛应用于分类、回归及特征学习问题。设输入层包含n个输入神经元结点,每个输入神经元结点对应样本的一个特征;隐藏层包含l个隐藏层神经元结点;输出层包含m个输出神经元结点。
[0056]
对于n个任意不同的样本(xj,tj),每个样本是一个行向量,xj的长度为n,对应样本特征的个数,tj为样本标签。
[0057]
其中,xj=[x
j1
,x
j2
,...,x
jn
]
t
∈rn[0058]
tj=[t
j1
,t
j2
,
…
,t
jm
]
t
∈rm[0059]
所以拥有l个隐藏层结点和激活函数g(
·
)的单隐层前馈神经网络的数学模型可以表示为:
[0060][0061]
其中,g(
·
)为激活函数,表示第i个隐藏层结点到所有输入结点之间的权值组成的向量;bi表示ai=[a
i1
,a
i2
,
…
,a
in
]
t
第i个隐结点的阈值;ai和bi的值均是在区间[-1,1]之间随机生成。
[0062]
对于模型训练的样本数据集,其对应的单隐层前向网络的优化目标是使得预测误差最小,即
[0063][0064]
即存在βi,ai和bi,使得:
[0065][0066]
写成矩阵形式可表示为:
[0067]h·
β=t
[0068]
其中,h为隐藏层节点的输出矩阵,β为输出权重,t为期望的真值。
[0069][0070][0071]
由于输入层至隐藏层的权重为随机初始化,且不参与计算。当此权重被随机初始化后,隐藏层至输出层的权重就被唯一确定。则输出权重被确定为:
[0072][0073]
为隐层输出矩阵的moore-penrose广义逆。根据其定义,则为该网络的最小范数最小二乘解,保证了elm具有较强的泛化性能。而改进加权elm模型将复杂的神经网络训练过程简化为矩阵运算问题,使得训练时间大幅度缩减。
[0074]
welm算法使用代价敏感技术在改进加权elm模型的基础上引入误分类代价矩阵w,为不同种类的样本赋予不同的权值,用以平衡正类样本和负类样本对训练的影响。welm算法优化问题的求解类似于svm,可表示为:
[0075][0076]
其中,w为一个n
×
n的对角阵,w
ii
是w中的对角元素,对应第i个样本的样本类别所对应的样本权重,εi是一个长度为m向量,代表样本数据集中第i个样本相对于m个输出结点的训练错误。而c是正则化参数,用于平衡总体样本的最小错误和分类面的最大间隔距离。
[0077][0078]
其中,w
ii
为所述样本的样本类别所对应的样本权重;λ为调整因子,且λ》1;#(ti)为样本的样本类别所对应的样本总数;为样本总数。
[0079]
根据kkt条件,其对偶优化问题可以化解为公式:
[0080][0081]
其中,拉普拉斯算子ai为xi的常数量,对上式每个变量求偏导,得kkt优化条件:
[0082][0083]
于是可以得到β的解:
[0084][0085]
其中,e是单位阵,l是elm隐藏层节点个数,n是输入样本的特征数。以上仅为具体示例,实际应用中可以根据需求而灵活设置,在此不进行限制。
[0086]
步骤110,根据加权极限学习机分类模型,对电力系统的电力故障进行预测,并输出预测结果。
[0087]
其中,计算机设备基于改进加权elm模型iwelm算法,根据加权矩阵和样本数据集进行训练处理,得到加权极限学习机分类模型;且,根据上述加权极限学习机分类模型,即可完成对电力系统的电力故障进行预测,并输出预测结果。
[0088]
基于此,通过根据电力系统的故障检测特征数据,构建模型训练的样本数据集;而后,遍历样本数据集,得到样本数据集中各样本的样本类别、样本数据集的样本总数、样本数据集的正类样本的总数以及样本数据集的负类样本的总数;接着,为各样本分配与样本的样本类别所对应的样本权重,并根据各样本的样本类别所对应的样本权重生成加权矩阵;且,正类样本的样本权重根据第一目标比例的对数的倒数确定,以及负类样本的样本权重根据第二目标比例的对数的倒数确定;然后,基于改进加权elm模型iwelm算法,根据加权矩阵和样本数据集进行训练处理,得到加权极限学习机分类模型;最后,根据加权极限学习机分类模型,对电力系统的电力故障进行预测,并输出准确的预测结果。可以理解的是,通过对样本的样本类别所对应的样本总数和样本总数的比例求取对数的倒数处理,能够有效地控制某样本类别所对应的样本总数的增长率,避免正类样本和负类样本对应的总数差别过大的问题,也就是说能够避免样本数据集中样本不均衡的问题。上述方法相对于仅将对样本的样本类别所对应的样本总数和样本总数的比例求取倒数作为样本权重,使得加权极限学习机分类模型的性能最优,提升了电力故障预测时的识别效果和准确度,从而避免工作人员无法及时预测出相应的电力故障并予以处理。
[0089]
在其中一个实施例中,如图3所示,上述方法还包括步骤112。
[0090]
步骤112,根据预测结果,确定是否进行电力故障预警。
[0091]
计算机设备根据加权极限学习机分类模型,对电力系统的电力故障进行预测,并输出预测结果;而后,即可根据预测结果,确定是否进行电力故障预警,从而实现及时提醒工作人员出现相应的电力故障并予以处理,提高了电力故障预测的便利性。
[0092]
应该理解的是,虽然图1-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-3中的至少一
部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0093]
在一个实施例中,如图4所示,提供了一种基于加权极限学习机的电力故障预测装置,所述装置包括数据集构建模块410、统计分析模块420、权重分配模块430、模型训练模块440和故障预测模块450。
[0094]
其中,数据集构建模块410用于根据电力系统的故障检测特征数据,构建模型训练的样本数据集;统计分析模块420用于遍历样本数据集,得到样本数据集中各样本的样本类别、样本数据集的样本总数、样本数据集的正类样本的总数以及样本数据集的负类样本的总数;其中,样本类别包括正类样本和负类样本;权重分配模块430用于为各样本分配与样本的样本类别所对应的样本权重,并根据各样本的样本类别所对应的样本权重生成加权矩阵;其中,正类样本的样本权重根据第一目标比例的对数的倒数确定;负类样本的样本权重根据第二目标比例的对数的倒数确定;第一目标比例是指正类样本的总数和样本总数的比例;第二目标比例是指负类样本的总数和样本总数的比例;模型训练模块440用于基于改进加权elm模型iwelm算法,根据加权矩阵和样本数据集进行训练处理,得到加权极限学习机分类模型;故障预测模块450用于根据加权极限学习机分类模型,对电力系统的电力故障进行预测,并输出预测结果。
[0095]
在其中一个实施例中,权重分配模块基于以下表达式得到样本的样本类别所对应的样本权重:
[0096][0097]
其中,w
ii
为所述样本的样本类别所对应的样本权重;λ为调整因子,且λ》1;#(ti)为样本的样本类别所对应的样本总数;为样本总数。
[0098]
在其中一个实施例中,如图5所示,数据集构建模块410包括数据获取单411元和数据处理单元412。
[0099]
其中,数据获取单元用于获取电力系统的初始检测数据;初始检测数据包括pms数据、客服工单数据、在线监测数据、线路巡视数据、辅助监控数据和历史故障数据中的任意一种或任意组合;数据处理单元用于对初始检测数据进行数据抽取、数据清洗转换和数据加载处理,生成故障检测特征数据。
[0100]
在其中一个实施例中,如图6所示,所述装置还包括故障预警模块460。
[0101]
其中,故障预警模块460用于根据预测结果,确定是否进行电力故障预警。
[0102]
关于基于加权极限学习机的电力故障预测装置的具体限定可以参见上文中对于基于加权极限学习机的电力故障预测方法的限定,在此不再赘述。上述基于加权极限学习机的电力故障预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于
计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0103]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储电力系统的故障检测特征数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于加权极限学习机的电力故障预测方法。
[0104]
本领域技术人员可以理解,图7中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0105]
在一个实施例中,提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行所述计算机程序时实现上述方法实施例中任一方法的步骤。
[0106]
在一个实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中任一方法的步骤。
[0107]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
[0108]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0109]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
技术特征:
1.一种基于加权极限学习机的电力故障预测方法,其特征在于,所述方法包括:根据电力系统的故障检测特征数据,构建模型训练的样本数据集;遍历所述样本数据集,得到所述样本数据集中各样本的样本类别、所述样本数据集的样本总数、所述样本数据集的正类样本的总数以及所述样本数据集的负类样本的总数;其中,所述样本类别包括所述正类样本和所述负类样本;为各所述样本分配与所述样本的样本类别所对应的样本权重,并根据各所述样本的样本类别所对应的样本权重生成加权矩阵;其中,所述正类样本的样本权重根据第一目标比例的对数的倒数确定;所述负类样本的样本权重根据第二目标比例的对数的倒数确定;所述第一目标比例是指所述正类样本的总数和所述样本总数的比例;所述第二目标比例是指所述负类样本的总数和所述样本总数的比例;基于改进加权elm模型iwelm算法,根据所述加权矩阵和所述样本数据集进行训练处理,得到加权极限学习机分类模型;根据所述加权极限学习机分类模型,对所述电力系统的电力故障进行预测,并输出预测结果。2.根据权利要求1所述的方法,其特征在于,基于以下表达式得到所述样本的样本类别所对应的样本权重:其中,w
ii
为所述样本的样本类别所对应的样本权重;λ为调整因子,且λ>1;#(t
i
)为所述样本的样本类别所对应的样本总数;为所述样本总数。3.根据权利要求1所述的方法,其特征在于,所述根据电力系统的故障检测特征数据,构建模型训练的样本数据集的步骤包括:获取电力系统的初始检测数据;所述初始检测数据包括pms数据、客服工单数据、在线监测数据、线路巡视数据、辅助监控数据和历史故障数据中的任意一种或任意组合;对所述初始检测数据进行数据抽取、数据清洗转换和数据加载处理,生成所述故障检测特征数据。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述预测结果,确定是否进行电力故障预警。5.一种基于加权极限学习机的电力故障预测装置,其特征在于,所述装置包括:数据集构建模块,用于根据电力系统的故障检测特征数据,构建模型训练的样本数据集;统计分析模块,用于遍历所述样本数据集,得到所述样本数据集中各样本的样本类别、所述样本数据集的样本总数、所述样本数据集的正类样本的总数以及所述样本数据集的负类样本的总数;其中,所述样本类别包括所述正类样本和所述负类样本;权重分配模块,用于为各所述样本分配与所述样本的样本类别所对应的样本权重,并根据各所述样本的样本类别所对应的样本权重生成加权矩阵;其中,所述正类样本的样本
权重根据第一目标比例的对数的倒数确定;所述负类样本的样本权重根据第二目标比例的对数的倒数确定;所述第一目标比例是指所述正类样本的总数和所述样本总数的比例;所述第二目标比例是指所述负类样本的总数和所述样本总数的比例;模型训练模块,用于基于改进加权elm模型iwelm算法,根据所述加权矩阵和所述样本数据集进行训练处理,得到加权极限学习机分类模型;故障预测模块,用于根据所述加权极限学习机分类模型,对所述电力系统的电力故障进行预测,并输出预测结果。6.根据权利要求1所述的装置,其特征在于,所述权重分配模块基于以下表达式得到所述样本的样本类别所对应的样本权重:其中,w
ii
为所述样本的样本类别所对应的样本权重;λ为调整因子,且λ>1;#(t
i
)为所述样本的样本类别所对应的样本总数;为所述样本总数。7.根据权利要求1所述的装置,其特征在于,所述数据集构建模块包括:数据获取单元,用于获取电力系统的初始检测数据;所述初始检测数据包括pms数据、客服工单数据、在线监测数据、线路巡视数据、辅助监控数据和历史故障数据中的任意一种或任意组合;数据处理单元,用于对所述初始检测数据进行数据抽取、数据清洗转换和数据加载处理,生成所述故障检测特征数据。8.根据权利要求1所述的装置,其特征在于,所述装置还包括:故障预警模块,用于根据所述预测结果,确定是否进行电力故障预警。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
技术总结
本申请涉及一种基于加权极限学习机的电力故障预测方法、装置、计算机设备和存储介质。所述方法包括:根据电力系统的故障检测特征数据,构建模型训练的样本数据集;遍历样本数据集,得到样本数据集中各样本的样本类别、样本数据集的样本总数、样本数据集的正类样本的总数以及样本数据集的负类样本的总数;为各样本分配与样本的样本类别所对应的样本权重,并根据各样本的样本类别所对应的样本权重生成加权矩阵;基于改进加权ELM模型IWELM算法,根据加权矩阵和样本数据集进行训练处理,得到加权极限学习机分类模型;根据加权极限学习机分类模型,对电力系统的电力故障进行预测,并输出预测结果。采用本方法能够提升电力故障预测时的识别效果和准确度。的识别效果和准确度。的识别效果和准确度。
技术研发人员:朱艺伟 徐键 谢尧 江瑾 许淳 杨显志
受保护的技术使用者:南方电网数字电网研究院有限公司
技术研发日:2021.11.25
技术公布日:2022/3/8