我国的电力事业发展迅速[1], 以上海电网为例, 从2010年到2015年的短短5年, 就实现了从现场抄表、后期处理异步进行的工作模式到智能仪表普及、电力数据采集、分析一步到位的巨大转变.同时, 电力新能源的快速兴起, 在电网中也有着举足轻重的地位.然而随着电网结构复杂度的增大、大规模的新能源并网和可充电设备的大量接入, 电网的稳定性运行问题越来越显著[2-3].电网稳定性是电网安全的重要一环, 失稳会对经济发展造成极大的影响, 世界范围内多次发生的电力系统崩溃问题, 如美国西北西南电网解列和我国张家口火力发电站"5·28"重大事件, 其事故的起因都是电力系统震荡所引起的电力系统不稳定运行.
电力系统运行过程中, 每个同步发电机必须处于同步状态; 同时电力系统中各个电力节点的电压值和电力支路的功率潮流值在某一范围内波动, 这就是所谓的稳定运行状态.当系统受到巨大扰动(如自然灾害、大功率机械的投切等), 各发电机之间难以保持同步, 当无法恢复到同步运行状态时, 就认为是电力系统运行失稳[1].失稳的原因根据其结构特点可以分为供给性失稳、结构性失稳和负荷性失稳, 其主要特征为电网频率和电压的震荡.然而, 电网的稳定性是一个很难量化的特征.所以, 如果电力系统在遭受扰动时, 能提前预警是否会导致电力系统的失稳, 并及时采取有效的预防措施, 则会大大减少经济的损失.目前电力系统的稳定性研究主要有时域仿真法、直接法和人工智能法[4].近来, 人工智能技术兴起, 数据存储和高效计算设备的快速发展, 伴随着大数据技术以及智能量测和智能电网(Smart Power Grid)的普及, 电力大数据时代也随之到来, 这为使用人工智能方式解决电力系统的问题提供了契机.
本文针对电网的稳定性问题, 以神经网络为基础, 建立了一个电力系统稳定运行状态的预测模型.
1 相关工作随着计算机科学的深入发展和智能电网的迅速崛起, 电力大数据应运而生.电力大数据是指, 根据电网运行产生的海量数据, 进行异常值检测、窃电检测、负荷预测、稳定性分析等一系列和电网运行相关的分析, 来预测电网的状态, 以达到降低经济损失的目的.
电力大数据的研究由来已久, 其主要研究领域是电力安全稳定领域中的窃电检测和负荷预测.在这些检测中支持向量机(Support Vector Mechine, SVM)和聚类分析是最常用的检测模型. Jindal等和卢峰等分别使用决策树(Decision Tree, DT)和支持向量机以及两者结合的方式来实现对电力坏数据的识别[5-6], 并最终完成了窃电检测的任务.然而简单的分类模型对高维度的数据集无能为力, 并且其较低的泛化能力成为限制其发展的主要因素.随着深度学习的向前发展, 很多学者将神经网络(Neural Network, NN)模型和电力数据结合, 产生了许多新的检测机制.多层感知机和深度学习的模型也用来进行电网数据的模式监测. Ding等提出的一种基于神经网络的负荷预测模型[7], 以及Zheng等提出的基于深层神经网络的电网状态监控都取得了不错的效果[8].另外, Pierrevalh、Mccalley等和Rohden等也将神经网络用于解决加州电网的安全问题[9-11].
虽然数据驱动的机器学习模型在窃电和负荷预测上取得了长足的发展, 但是对电网稳定性的研究大多仍基于理论研究, 如设计一种稳定状态的判断标准. Filatrella等提出了一种基于单扰动的稳定性状态评估准则[12], 即当负荷的需求能量大大增加时会做出预警, 但是该准则在调控自由度和准确率上有所欠缺. Menck等提出了新的稳定性判定准则[13], 该准则假设一组随机采样的扰动系统, 通过对比初始条件和稳定运行条件的比率来判别稳定性状态, 其比单扰动稳定性判据更加稳健.当前工业界普遍接受的标准是局部稳定性判据[14], 该方法通过求取运动方程的特征根, 其中具体正实部的解对应的状态判定为稳定状态.也有少部分学者将数据工作和稳定性预测相结合, 朱利鹏等和Devie等利用支持向量机、决策树等经典模型进行暂态稳定性预测并得到了一定效果[15-16], 即利用节点电压、发电机转子角速度等变量作为输入, 利用支持向量机进行暂态稳定性的预测[17-18].使用决策树实现对同步发电机的失步进行预测, 也取得了比较高的分类效果[19].另外, 汤必强等和Zhou等将神经网络模型用于电力系统暂态稳定性的评估, 也取得了不错的效果[20-21].
针对电力系统安全稳定性的数据性研究相对较少, 究其原因, 一是电网数据涉及用户隐私信息, 保密性较高; 二是稳定性特征量化困难.针对以上问题, 本文以神经网络为基础, 以模拟微网的仿真数据为实验数据, 建立了一个优化神经网络的电网稳定性预测模型.
2 模型构建 2.1 经典神经网络神经网络是由具有适应性的简单单元组成的并行互联网络, 因其可以模拟生物神经系统的交互和学习过程而得名.经典的神经网络结构包括输入层、隐含层和输出层这3层.
神经网络是一种典型的监督学习的方式, 由正向传播过程和反向传播过程组成.通过最小化模型输出和数据集标签构成代价函数实现模型参数的优化, 常用的代价函数有最小二乘型和交叉熵型这两种.求取代价函数极小值的方式叫做优化器, 梯度下降是最经典的优化器, 它将代价函数的梯度和学习率经过函数运算产生模型参数(权重和偏差)增益, 实现参数优化.因而, 适当大小的学习率是提升模型性能的重要因素, 过大的学习率会导致代价函数难以寻得最小值, 而过小的学习率则会使收敛速度变慢或者陷入局部最小值.
2.2 自适应学习率优化模型经典梯度下降算法保持单一的学习率更新所有的权重, 在训练过程中保持学习率不变, 这会使代价函数在梯度下降过程中跳过或者无法达到全局最优值.为解决这一问题, 本文采用了一种可以随着迭代运算自行更新学习率的优化模式.
自适应学习率模型的权重更新方式和随机梯度下降基本相同, 不同在于增加了学习率的更新步骤, 在计算梯度更新的同时将梯度累加平方和的平方根作为权重增益分母, 该项累计各个参数的梯度平方, 并不断更新梯度.迭代计算的过程中, 在频繁更新梯度的位置上, 累积的分母项会逐渐增加, 那么更新的学习率就会减少; 相反, 在梯度更新比较稀疏的位置上, 分母项的累积比较少, 更新的步长就相对较大.计算公式为
$\begin{align} g_t&= \nabla_{\theta}J\theta_{t-1}, \\ \end{align} $ | (1) |
$\begin{align} \theta_{t+1}&=\theta_t- \alpha\cdot \dfrac{g_t}{\sqrt{\sum\nolimits_{i=1}^tg_t^2 }}, \end{align} $ | (2) |
其中,
本文实验均使用UCI 2018年电网稳定性模拟数据集[22], 仿真模型是4节点星型微电网, 发电机作为中心, 3个用户连接到发电机的供电侧, 模型通过电价将消费者和生产者进行联系, 通过计算局部稳定性特征值[23]并将其作为微网稳定性指标.
数据集包含10 000条数据, 包括14个变量, 其中12个属性变量, 包括4个参与者的反应时间、4个参与者的功率消耗信息、4个价格弹性相关数据; 2个标签变量, 为特征方程的最大实部数据和系统的稳定性标签, 其中0表示不稳定, 1代表稳定.具体的信息如表 1所示.
根据变量特征将能量消耗、反应时间等归类为环境变量, 将电机功率、平均时间、阻尼常数和线路容量归类为控制变量.假设控制变量为固定值, 环境变量存在阈值, 通过调节用户的能量消耗、对电价波动的反应时间和电价弹性信息等特征的数值, 记录并计算系统的稳定性情况, 以此产生实验数据集.
4 实证分析 4.1 数据预处理对原始数据的预处理包括特征处理、去离群值、归一化处理、重抽样和数据集划分等5个部分.
(1) 特征处理.除数据集本身特征之外, 参与者反应时间和电价信息的部分统计特征也作为模型输入参数, 产生6种新的变量, 分别是最大反应时间、最小反应时间、平均反应时间、最大电价、最小电价和平均电价.
(2) 离群值处理.在模型训练过程中, 离群数据会误导模型的预测结果.本文用箱线图分析的方式对离群值做剔除处理.对原始数据做可视化处理, 可以看出部分特征存在离群数据, 根据箱线图表现出的分布情况, 将上界线和下界线以外的数据作为离群数据删除.
(3) 归一化处理.在数据进行输入之前需要进行归一化处理, 以确保所有的输入具有相同的重要程度.为防止由于过大输入值引起的神经元输出饱和, 本文将输入数据统一归一化处理, 采用的归一化公式为
$\begin{align} x'= \dfrac{x- x_{\min}}{x_{\max}- x_{\min}}, \end{align} $ | (3) |
其中,
(4) 重抽样.对样本的分类属性做统计分析发现, 正负样本分布大致为7:3, 实验显示不均衡样本会使模型的预测结果偏向多数类, 从而少数类的分类性能有所下降.本文通过对少数类样本进行重采样实现了正负样本的均衡.
(5) 数据集划分.将实验数据划分为训练集和测试集, 并将训练集划分为真训练集和验证集.首先将数据随机重排, 以提高样本的随机性, 然后按照3:2的比例划分为训练集、测试集, 并在训练集中按照10折交叉验证的方式划分验证数据集.
4.2 模型构建搭建神经网络的工作主要分为两个部分, 即优化方式的选取和网络拓扑结构的设定.
在实验中, 为比较自适应学习率的优化效果, 采用ROC(Receiver Operating Characteristic)曲线作为模型的评分标准. ROC曲线的横坐标为FPR(False Positive Rate), 表示当前被错误分到正样本类别中真实的负样本占所有负样本总数的比例; ROC曲线的纵坐标为TPR(True Positive Rate), 表示当前分类到正样本中真实的正样本占所有正样本的比例. ROC曲线表示模型的优劣程度:越靠近左上角,模型越优秀. AUC(Area Under Curve)值表示ROC曲线下方的面积.本文首先测试了不同学习率下(Learning rate)的模型评分, 结果如图 3所示.
由图 3对比发现, 当学习率为0.001的时候, 模型的AUC值为0.990 039, 高于学习率为0.1、0.01和0.000 1的模型评分, 所以假设采用学习率为0.001的随机梯度下降方式模型达到最优; 而后采用自适应学习率的方式对模型进行评估, 结果如图 4所示.通过和图 3对比可以看出, 自适应学习率优化器模型优于随机梯度下降模型.
根据经验, 普通前馈神经网络的构建基本采用3层网络结构:输入层神经元个数为数据集的输入特征数; 输出层为分类的类别数; 隐含层节点的个数没有统一的标准.隐含层神经元个数过少会引起结构简单、分类效果差、拟合不足等问题, 但是过多的神经元会使计算陷入局部最优, 还会使计算时长大大增加, 所以, 通常用经验公式
$\begin{align} h=\sqrt{i+o}+\alpha \end{align} $ | (4) |
来确定隐含层神经元的个数.式(4)中
本文采用经典的支持向量机(SVM)和决策树(DT)分类器作为横向对比的模型.支持向量机采用科学计算包scikit-learn中的SVM模块, 决策树采用scikit-learn中的tree模块.
决策树模型采用经典的CART(Classification and Regression Trees)生成方式, 以最佳值为特征选取策略, 采用Gini系数作为特征的选取标准, 对于树的深度不做限制.
支持向量机中的惩罚因子
模型相关参数的设置详见表 2.
本文选择准确率(Accuracy)、精确率(Precision)、査全率(Recall)和F1分数(F1- score)作为度量标准来衡量方法的精度:准确率是指识别正确的样本个数占总样本数的比例; 査准率是指每一类识别正确的样本个数占识别为该类的样本总数的比例; 査全率是指每一类识别正确的样本个数占系统中该类总量的比例; F1- score是用来衡量査全率和精确率的指标.另外, ROC曲线和AUC值也作为模型的性能评估指标.分类问题中的Accuracy、Precision、Recall和F1都是通过构建混淆矩阵计算得出, 其计算公式分别为
$\begin{align} {\rm Accuracy}&= \dfrac{\rm TP+TN}{\rm TP+FP+FN+TN}, \end{align} $ | (5) |
$\begin{align} {\rm Precision}&= \dfrac{\rm TP}{\rm TP+FP}, \end{align} $ | (6) |
$\begin{align} {\rm Recall}&= \dfrac{\rm TP}{\rm TP+FN}, \end{align} $ | (7) |
$\begin{align} {\rm F1}&=2\times \dfrac{\rm Precision\times Recall}{\rm Precision+ Recall}, \end{align} $ | (8) |
其中, TP(True Positive)表示真正类, 即实际是正类并且被预测成正类的样本数量; TN(True Negative)表示真负类, 即实际是负类并且被预测成负类的样本数量; FP(False Positive)表示假正类, 即实际是负类被预测成正类的样本数量; FN(False Negative)表示假负类, 即实际是正类被预测称负类的样本数量.
4.5.2 实验结果本文的主要目的是通过研究机器学习算法对模拟电力系统稳定性的分类情况进行预测, 将机器学习算法应用到电网状态的预测当中, 从而提高对电网状态的监控效率.基于Python分别创建了支持向量机模型(SVM)、决策树模型(DT)和神经网络(NN)模型.下面通过横向对比各个模型在各评价指标上的表现情况, 选出分类效果最优的模型.
(1) 准确率和AUC值的比较
预测模型准确率和AUC值的比较具体见表 3.
通过表 3可以发现, NN模型的分类效果表现最好, SVM模型和DT模型的分类效果相对较差.
(2) ROC曲线的比较
由图 6, 3条ROC曲线从上到下依次对应的是NN模型、SVM模型和DT模型. NN模型的ROC曲线更加靠近左上角, 根据ROC曲线的定义可以得出, NN模型和SVM模型和DT模型具有更加优秀的分类效果; 并且在FPR值很低的时候可以保持很高的TPR值, 这表明NN模型可精准识别两种样本.
(3) 混淆矩阵的比较
根据3个模型的混淆矩阵及其评价指标的计算结果, 可将模型的预测效果做如下汇总, 详见表 4.
根据表 4中数据的纵向对比, 在相同的数据集上利用不同分类器进行分类, 优化神经网络(NN)模型在分类上有着更加优秀的评分, 这说明在复杂的电力数据上, 神经网络通过函数的抽象处理, 可以很好地预测样本的类别信息; 决策树(DT)模型和支持向量机(SVM)模型虽然也达到了不错的分类效果, 但是相较于神经网络模型, 不是十分理想, 这说明在特征维度比较高的场景中, 简单分类器的分类性能会大大被限制.电网结构错综复杂, 数据维度高是电力数据的一个重要特征, 这一点和神经网络善于处理高维度数据的特点契合, 但是不足的是相关模型参数的物理意义难以表达, 这也是神经网络模型的一个通病.
5 总结本文通过仿真数据集和机器学习的方式建立了一种优化神经网络的电网稳定预测模型, 在数据清洗和优化方式等方面对神经网络进行了改进, 取得了不错的效果.首先根据电力大数据研究的现状, 选择深度学习的神经网络作为基本模型, 并选定支持向量机和决策树分类作为对比; 然后采取了去离群值、标准化、重采样等一系列方式进行数据集整理; 最后用优化模型对数据进行建模并做模型评估.实验结果显示, 和传统的机器学习分类模型相比, 自适应神经网络模型具有更优秀的分类性能, 也表明了深度学习方法在电网大数据领域的可行性.但是, 由于本文所采用数据集为仿真数据集且特征相对较少, 相较于复杂多变的电网实际运行情况, 模型的泛化能力稍有不足, 但也为电力从业人员基于电网的海量数据及时准确地进行稳定性预测提供了新的思路.
[1] |
赵一安. 电气工程及其自动化技术下的电力系统自动化发展研究[J]. 黑龙江科学, 2018, 9(5): 76-77. DOI:10.3969/j.issn.1674-8646.2018.05.035 |
[2] |
和萍, 文福拴, 薛禹胜, 等. 风电场并网对互联系统小干扰稳定及低频振荡特性的影响[J]. 电力系统自动化, 2014, 38(22): 1-10. DOI:10.7500/AEPS20140613003 |
[3] |
卫思明, 黄永章. 新能源采用MGP并网的小干扰稳定分析[J]. 华北电力大学学报(自然科学版), 2018, 45(1): 22-30. DOI:10.3969/j.ISSN.1007-2691.2018.01.04 |
[4] |
DAOWEI L, DUNWEN S, HONGYIN W, et al. Voltage stability online evaluation system based on WAMS and EMS[J]. Power System Technology, 2014, 38(7): 1934-1938. |
[5] |
JINDAL A, DUA A, KAUR K, et al. Decision tree and SVM-based data analytics for theft detection in smart grid[J]. IEEE Transactions on Industrial Informatics, 2016, 12(3): 1005-1016. DOI:10.1109/TII.2016.2543145 |
[6] |
卢峰, 丁学峰, 尹小明, 等. 基于样本优化选取的支持向量机窃电辨识方法[J]. 计算机测量与控制, 2018, 26(6): 223-226. |
[7] |
DING N, BENOIT C, FOGGIA G, et al. Neural network-based model design for short-term load forecast in distribution systems[J]. IEEE Transactions on Power Systems, 2015, 31. |
[8] |
ZHENG Z B, YANG Y T, NIU X D, et al. Wide & Deep convolutional neural networks for electricity-theft detection to secure smart grids[J]. IEEE Transactions on Industrial Informatics, 2018, 14(4): 1606-1615. DOI:10.1109/TII.2017.2785963 |
[9] |
PIERREVAL H. Rule-based simulation metamodels[J]. European Journal of Operational Research, 1992, 61(1/2): 6-17. |
[10] |
MCCALLEY J D, WANG S, ZHAO Q L, et al. Security boundary visualization for systems operation[J]. IEEE Transactions on Power Systems, 1997, 12(2): 940-947. DOI:10.1109/59.589783 |
[11] |
ROHDEN M, SORGE A, TIMME M, et al. Self-organized synchronization in decentralized power grids[J]. Physical Review Letters, 2012, 109(6): 1-5. |
[12] |
FILATRELLA G, NIELSEN A H, PEDERSEN N F. Analysis of a power grid using a Kuramoto-like model[J]. The European Physical Journal B-Condensed Matter, 2008, 61(4): 485-491. |
[13] |
MENCK P J, HEITZIG J, MARWAN N, et al. How basin stability complements the linear-stability paradigm[J]. Nature Physics, 2013, 9(2): 89-92. DOI:10.1038/nphys2516 |
[14] |
SCHÄFER B, MATTHIAE M, TIMME M., et al. Corrigendum:Decentral smart grid control[J]. New Journal of Physics, 2015, 17: 015002. DOI:10.1088/1367-2630/17/1/015002 |
[15] |
朱利鹏, 陆超, 孙元章, 等. 基于数据挖掘的区域暂态电压稳定评估[J]. 电网技术, 2015, 39(4): 1026-1032. |
[16] |
DEVIE P M, KALYANI S. Transient stability prediction in multimachine system using data mining techniques[J]. Esrsa Publications, 2013(2): 2748-2755. |
[17] |
叶圣永, 王晓茹, 刘志刚, 等. 基于支持向量机增量学习的电力系统暂态稳定评估[J]. 电力系统自动化, 2011, 35(11): 15-19. |
[18] |
GOMEZ F R, RAJAPAKSE A D, ANNAKKAGE U D, et al. Support vector machine-based algorithm for post-fault transient stability status prediction using synchronized measurements[J]. IEEE Transactions on Power Systems, 2011, 26(3): 1474-1483. DOI:10.1109/TPWRS.2010.2082575 |
[19] |
AMRAEE T, RANJBAR S. Transient instability prediction using decision tree technique[J]. IEEE Transactions on Power Systems, 2013, 28(3): 3028-3037. DOI:10.1109/TPWRS.2013.2238684 |
[20] |
汤必强, 邓长虹, 刘丽芳. 复合神经网络在电力系统暂态稳定评估中的应用[J]. 电网技术, 2004, 15: 62-66. |
[21] |
ZHOU D Q, ANNAKKAGE U D, RAJAPAKSE A D. Online monitoring of voltage stability margin using an artificial neural network[J]. IEEE Transactions on Power Systems, 2010, 25(3): 1566-1574. DOI:10.1109/TPWRS.2009.2038059 |
[22] |
PIERREVAL H, RALAMBONDRAINY H. A simulation and learning technique for generating knowledge about manufacturing systems behavior[J]. Journal of the Operational Research Society, 1990, 41(6): 461-474. DOI:10.1057/jors.1990.72 |
[23] |
SCHAFER B, GRABOW C, AUER S, et al. Taming instabilities in power grid networks by decentralized control[J]. The European Physical Journal Special Topics, 2016, 225(3): 569-582. DOI:10.1140/epjst/e2015-50136-y |