摘要: 随着电网智能化的发展,在电能的生产、输送以及使用过程中产生了大量的数据积累,大量的运行数据资源支撑着电力系统安全可靠的运行。数据信息的收集、输送和储存分析耗费了大量的系统资源,对大数据信息进行有效的分析应用,提取数据中的价值,成为智能电网研究的重点。本文结合电网大数据的特点,提出了主成分分析法的电网负荷预测法,对智能电网大数据的应用具有一定的借鉴意义。
关键词:智能电网;大数据;主成分分析法
一 概述
在智能电网的生产和运行的各个环节都会有数据信息产生,产生数据的设备数量巨大,数据产生速度非常块,且数据传输的方向是双向的,造成数据规模庞大、结构复杂。电力系统的可靠运行需要各部门打破界限进行数据的实时交互,需要强力的数据分析能力对大数据信息进行分析处理,大数据技术推动着电力系统向更高水平的运行管理水平发展。可见,对电网大数据的科学分析利用,可以有效的推动电网的智能化发展,提高电网的运行管理水平。本文对电力大数据的产生进行了介绍,并利用主成分分析法实现了电网的负荷预测。
二 智能电网大数据的产生
依靠大数据分析技术对数据价值进行提取,是大数据应用中的关键。数据信息是大数据应用的原材料,是大数据价值体现的根源。在提取和获取数据的操作中,数据分析消耗了总时间的20%-30%,而数据的获取耗费了高达70%-80%的总时间。智能电网的数据来源非常丰富,来源于功能系统运行中的各环节,对智能电网的安全运行起到支撑作用。智能电网的各功能系统不断的采集电网数据信息,智能电网的数据来源如表2-1所示。各功能系统不能对电力系统所有的生产环节完成全面覆盖,因此系统间的数据交换必不可少。[1]如何对系统数据进行整合,实现电网数据进行综合分析,是智能电网大数据应用的重点。
表2-1 智能电网数据信息来源系统表
系统英文简称
|
系统中文全称
|
CSS
|
客户服务系统
|
SCADA
|
数据采集与监视控制系统
|
DTS
|
调度培训系统
|
DMS
|
配电管理系统
|
EMS
|
能量管理系统
|
GIS
|
地理信息系统
|
EAP
|
企业资产管理系统
|
ERP
|
企业资源规划系统
|
MOS
|
市场运行系统
|
MIS
|
管理信息系统
|
OMS
|
停电管理系统
|
PMS
|
生产管理系统
|
三 智能电网大数据在预测中的应用
3.1电网大数据预测方法。
电网大数据应用的核心在于预测。电力系统的建设规划周期长,电能的供求要求尽量平衡,其中牵涉到电力信息预测的应用,准确的电能信息预测对电力系统的经济运行起着至关重要的作用。在大数据预测中通过相关对象变化的监控,利用数学模型进行分析,即可对目标变量的变化趋势进行预测。常规的预测方法往往选取有限的样本数据,根据行业的专有数据,对现有算法进行改进,从而进行快速准确的预测。而大数据方法需要对更多数据进行分析,通过对数据内部联系的研究,更好的完成预测工作。电力系统信息预测的工作重点已经从算法分析转变为大数据的提取上,大数据算法相对简单有效,数据提取是重点,使用更具体详细的历史数据,缩短取样时间提高样本数据的密度,同时,数据类型的选取更加全面更加多样化,将更多的相关因素纳入预测设计库中。[2]大数据要求系统具有较强的包容性,可以对混乱的数据进行归一。利用大量混杂而相互联系的数据有效的提高预测结果的精度。总起来讲,数据类型越多,特征数据覆盖面越广,预测精度则越高。比如,在年度用电量预测时加入经济因素的影响,在短期负荷预测中加入气象条件的影响,都能提高系统预测的准确性。[3]
3.2 电网年度用电总量的预测。
经济发展、国家政策以及电价等诸多因素都会对地区的用电总量造成影响。社会的快速发展需要大量的电力能源支持,电能消耗和地区经济有极强的关联性。统计经济数据要从多维度入手,取地区用电总量和社会生产总值、人均生产总值、高耗能企业数量和进出口量等多项经济指标的特征关系,构建数学模型,实现用电总量的预测。为确保混杂数据预测地区用电总量方法的准确性,本文选取的某地30项经济数据来预测年度用电量,具体的数据指标名称如表3-1所示。
表3-1年度用电量影响的经济数据指标表
序号
|
经济指标名称
|
|
序号
|
经济指标名称
|
X1
|
地区生产总值
|
|
X16
|
第三产业就业人数
|
X2
|
全社会固定资产投资
|
|
X17
|
就业人数一产占比
|
X3
|
高耗电量单位数
|
|
X18
|
就业人数二产占比
|
X4
|
人均全社会固定资产投资
|
|
X19
|
就业人数三产占比
|
X5
|
人均生产总值
|
|
X20
|
经营单位所在地进出口总额
|
X6
|
第一产业生产总值
|
|
X21
|
经营单位所在地出口总额
|
X7
|
第二产业生产总值
|
|
X22
|
经营单位所在地进口总额
|
X8
|
工业生产总值
|
|
X23
|
居民消费水平
|
X9
|
第三产业生产总值
|
|
X24
|
农村居民消费水平
|
X10
|
生产总值一产占比
|
|
X25
|
城镇居民消费水平
|
X11
|
生产总值二产占比
|
|
X26
|
城镇居民人均可支配收入
|
X12
|
生产总值工业占比
|
|
X27
|
城镇居民人均总收入
|
X13
|
生产总值三产占比
|
|
X28
|
年末人口
|
X14
|
第一产业就业人数
|
|
X29
|
城镇化率
|
X15
|
第二产业就业人数
|
|
X30
|
城镇登记失业率
|
表中的经济数据的单位和数量级各不相同,对社会经济情况从不同方面进行了统计。地区用电总量和各种经济指标的统计是一个动态累计的过程,包含的信息量极为丰富,相互间往往存在紧密的联系。电力信息大数据预测的优越性在于加入了更多更加全面的相关数据,使预测准结果更加准确。[4]
1电能预测的主成分分析法。
在模型的建立和规律的统计过程中,需要对各指标的特征关系和发展规律进行全面、准确的反映,防止重要信息的遗漏,对多个关联指标进行分析。我们对年度用电量和表3-1中的经济数据的相关性进行分析,表3-2中为用电量和一部分经济数据的相关系数。
表 3-2 对年度用电量影响的经济数据指标列表
|
用电量
|
X1
|
X2
|
X4
|
X7
|
X20
|
X24
|
X28
|
用电量
|
1.000
|
0.983
|
0.969
|
0.989
|
0.985
|
0.989
|
0.982
|
0.951
|
X1
|
0.983
|
1.000
|
0.996
|
0.999
|
0.999
|
0.999
|
0.998
|
0.906
|
X2
|
0.969
|
0.996
|
1.000
|
0.999
|
0.995
|
0.995
|
0.995
|
0.880
|
X4
|
0.989
|
0.999
|
0.999
|
1.000
|
0.995
|
0.995
|
0.995
|
0.875
|
X7
|
0.985
|
0.999
|
0.995
|
0.0995
|
1.000
|
1.000
|
0.997
|
0.905
|
X20
|
0.989
|
0.993
|
0.984
|
0.985
|
0.995
|
0.995
|
0.991
|
0.906
|
X24
|
0.982
|
0.998
|
0.995
|
0.995
|
0.997
|
0.997
|
1.000
|
0.903
|
X28
|
0.951
|
0.906
|
0.880
|
0.875
|
0.905
|
0.905
|
0.903
|
1.000
|
主成分分析法可以将数个相关指标转换为几个少数的综合性指标,利用数据的压缩和特征值的提取,实现变量间关系的简化和统计。在变量信息基本保持不变的前提下,将原有的特征变量用少数综合性的特征变量替代,从而在确保原有大部分数据信息的同时,数据量也减少了。主成分分析完成以后,主成分数量比原有变量少,使原有数据的相关性去除,使数据组得到简化,数据分析的计算量也大大减少。主成分分析流程如下图所示。
图 3.1 主成分分析法流程图
主成分的特征值、方差贡献率和方差累积贡献率计算公式分别为:
(2-1)
(2-2)
(2-3)
计算求得各主成分的特征值、特征向量、方差贡献率和方差累积贡献率等指标。前八个指标的具体数值如表3-3所示。
表3-3 各主成分的方差贡献率和累积贡献率
成分
|
特征向量
|
特征值
|
方差贡献率/%
|
方差累积贡献率/%
|
1
|
24.194
|
80.645
|
80.645
|
2
|
3.151
|
10.505
|
91.150
|
3
|
1.432
|
4.772
|
95.992
|
4
|
0.592
|
1.974
|
97.896
|
5
|
0.258
|
0.861
|
98.756
|
6
|
0.151
|
0.505
|
99.261
|
7
|
0.093
|
0.310
|
99.571
|
8
|
0.062
|
0.208
|
99.779
|
从上表中可以看出,随着主成份的主成分数量增加特征值和方差贡献率减小。前五个主成分量的方差累积贡献率高达98.765%,这五个成分已经可以对数据信息进行较为全面的了解。如果用这五个数据代替整体数据,则数据分析可以实现极大的简化。
2 地区年度用电量的预测。
用五个主成分变量进行预测分析,采用多元现行回归的简单算法预测地区年度用电量。使用1996-2013年的电量使用数据和主成分数值完成回归计算,求得2014-2015年的用电量。拟合的部分主成分和用电量数据如下表所示。
表 3-4 年度用电量与对应主成分列表
年份
|
用电量
亿kWh
|
主成分编号
|
主成分1
|
主成分2
|
主成分3
|
主成分4
|
主成分5
|
2008
|
2031.29
|
32305.32
|
8650.55
|
1978.83
|
-13026.70
|
-23661.64
|
2009
|
2387.14
|
36689.29
|
9452.28
|
629.30
|
-12818.23
|
-24089.64
|
2010
|
2673.56
|
41417.99
|
10585.16
|
-131.46
|
-13426.84
|
-25807.53
|
2011
|
3004.03
|
47912.11
|
12434.12
|
-793.22
|
-15049.05
|
-29151.31
|
2012
|
3394.05
|
54918.37
|
15389.03
|
158.05
|
-19364.05
|
-36336.21
|
2013
|
3506.78
|
58072.30
|
15769.86
|
-1441.78
|
-18917.65
|
-36045.83
|
2014
|
3609.64
|
65949.07
|
17297.80
|
-3881.41
|
-18695.57
|
-36803.27
|
2015
|
4060.13
|
32305.32
|
8650.55
|
1978.83
|
-13026.70
|
-23661.64
|
主成分分析保留了几乎全部数据信息的前提下,实现了数据的化简。由于用电量和表3-1中的经济数据具有正线性关系,因此用多元线性回归计算对电量和主成分分析,实习那年度电量的预测。对1996-2013年的拟合结果及2015-2016年的预测结果如图3.2所示,2006-2015年的年度预测数值如表3-5所示。
图3.2 年度用电量拟合预测值与实际值比较
表 3-5 主成分分析拟合预测误差
年份
|
实际用电量
亿 kWh
|
预测(拟合)用电量亿 kWh
|
误差/%
|
2006
|
2031.29
|
2011.75
|
0.96
|
2007
|
2387.14
|
2346.77
|
1.69
|
2008
|
2673.56
|
2623.64
|
1.87
|
2009
|
3004.03
|
2992.12
|
0.40
|
2010
|
3394.05
|
3381.92
|
0.36
|
2011
|
3506.78
|
3648.52
|
4.04
|
2012
|
3609.64
|
3519.86
|
2.49
|
2013
|
4060.13
|
4018.47
|
1.03
|
2014
|
4399.02
|
4419.35
|
0.46
|
2015
|
4619.41
|
4637.29
|
0.39
|
从以上数据对比可以看出,预测结果误差还是比较小的。利用特征值提取的方法将大数据问题进行了简化,数据的相关性得以消除,数据维数对预测精度的影响消除,数据信息实现了最简化,使数据处理分析过程变得简单同时预测结果却更加精确。用同样的方法也可以对电网的短期用电量进行预测。
三结论
智能电网在运行过程中产生了大量的数据信息,本文介绍了智能电网大数据的来源,运用主成分分析对电网年度预测进行了研究,具有一定的实用价值。然而电网的大数据应用起步较晚,还处于研究阶段,工程应用还不是特别成熟,还需要在应用中不断的探索和完善。
参考文献:
[1] 张锋军.大数据技术研究综述[J].通信技术,2014,47(11):1240-1248.
[2] 张东霞,苗新,刘丽平等. 智能电网大数据技术发展研究[J].中国电机工程学报,2015, (1): 2-12.
[3] 王继业, 张崇见.电力信息资源整合方法综述[J].电网技术,2006,30(9):83-87.
[4] 周松林,茆美琴,苏建徽.基于主成分分析与人工神经网络的风电功率预测[J].电网技术,