基于支持向量机的燃气短期负荷预测

摘 要

摘要:介绍支持向量机的原理和支持向量回归模型,提出支持向量回归(SVR)模型的城市燃气短期负荷预测方法。探讨输入样本数据的选择和预处理方法、核函数和支持向量机参数的选择,

摘要:介绍支持向量机的原理和支持向量回归模型,提出支持向量回归(SVR)模型的城市燃气短期负荷预测方法。探讨输入样本数据的选择和预处理方法、核函数和支持向量机参数的选择,结合某城市燃气日负荷数据进行燃气短期负荷预测。与BP神经网络预测方法相比,支持向量回归模型预测方法用于小样本情况下的燃气短期负荷预测精度略高。

关键词:燃气负荷预测;  短期负荷;  支持向量机;  BP神经网络;  支持向量回归模型

Short-term Gas Load Forecast Based on Support Vector Machine

Abstract: The principle of support vector machine and the support vector regression model are introduced. A short-term city gas load forecast method based on support vector regression model is proposed. The selection and pretreatment method of input sample data and the selection of kernel function support vector machine parameters are discussed. The short-term gas load forecast is conducted with the daily gas load data of a city. For small sample datathe forecast method based on support vector regression model has higher short-term city gas load forecast precision than the forecast method based on BP neural network.

Key words: gas load forecastshort-term loadsupport vector machineBP neural networksupport vector regression model

1 概述

国内外对燃气负荷预测的研究[1-7]主要开始于20世纪后期,随着技术进步和计算机的广泛应用,各种新理论和方法相继被应用于燃气负荷预测。早期常用的方法是基于统计学的回归分析和时间序列分析,但是由于负荷预测问题的高度非线性和不确定性,传统方法往往难以建立精确的数学模型,为解决这一问题,我们引入了灰色理论、人工神经网络和支持向量机等理论方法。本文利用支持向量回归模型进行燃气短期负荷预测研究,为建立城镇燃气短期负荷预测模型提供一条新途径。

2 支持向量机的原理和支持向量回归模型

支持向量机(Support Vector Machine)简称SVM[8],是一种监督式学习的方法,广泛应用于统计分类以及回归分析中,其算法见图1。支持向量机首先通过内积核函数K(X)定义的非线性变换将输入空间X变换到一个高维空间,然后在这个空间中求最优分类面,其输出Y是中间节点的线性组合,每个中间节点对应一个输入样本与一个支持向量的内积,因此也被称为支持向量网络。研究表明[9-10],相对于神经网络而言,支持向量回归模型不存在局部极小值问题,对于解决模糊、随机、不确定性、样本数有限和非线性的复杂问题具有明显优势。支持向量机从结构风险最小化原则出发,为机器学习提供了一个崭新的方法,被认为是小样本学习中一种很好的机器学习算法。

 

SVM常用的学习算法有Chunking算法、分解算法、序列最小优化SM0法、最近点快速迭代(NPA)算法和最小二乘法等。SVM方法在建模过程中,核函数及其参数对模型预测的执行效率和推广预测能力影响较大,对于SVM参数的优化选取,目前尚未有统一的最佳方案,常用的方法就是使参数在一定范围内取值,采用试算方法来选取最优的一组参数。为避免试算的盲目性,除常规的网格划分方法外,目前常用的启发式参数寻优方法还有遗传算法(GA)和粒子群优化算法(PSO)等。  

2.1 基本原理

假设样本(xiyi)i=1nxi∈Rnyi∈R(Rnn维的实数空间,R为实数),支持向量机的基本原理就是将学习样本(xiyi)通过映射函数ø映射到一个高维特征空间,然后选择适当的核函数K(X)和惩罚参数C,通过求解二次优化问题可得到松弛变量δi和参数b

优化的目标函数为F=wTw,目标函数F可以保证分类的最优性,约束条件(2)则保证分类的正确性。为了消除异常样本的影响,引入松弛变量δi,相应的目标函数可以表示为:

 

式中 w——超平面的权值向量

     C——惩罚参数,对错误分类起惩罚作用

    δi——松弛变量,其作用是衡量对样本(xiyi)的误分类程度

     b——参数

向量xi通过函数ø (x)被映射到高维空间,K(xiyi)=ø(xiT)ø(xj)为核函数。支持向量机通过将输入空间映射到一个高维内积空间,解一个线性约束的二次规划问题得到全局最优解,从而有效避免了“维数灾难”,保证了收敛速度。在最优分类面中选择适当的核函数,可以实现某一非线性变换后的线性分类,且不增加其计算的复杂性。

SVM中最常用的几种核函数见式(3)(6),其中线性核函数可以看作是多项式核函数的一种特殊情况。

 

2.2支持向量回归模型(SVR)

1996年国外相关学者提出了一种利用支持向量机进行回归的计算方法。该方法需要解决的问题与式(1)类似,通常被称为支持向量回归(SVR)模型。假设待回归的函数为f(x)=wx+P,样本数据(xiyi)i=1nxi∈Rnyi∈R,按照支持向量机理论,其拟合函数为:

 

 

式中 αi,α'i,p——参数

(7)中的参数αi,α'i,p通过解下面的二次优化问题获得,优化的目标函数为:

 

约束条件为:

 

式中 μ——预测误差

     C1——惩罚因子,表示对超出误差μ的样本的惩罚程度

3 燃气负荷预测的支持向量回归模型

燃气负荷是由数量众多的各类用户用气所形成,由于影响负荷的各种自然、社会和经济条件不断变化,以及终端用户的使用情况影响,导致燃气负荷处于一个动态的变化过程。燃气负荷具有时变性,对于短期负荷预测而言,最重要的影响因素是星期几、温度、天气、是否节假日等特殊日等。

假设已有多日的燃气负荷实际数据(xiyi)i=12m,其中xi为第i天燃气负荷的影响因素,yi为第i天的燃气负荷实测值。利用支持向量回归模型进行燃气负荷预测,即建立每天燃气负荷影响因素xi与燃气负荷yi之间的非线性函数关系,即:

 

根据支持向理机理论,该非线性函数关系可以用支持向量机对前i-1天实测数据的学习来获得,其回归计算公式为:

 

3.1 确定输入输出

燃气负荷预测支持向量回归模型的输入因素通常为温度(包括最高、最低和平均温度)、日期和天气情况,输出值则为当日的燃气负荷。支持向量回归模型只能处理非模糊的定量数据,采用较多的负荷相关因素作为输入可以提高预测的精度,输入的影响因素越多,网络运算的精度越高,样本训练所需的时间也会越多,因此在实际应用时应根据已有资料选择适当数量的输入因素。

燃气负荷处于一个随机非平稳的过程,由于受到各种因素的影响,其历史数据常常包含部分不良数据,因此通常在使用前要进行预处理,例如采用低通滤波法去除分散或连续出现的不大的尖峰扰动,使样本数据更具有实际意义。在样本选择和优化处理过程中,如果数据源中有大量未经处理或者虚假的数据,将会妨碍对网络的正确训练,因此剔除或使用正常数据置换那些不符合实际的异常样本数据,确定出数据的合适数目。

3.2 参数的优选

支持向量机参数的优选主要包括两部分内容,一是核函数的选择,二是参数的优选。通常情况下,我们优先选择RBF核函数,与其他核函数相比,它在数值计算上具有一定优势,而线性核函数和Sigmoid核函数如果选择适合的参数都可以转变为RBF核函数。对于支持向量机参数的优选,目前最常用的方法是采用网格划分与交叉检验相结合的方法。

4 预测实例

4.1 预测流程

利用支持向量机进行燃气短期负荷预测的基本流程见图2

 

4.2 预测实例

选择某城市21天的燃气负荷数据,初始训练样本为前7天的负荷数据(见表l),利用SVR预测第8天的燃气负荷,然后将第8天的实测负荷并入初始训练样本,再利用SVR预测第9天的燃气负荷,以此类推,可以得到第8天至第21天的燃气负荷预测值及相对误差(见表2)

 

 

以星期几、平均温度、最高温度、最低温度、天气情况作为SVR模型的输入参数,模型输出为当日的燃气负荷。由于各影响因素差别较大,为方便支持向量机的训练和学习,需要将学习样本和预测样本数据进行归一化处理,通常将样本数据调整为[01][-11],分别用支持向量回归模型和BP神经网络模型进行训练和预测,数据对比见表2。其中支持向量回归模型选择RBF函数作为核函数,参数的选择采用网格划分和交叉检验来确定;BP神经网络包括1个隐含层,根据试算结果选择9个节点。

由表2可以看出,对于燃气短期负荷的预测,SVR模型和BP神经网络模型预测这两种预测方法,除个别点外,相对误差基本都在5%以内,预测值与实测值吻合良好。样本数量较少时,SVR模型预测方法较BP神经网络模型预测精度更高,随着样本数量的增大,两者的预测相对误差都呈下降趋势。综上所述,利用SVR模型预测燃气短期负荷可行,并且对于小样本数据,其预测准确度略高于BP神经网络模型预测。

5 结论

燃气短期负荷与其影响因素之间的关系是复杂的非线性关系,用传统的数学模型很难处理。本文将支持向量机应用于城市燃气短期负荷预测,建立星期几、平均温度、最高温度、最低温度、天气情况与燃气负荷的支持向量回归模型,对某城市燃气负荷进行预测,与BP神经网络的预测结果对比后显示,SVR预测方法准确度略高,具有很高的实用价值,并且在解决小样本、非线性及高维模式识别问题中具有特有的优势。

 

参考文献:

[1] 杨爱萍,邓连杰,刘凤国.城市燃气负荷预测技术应用分析[J].煤气与热力,201131(9)A39-A41.

[2] 焦文玲,金佳宾,廉乐明,等.时间序列分析在城市天然气短期负荷预测中的应用[J].哈尔滨建筑大学学报,200134(4)79-83.

[3] 焦文玲,朱宝成,冯玉刚.基于BP神经网络城市燃气短期负荷预测[J].煤气与热力,200626(12)12-15.

[4] 刘燕,张应辉,杜学平.基于同归分析的北京市天然气供应规模预测[J].煤气与热力,201030(6)A26-A29.

[5] 严铭卿,廉乐明,焦文玲,等.燃气负荷及其预测模型[J].煤气与热力,200323(5)259-262.

[6] 焦文玲,邹涛,巩晓峰,等.燃气日负荷影响因素的相关分析和偏相关分析[J].煤气与热力,201030(5)Bol-1705.

[7] 姚健,周伟国,张中秀.人工神经网络法燃气日负荷预测输入变量选取[J].煤气与热力,201030(1)A28-A30.

[8] 浦星材,沈晓风,张清扬,等.基于偏最小二乘法的支持向量机短期负荷预测[J].电网与清洁能源,201127(10)32-35.

[9] 马文涛.参数优化LSSVM的巷道围岩松动圈预测研究[J].岩土力学,200728(s1)460-464.

[10] 赵洪波.支持向量机在隧道围岩变形预测中的应用[J].岩石力学与工程学报,200524(4)649-652.

 

本文作者:郭微 姜德义

作者单位:重庆大学煤矿灾害动力学与控制国家重点实验室