北京市天然气日负荷预测实时优化系统

摘 要

摘要:论述了北京市天然气日负荷的特点、预测模型的建立及优化过程。实现了智能动态预测,提高了预测模型的准确度和可信度。关键词:天然气日负荷;负荷预测;实时优化Real-time Opti

摘要:论述了北京市天然气日负荷的特点、预测模型的建立及优化过程。实现了智能动态预测,提高了预测模型的准确度和可信度。
关键词:天然气日负荷;负荷预测;实时优化
Real-time Optimization Forecast System of Natural Gas Daily Load in Beijing City
LI Chi-iia,LIU Yan,SHAO Zhen-yu
AbstractThe characteristics of natural gas daily load,the establishment and the optimization process of the forecast model for Beijing City are described.The intelligept dynamic forecast is realized,and the accuracy and reliability of the forecast model are improved.
Key wordsnatural gas daily load;load forecast;real-time optimization
    日负荷预测的准确性关系到城市的供气安全、稳定及经济性,意义十分重大[1]。本文根据北京市天然气日负荷变化特点,在分时段采用合适的预测模型基础上,利用创新的实时优化系统,对预测模型进行实时优化后再预测,提高了预测模型准确度和可信度。
1 北京市天然气日负荷特点
    北京市大量天然气要用于供暖,一年中用气结构发生显著变化,造成全年用气极不均匀,年高峰日用气量相当于低峰日用气量的8倍左右。结合北京市温度变化及用气结构的时段变化特性,经过分析,北京市日负荷可以分为3个时段,即供暖期(当年11月15日至次年3月15日)、供暖过渡期(当年10月25日至11月14日及次年3月16日至3月31日)及用气平稳期(当年4月1日至10月24日)。不同的时段对应着不同的负荷变化规律。在供暖期大量天然气用于供暖,负荷主要受温度影响,变化较大。供暖过渡期主要指自主供暖用户的陆续开始或结束期间,表现出负荷急剧增加或减少。用气平稳期用气负荷变化不大,目前北京市夏季天然气制冷用户用气量比例还很小,对总负荷变化影响也较小。
2 负荷预测模型的确定
    北京市天然气负荷受用气结构、气象因素、节假日、随机因素等影响,全年用气极不均匀。对于北京市供暖期负荷变化明显不同于非供暖期的特殊情况,完全有必要根据不同时段的特性,研究使用不同的预测方法。不可能采用一种模型就可以使全年每天的负荷预测都取得较好的准确度。
    综合分析目前常用的各种预测方法并结合北京市负荷变化的特点,基本确定了包括神经网络、时间序列、线性回归这3种预测方法[2~6],以预测对应的各时段负荷。
    对于供暖期,其主要影响因素是平均温度及近几天负荷。经计算得,近年来供暖期日负荷与日平均温度及前2d的负荷相关系数相当大。供暖期适合用线性回归模型预测。近年来供暖过渡期对应时期变化规律趋于一致,适合参照历史变化信息与当前主要影响因素建立神经网络模型预测,样本选取一定量的前2年同期数据及预测日近20d左右的数据,最后训练学习并预测。1年中用气平稳期日用气量变化不大,可看作一个随时间变化的平稳时间序列,经差分处理后非常适合于用时间序列ARMA模型建模预测。
3 负荷预测模型优化
    城市天然气负荷一直在动态变化中,分时段确定的负荷预测模型并不能适应天然气的发展。同一时段其主要影响因素也在动态变化,例如各个供暖期内的前5个影响因素就经常发生变化,即使同一供暖期主要影响因素在不同时间段也不尽相同。同一预测方法的建模变量数、样本量选取及参数都将影响到预测模型的准确度。提高模型的预测准确度并能让软件分析计算出最优模型参数,并给出最优预测值,是预测软件实用化的必然要求,也只有这样才能从根本解决预测准确度问题。为此,本文创建了预测模型评估与实时优化系统。
3.1 预测模型评估
    预测模型学习方法的泛化性能涉及它在独立的检验数据上的预测能力。在实践中,泛化性能评估尤为重要,它指导学习方法或模型的选择,并为我们提供最终选定模型的质的度量[7]
由训练样本估计的预测模型对应的样本误差为:
 
式中Ey——由训练样本估计的预测模型对应的样本误差
    N——训练样本的数量
    i——训练样本编号
    yi——训练样本中对应输入变量xi的目标变量
    f——由训练样本估计的预测模型
    xi——训练样本输入变量
   模型泛化误差是指预测模型在独立于训练样本的新数据上的期望预测误差。我们需要确定泛化误差的大小,而样本误差显然不能作为泛化误差的估计值。随着训练步数的增加,模型的复杂度提高,拟合优度提高,可以使得样本误差减小到0,然而样本误差为0的模型由于过分拟合训练数据,泛化性能通常很差。拟合优度的高低并不能用来判断建立模型的好坏。只有泛化误差的大小才能评估预测模型的优劣。
    因此,通常将建模数据分成3部分:训练样本集、验证集和检验集。训练样本集用于拟合模型,验证集用来估计模型的预测误差,检验集用来评估最终选定的模型的泛化误差。但是在实际应用中,模型的泛化误差只有在进行了预测且预测结果实际发生后才能知道,而此时知道了预测误差并没有多大意义,这是因为知道实际结果前,我们就需要根据预测数据进行决策。因此要找到一种根据样本或检验数据的误差来估计泛化误差的实用方法。
    目前估计泛化误差最简单且最广泛使用的方法是交叉验证。这种方法直接估计样本外误差。通常将数据分成大致相等的k部分,k一般取5或10,对于第k部分,用其他的k-1部分拟合建立模型预测第k部分数据,从而计算拟合模型的泛化误差。
泛化误差的交叉验证估计如下:
 
式中Ef(α)——模型f-k(xi,α)泛化误差的交叉验证估计
    α——预测模型的调整参数
    f-k(xi,α)——去掉了第七部分数据后的样本估计的由参数OL调整的预测模型
3.2 实时优化系统
通过分析北京市天然气日负荷数据,发现负荷变化受其最近几天的负荷变化影响最大。根据“近大远小”的规律并结合交叉验证理论,模型优化系统求预测模型泛化误差估计值时,人为地为预测日期的前2d加上了较大的权值,其权值参照预测日期近段时间内实际预测模型误差进行适应性调整。本文以式(3)计算模型最优参数。
 
式中E′f(α)——引入调整权值后的模型f-k(xi,α)泛化误差的交叉验证估计
    λ(i)——与目标变量yi相对应的权值,由模型评优模块根据历史预测结果实际误差确定
    其工作过程如下:分析当前需要预测日期前几天负荷及历史同期负荷变化情况,实时分析近期主要影响因素,作为模型输入变量。对建模样本数、是否考虑星期及节假日影响、模型主要变量数及模型结构参数等寻优。相当于建立厂一系列不同的模型,根据历史预测结果与实际结果的误差大小确定评优准则及相应的权值,由式(3)计算得出误差平方和最小时对应的预测模型参数,再以评估确定的最佳模型进行预测。当预测结果的真值出现后,进一步对预测结果进行后评价及误差统计,为下一步预测时确定或修正评优准则提供依据。预测工作流程见图1。
 

4 日负荷预测结果
    北京市天然气日负荷预测系统由可视化编程语言VB基于MATLAB数值计算软件和SQL Server2000数据库环境混合编程开发完成。系统结构采用CS(客户端-服务器)结构,即数据库安装在服务器上,应用程序安装在各台电脑上,应用程序通过ODBC访问数据库。用户只需安装应用程序便可实现对燃气负荷的预测、指标统计以及用户信息等操作。开发的负荷预测系统,经过在不同时段自动选择不同的预测模型,并采用模型实时优化系统得出最佳预测模型。表1是北京市2006年3月16日至2007年10月31日共595d的天然气日负荷的预测统计结果。表1中︱δ︱表示相对误差绝对值。
表1 天然气日负荷预测统计结果
相对误差范围
所占比例/%
相对误差范围
所占比例/%
︱δ︱<1%
23.87
5%︱δ︱<7%
11.26
1%︱δ︱<2%
22.18
7%︱δ︱<10%
4.54
2%︱δ︱<3%
15.80
︱δ︱≥10%
1.85
3%︱δ︱<5%
20.50
    可以看出,预测结果相对误差绝对值小于5%者占总天数的82.35%,大于10%者占总天数的1.85%。计算得到595d的预测结果的相对误差绝对值平均值为2.95%,总体情况较好。但最大相对误差达26.2%,调查发现是因一些大用户突然启停等造成负荷突然大幅度变化而造成,如2006年6月24日用气量为459.6×104m3/d,而6月25日突降为350.1×104m3/d,造成预测相对误差为26.2%。2006年8月7日用气量为367.0×104m3/d,而8月8日突增为507.1×104m3/d,预测相对误差为-19.7%。燃气公司若切实掌握大用户的用气计划情况,对相应的预测值进行必要的修正,则效果会更好。
5 结论
    在分时段采用不同的预测模型的基础上,利用模型实时优化系统自动计算出最优模型参数进行预测,使预测模型能主动学习并跟随天然气负荷规律变化,解决了以前负荷预测模型不能适应城市天然气发展变化的矛盾,大大提高了预测模型智能化程度,预测准确度也有明显提高,且更加稳定可靠,是解决天然气日负荷预测问题的一条新途径。
    在软件智能预测的基础上,掌握一些大用户突然变化情况并结合专家的宝贵知识及经验,适当对预测结果进行必要的修正,可以一定程度上解决预测软件的不足。另外,进一步研究优化学习规则,并加入更多的预测模型,在实时智能优化系统这一平台下,将有效地提高负荷预测准确度和可靠度。
参考文献:
[1] 席德粹,焦文玲,李持佳,等.上海市燃气负荷预测系统的开发与试验运行[J].城市燃气,2004,(7):14-16.
[2] 焦文玲,崔建华,廉乐明,等.城市燃气短期周期负荷预测的时序模型[J].天然气工业,2002,(1):92-94.
[3] 李持佳,焦文玲,朱建豪,等.基于人工神经网络的春节期间燃气负荷预测[J].煤气与热力,2004,24(9):477-480.
[4] 严铭卿,廉乐明,焦文玲,等.燃气负荷及其预测模型[J].煤气与热力,2003,23(5):259-266.
[5] 焦文玲,朱宝成,冯玉刚.基于BP神经网络城市燃气短期负荷预测[J].煤气与热力,2006,26(12):12-15.
[6] 焦文玲,赵林波,秦裕琨.城市燃气小时用气负荷周期性研究[J].煤气与热力,2003,23(9):515-517.
[7] HASTIE T,TIBSHIRANI R,FRIEDMAR J(著),范明,柴玉梅,昝红英,等(译).统计学习基础——数据挖掘、推理与预测[M].北京:电子工业出版社,2003.
 
(本文作者:李持佳1 刘燕2 邵震宇1 1.北京市公用事业科学研究所 北京 100011;2.北京市燃气集团有限责任公司 北京 100035)