数据规格化在燃气负荷预测的应用_工程实践

摘要

摘要：探讨了燃气负荷预测中规格化处理方法，建立了径向基神经网络燃气负荷预测模型。结合实例，对分别采用最大最小、零均值规格化处理的预测结果进行了比较，后者的精度较高。关键

摘要：探讨了燃气负荷预测中规格化处理方法，建立了径向基神经网络燃气负荷预测模型。结合实例，对分别采用最大最小、零均值规格化处理的预测结果进行了比较，后者的精度较高。

关键词：燃气负荷预测；神经网络；规格化

Application of Data Normalization to Gas Load Forecasting

LIANG Jin-feng，YANG Jun-jie，GAO Zhu

Abstract：The normalized treatment method in gas load forecasting is discussed，and a model for forecasting gas load based on radial basis function neural network is established. Combined with an example，the forecasting results using the maximum，minimum and zero average normalization are compared，and the latter has higher precision.

Key words：gas load forecasting；neural network；normalization

1 规格化处理方法

燃气负荷预测是从大量的历史数据中找出一定的变化规律，进而实现对未来一定时间范围内的燃气负荷进行预测。目前，用于燃气负荷预测的方法很多，随着人工神经网络的兴起，不同的神经网络逐渐被引用到了燃气负荷预测领域中来。然而单纯地使用神经网络进行预测的结果是令人不满意的，因此在进行预测运算前，将历史数据进行前期处理是必不可少的。

规格化^[1]就是将一个属性取值范围投射到一个特定范围之内，以消除数值型因大小不一而造成预测结果的偏差。规格化处理常用于神经网络、基于距离计算的最近邻分类和聚类的数据处理。常用的规格化处理方法有以下3种。

① 最大最小规格化方法

该方法是对初始数据进行的一种线性转换。它是将属性A的一个值v映射为v′且有v′∈[A_new,min，A_new,max]，具体映射计算式为：

式中A_min——属性A的最小值

A_max——属性A的最大值

A_new,max——规格化后属性A新值的最大值

A_new,min——规格化后属性A新值的最小值

② 零均值规格化方法

该方法是根据属性A的均值和方差来对A进行规格化，属性4的值v可以通过以下计算式获得其映射值v′：

式中A_ave——属性A的均值

σ_A——属性A的方差

③ 十基数变换规格化方法

该方法通过移动属性A值的小数位数来达到规格化的目的。所移动的小数位数取决于属性A绝对值的最大值。属性A的值v可以通过以下计算式获得其映射值v′：

式中j——使max(︱v′︱＜1成立的最小值

目前，在使用人工神经网络进行燃气负荷预测方面的研究中，大多数学者都在运算前对燃气的历史数据进行规一化处理，也就是最大最小值规格化处理，将数值映射到[0.1，0.9]范围中。对于神经网络，采用规格化后的数据不仅有助于确保学习结果的正确性，而且也会帮助提高学习的速度。对于基于距离的计算，规格化方法可以帮助消除因属性取值范围不同而影响计算结果的公正性。

2 燃气负荷预测模型

① 径向基神经网络预测模型

径向基神经网络^[2]是一种两层前向型神经网络，包含一个具有径向基函数神经元的隐层和一个具有线性神经元的输出层。在燃气短期负荷预测领域中，它以训练速度快、学习精度高的优点开始逐渐崭露头角。考虑到燃气日负荷受天气状况影响比较大，笔者以网络的输入为最低气温、最高气温，输出为燃气日负荷建立径向基神经网络预测模型(见图1)。

② 燃气负荷的降噪处理

燃气负荷预测用到的历史负荷数据，来源主要是燃气部门的调度报表。各种计量仪表的偏差或人工抄表的疏忽，往往造成负荷实际值与记录值差别很大。有时设备维修、燃气泄漏等原因也造成负荷数据偏离合理值，导致采集到的数据为染噪数据。染噪的出现，打破了负荷所具有的周期性及规律性，因此有必要将染噪数据进行降噪处理。

信号降噪^[3]实质上是抑制信号中的无用部分，恢复信号中的有用部分的过程。燃气负荷可视为非平稳的一维数字信号。对这种信号进行降噪处理时，由于传统的傅里叶变换完全是在频率域中对信号进行分析，它不能给出信号在某个时间点上的变化情况，因此分辨不出信号在时间轴上的任何一个突变。但是小波分析能同时在频率域内对信号进行分析，因此它能有效地区分信号中的突变部分和噪声，从而实现对非平稳信号的降噪。而小波包分析^[4]能够为信号提供一种更加精细的分析方法，它将频段进行多层次划分，对没有细分的高频部分进一步分解，并能够根据被分析信号的特征，自适应地选择相应频带，使之与信号频谱相匹配，从而提高时频分辨率，因此小波包分析方法具有广泛的应用价值。

数据采用2002年某市燃气相关历史数据，运用小波包分析方法对燃气日负荷进行降噪处理，部分计算结果见.表1。

表1 燃气日负荷降噪处理结果

日期	最低气温/℃	最高气温/℃	真实日负荷/(m³·d^-1)	降噪后日负荷/(m³·d^-1)
2002年2月1日	-8	-1	40.15×10⁴	40.07×10⁴
2002年2月2日	-5	6	37.80×10⁴	37.70×10⁴
2002年2月3日	-9	-1	41.75×10⁴	41.64×10⁴
2002年2月4日	-1	10	41.40×10⁴	41.24×10⁴
2002年2月5日	-12	-10	40.70×10⁴	40.71×10⁴
2002年2月6日	-6	5	40.85×10⁴	40.98×10⁴
2002年2月7日	-8	6	43.65×10⁴	43.64×10⁴

③ 预测结果的相对误差

在网络学习前，将样本数据进行了最大最小规格化处理，即将样本数值映射到[0.1，0.9]范围中。考虑到燃气日负荷受人们的日常生活规律影响具有以周为单位的周期性，训练样本为预测起始日前的4周数据。网络学习完毕后，输入预测日的最低、最高气温，进行仿真。采用径向基神经网络预测模型，分别运用最大值最小值、零均值规格化方法，得到的该市2002年预测日燃气日负荷预测结果，见表2。表2中，预测值1、相对误差1分别表示采用最大最小规格化的计算结果及对于真实日负荷的相对误差；预测值2、相对误差2表示采用零均值规格化的计算结果及对真实日负荷的相对误差。由表2可知，采用零均值规格化方法的预测精度高于采用最大最小规格化的预测精度。

表2 燃气日负荷预测结果

日期	预测值1/(m³·d^-1)	相对误差1/%	预测值2/(m³·d^-1)	相对误差2/%
2002年2月1日	41.62×10⁴	3.66	40.90×10⁴	1.87
2002年2月2日	39.32×10⁴	4.0l	40.26×10⁴	6.50
2002年2月3日	41.30×10⁴	-1.08	41.05×10⁴	-1.67
2002年2月4日	35.48×10⁴	-14.30	35.96×10⁴	-13.13
2002年2月5日	43.38×10⁴	6.57	42.34×10⁴	4.03
2002年2月6日	40.20×10⁴	-1.59	40.13×10⁴	-1.77
2002年2月7日	40.36×10⁴	-7.55	40.68×10⁴	-6.79

3 结论

① 数据的规格化处理对于预测精度有一定的影响，采用径向基神经网络进行燃气日负荷预测时，经过零均值规格化处理得到的数据预测精度要相对高一些。

② 径向基神经网络预测模型不但考虑到了天气变化对燃气日负荷的影响，还反映出了燃气日负荷以周为单位的周期变化规律。

参考文献：

[1] 朱明.数据挖掘[M].北京：中国科学技术大学出版社，2002.

[2] 周开利，康耀红.神经网络模型及其MATLAB仿真程序设计[M].北京：清华大学出版社，2005.

[3] 飞思科技产品研发中心.小波分析理论与MATLAB7实现[M].北京：电子工业出版社，2004.

[4] 成礼智，王红霞，罗永.小波的理论与应用[M].北京：科学出版社，2004.

(本文作者：梁金凤杨俊杰高铸新奥燃气技术研究发展有限公司河北廊坊 065001)