基于二次修正的短时行程时间预测模型

引用本文

杨航, 王忠宇, 邹亚杰, 吴兵. 基于二次修正的短时行程时间预测模型[J]. 同济大学学报(自然科学版), 2019, 47(10): 1454-1462. DOI: 10.11908/j.issn.0253-374x.2019.10.010.

YANG Hang, WANG Zhongyu, ZOU Yajie, WU Bing. Short-term Travel Time Prediction Model Based on Secondary Correction[J]. Journal of Tongji University (Natural Science), 2019, 47(10): 1454-1462. DOI: 10.11908/j.issn.0253-374x.2019.10.010

基金项目

国家自然科学基金(51608386)

第一作者

杨航(1991—)，男，博士生，主要研究方向为交通控制、交通运行管理、交通系统优化. E-mail:1991hanghang@tongji.edu.cn

通信作者

吴兵(1960—)，男，教授，博士生导师，工学博士，主要研究方向为交通控制、交通拥挤管理. E-mail:wubing@tongji.edu.cn

文章历史

收稿日期：2018-12-16

Contents Abstract Full text Figures/Tables PDF

基于二次修正的短时行程时间预测模型

杨航 ¹, 王忠宇 ², 邹亚杰 ¹, 吴兵 ¹

1. 同济大学道路与交通工程教育部重点实验室，上海 201804;
2. 上海海事大学交通运输学院，上海 201306

收稿日期：2018-12-16

基金项目：国家自然科学基金(51608386)

第一作者：杨航(1991—)，男，博士生，主要研究方向为交通控制、交通运行管理、交通系统优化. E-mail:1991hanghang@tongji.edu.cn

通信作者：吴兵(1960—)，男，教授，博士生导师，工学博士，主要研究方向为交通控制、交通拥挤管理. E-mail:wubing@tongji.edu.cn

摘要：为了提高高速公路短时行程时间预测模型的精度和鲁棒性，同时缓解过度训练带来的过拟合效应，构建了基于小波神经网络和马尔可夫链的组合预测模型，并采用平均绝对误差、平均绝对百分比误差、均方根误差三个指标评价模型的预测效果.分析结果表明，在行程时间突变之后，组合预测模型较其他模型都有着更高的预测精度；同时，该模型在预测行程时间突变点时不存在延迟，说明其在高峰时段内有着更高的预测精度和更强的预测鲁棒性.

关键词：交通管理短时行程时间预测组合预测模型小波神经网络马尔可夫链过拟合缓解

Short-term Travel Time Prediction Model Based on Secondary Correction

YANG Hang ¹, WANG Zhongyu ², ZOU Yajie ¹, WU Bing ¹

1. Key Laboratory of Road and Traffic Engineering of the Ministry of Education, Tongji University, Shanghai 201804, China;
2. College of Transport and Communications, Shanghai Maritime University, Shanghai 201306, China

Abstract: In order to increase both of the accuracy and the robustness for freeway short-term travel time prediction, as well as easing the over-fitting effect, which was brought by the extra training, a hybrid model was proposed on the basis of wavelet neural network and Markov chain. The forecasting performance of different models was examined by three measures, i.e., mean absolute error, mean absolute percentage error, root mean square error. The results show that the proposed hybrid model enjoys obvious superiority over the other models after the break point of travel time. Furthermore, no prediction-delay was observed in the prediction of break point of travel time. In conclusion, the higher prediction accuracy and the better robustness were found in the hybrid model in peak hours.

Key words: traffic management short-term travel time prediction hybrid model wavelet neural network Markov chain over-fitting releasing

短时行程时间预测是智能交通系统的基础输入之一，也是道路交通运行状态的重要评价指标^[1].一般认为，两个决策点之间的时间跨度小于或等于15 min属于短时预测^[2].高速公路行程时间的预测方法主要有时间序列法^[3]、卡尔曼滤波模型^[4]、支持向量机模型^[5]、神经网络模型^[6]、数据挖掘法^[7]以及一系列组合模型^[8]等.在近几年的研究中，由于组合模型可以克服单一模型在预测时的缺陷，通常呈现出优于单一模型的预测精度^[9]，因此组合模型出现的频率逐渐提高.Zhang等^[10]指出, 交通流特征由两部分组成：一是确定性特征，影响因素为道路几何设计、常态下的交通需求、交通管理措施(限速)等；二是非确定性特征，影响因素为交通事件、恶劣天气等突发因素.因此，高速公路行程时间不仅包含确定性的周期性特征，还存在非确定性的残余成分^[11].

周期性分析是行程时间预测中极其重要的一部分，现有研究已经证明行程时间在时间上和空间上均存在着较为显著的周期性.Zhang等^[12]提出行程时间的周期性特征表现为以下两种：一种是以一天24 h为比较维度，一种是以一周7 d为比较维度.两种维度下相同路段的行程时间多数呈现较为明显的周期性特征.Zou等^[13]采用了基于三角函数成分的回归模型对行程时间的周期性进行了分析，并证明该回归模型在预测间隔超过30 min时仍具有较好的预测精度.Zhang等^[14]采用频率分析法对车辆在不同路段的周期性特征进行了提取和分析，并基于分析结果对车辆在不同货运点的延误时间进行了预测.

除去体现确定性成分的周期性特征，还需要对非确定性的残余成分进行分析，以提高预测精度.Vlahogianni等^[15]指出，需要对行程时间数据进行去趋势化分析，以提升预测精度.去趋势化分析指的是将周期性预测值从原始数据中去除，对剩余不确定性的残量部分进行二次预测.现有研究主要采用多状态转换模型^[16]进行去趋势化分析.马尔可夫链模型是去趋势化分析中较为有效和常见的一种手段，往往用于和其他模型配合使用以提高预测精度.D’Angelo等^[17]采用马尔可夫链与周期性预测相结合的方式，对高速公路的常发性拥堵进行了预测，结果证明该模型比对照组模型有较为显著的预测优势.Yeon等^[18]基于交通状态划分结果，建立了交通状态概率转移矩阵，构建了非连续的马尔可夫链模型，并比较了不同交通状态下各模型对高速公路各路段行程时间的预测精度.

基于二次训练的周期性预测和去趋势化分析的结合是当前大部分组合模型的组成结构，但Polson等^[19]通过分析一次训练与二次训练的误差传递规律得出：基于多次训练的预测方法会造成过拟合的发生，降低模型在数据波动性较强情况下的预测精度.Zhang等^[20]考虑了预测中数据的波动性因素，并采用频谱分析法提高了行程时间的预测可靠度.

现有研究的关注点多数聚焦在如何提升短时行程时间预测模型的预测精度，而对于不同交通状态下的预测稳定性、组合模型可能产生的多余噪声以及行程时间突变点(数值激增或骤降的时刻)的预测及时性等方面的内容涉及相对较少^[21-22]，需要进一步考虑模型在这些方面的优化问题.

本研究改善了传统组合预测模型的结构，通过噪声修正模型构建了波动性分析模块，缓解了过拟合效应所带来的预测不稳定性.同时，面向相对误差修正的马尔可夫链不需要针对交通状态进行状态划分，提升了模型的应用灵活性，使得模型具备了处理其他高速公路路段行程时间数据的潜力.此外，噪声修正模块的加入提高了模型在拥堵状态下的预测精度和鲁棒性，使得模型具备了捕捉行程时间突变点的能力，缓解了预测的延迟性，从而可为高速公路交通运行管理提供决策依据.

1 数据来源和采集

本研究所使用的行程时间数据采集于美国高速公路US -290中的编号I-610至FM-1960间的路段，位于德克萨斯州的城市休斯顿.数据采集时间段为2008年1月至2008年8月的每周二到四，每隔30 s采集一次，每30 s的检测数据集计成5 min的区间，一天共采集24 h.该路段有着较明显的潮汐特征，路段由东向西方向在晚高峰承担了大量交通流.这种交通流的不均衡性，有助于检验组合模型波动性分析模块的有效性，也有助于验证组合模型在捕捉晚高峰行程时间“拐点”的及时性和稳定性.研究路段长19.3 km，自由流速度下的通过时间约为15 min.路段上共布设了六个AVI (automatic vehicle identification)检测器，在车辆通过时记录车牌号，通过相同车牌在各个检测器经过的时刻间隔获取行程时间.六个检测器将选定路段分为五个子路段(A、B、C、D、E)，长度分别为1.3、4.2、4.8、2.4、6.6 km.检测器布置如图 1所示，虚线框包围部分为本研究所要涉及的路段，每个雷达感应器旁标注的四位数为对应编号.

图 1 US-290路段 Fig.1 Road US-290

2 组合预测模型

本研究的组合模型分为以下三部分：体现确定性特征的周期性部分，采用小波神经网络(WNN)预测原始数据，得到初步预测值；体现非确定性误差特征的残量部分，采用马尔可夫链(MKC)对初步预测值的相对误差进行修正，得到预测后的相对误差值；体现非确定性噪声的波动分析模块，采用GJR-GARCH (Glosten-Jagannathan-Runkle-generalized-autoregressive-conditional-heteroskedasticity)模型缓解噪声.最终的短时行程时间组合预测值为三部分预测值之和，组合预测模型WNN-MKC-GJR的结构表达式如下所示：

$ {X_t} = {c_t} + {r_t} + {v_t} $

(1)

式中：X_t为组合模型t时刻的预测值；c_t为改进后的小波神经网络t时刻的周期性预测值；r_t为经过马尔可夫链修正的t时刻的相对误差值；v_t为GJR-GARCH模型预测的t时刻波动量.

2.1 小波神经网络模型

作为人工智能算法之一的神经网络可用于检测常态下交通流的周期性特征，并在预测行程时间周期性的实例中得到了成功应用^[23].小波神经网络拓扑结构如图 2所示.图 2中, u_i为第i个输入变量, w_i为u_i对应的输入层节点, T_i为u_i对应的输出层节点, Y(u_i)为u_i对应的小波基函数.本研究的神经网络中，输入层为各个时刻的行程时间真实值，输出层为各个时刻对应的行程时间预测值，中间层为各个输入值对应的小波变换函数，因此各层的神经元数量相同.

图 2 小波神经网络的拓扑结构 Fig.2 Topology of wavelet neural network

采用母小波基函数作为隐藏层激发函数，该函数通过变换分析信号的局部特征，在捕捉原始数据的周期性特征上具有稳定性和高效性^[24]，函数表达式为

$ Y\left( {{u_i}} \right) = \cos \left( {1.75{u_i}} \right){{\rm{e}}^{ - u_i^2/2}} $

(2)

小波神经网络的算法核心是小波分析和傅里叶变换，变换的频率和振幅决定了小波预测结果的振荡幅度.Antonini等^[24]通过增加二次误差反馈模块，基于误差动态实现小波变换的频率和振幅，增加了小波变换的稳定性.动态小波变换函数y_t和小波系数关系函数O(y_t-1)如下所示:

$ {\mathit{\boldsymbol{y}}_t} = f\left( {{\mathit{\boldsymbol{y}}_{t - 1}}} \right) + g\left( {{\mathit{\boldsymbol{x}}_{t - 1}}} \right) + {\mathit{\boldsymbol{e}}_t} $

(3)

$ O\left( {{\mathit{\boldsymbol{y}}_{t - 1}}} \right) = \sum\limits_{q = 1}^M {{W_q}} \sum\limits_{\mathit{\boldsymbol{a}},\mathit{\boldsymbol{b}} \in {\bf{R}}} {{\psi _{\mathit{\boldsymbol{a}},\mathit{\boldsymbol{b}}}}\left( {{\mathit{\boldsymbol{y}}_{t - 1}}} \right)} ,\;\;\;\;\psi \in L\left( {{\mathit{\boldsymbol{y}}_{t - 1}}} \right) $

(4)

式中：x_(t-1)为(t-1)时刻的状态向量；y_t-1为(t-1)时刻反馈的行程时间输入向量；f(·)为关于y_t-1的标量化非线性映射函数；g(·)为关于x_t的标量化非线性映射函数；e_t为t时刻实际行程时间值与未来输出层预测值之间的误差向量；M为分析时段内出现的完整小波周期数；O(y_t-1)为f(y_t-1)的极大似然估计值；W_q为第q个周期的离散化小波变换系数；a为频率(振幅)；b为时空维度；L(y_t-1)为小波变换函数y_t-1的二维函数空间；ψ_{a, b}(y_t-1)为二维小波衍生函数.ψ_{a, b}(y_t-1)是基于标准化小波函数转化而来，如下所示：

$ {\psi _{\mathit{\boldsymbol{a}},\mathit{\boldsymbol{b}}}}\left( {{\mathit{\boldsymbol{y}}_{t - 1}}} \right) = \frac{1}{{\sqrt {\left| \mathit{\boldsymbol{a}} \right|} }}\varphi \left( {\frac{{{\mathit{\boldsymbol{y}}_{t - 1}} - \mathit{\boldsymbol{b}}}}{\mathit{\boldsymbol{a}}}} \right) $

(5)

式中：φ(·)为标准化小波函数.以这两个函数构成小波变换函数，对传统小波神经网络结构进行改进，减少需要标定的参数个数，提高算法的收敛速度.

2.2 马尔可夫链模型

Zhang^[25]的研究指出，神经网络在t时刻的预测误差与(t-1)时刻是高度相关的，而与之前时刻的相关性很小.马尔可夫链模型的显著特征是非后效性，即目标在当前时刻的状态只与前一个时刻的状态相关，而与之前任何时刻的状态无关，与神经网络预测误差的特征相符合.现有研究多采用马尔可夫链对交通流运行状态进行划分，分为拥堵、半拥堵与非拥堵三个状态^[18].该划分方法的缺点在于半拥堵的过渡状态很难量化，当过渡状态不明显时，会严重影响马尔可夫链的收敛精度及速度.针对误差的状态划分方法则具有更广泛的适用性.采用马尔可夫链对初步预测值的相对误差进行二次修正，获得的修正值将作为相对误差预测值.

多状态转换模型的预测过程包含以下三个步骤：确定各个状态及对应区间，将待处理数据放入对应区间，预测每个区间出现的概率.作为多状态转换模型的一种，马尔可夫链的构建及求解过程亦遵循这一过程.首先将小波神经网络训练组的相对误差集合成数据链，将相对误差划分为N个状态(s₁, s₂, …, s_N)，每一个状态对应一个相对误差区间.采用一种基于二叉判定图的划分方法对数据链进行状态划分，关于该方法的细节可参考Xie等^[26]的研究，每个状态对应一个相对误差的范围区间.接着，将数据链中的各个误差分入对应的区间.最后, 在数据划分的基础上对相对误差的最终状态进行求解.

构建马尔可夫链一步转移概率矩阵P，矩阵中的每个元素为p_IJ，表达式如下所示：

$ \mathit{\boldsymbol{P}} = {\left[ {\begin{array}{*{20}{c}} {{p_{11}}}& \cdots &{{p_{1N}}}\\ \vdots &{}& \vdots \\ {{p_{N1}}}& \cdots &{{p_{NN}}} \end{array}} \right]_{N \times N}},\;\;\;\;{p_{IJ}} = \frac{{{o_{IJ}}}}{{{o_I}}} $

(6)

式中：p_IJ为小波神经网络训练组的相对误差由第I个状态转移至第J个状态的出现概率；o_I为第I个状态出现的次数；o_IJ为第I个状态转移至第J个状态的次数.

定义系统的初始状态矩阵为S₀，表达式如下所示：

$ {\mathit{\boldsymbol{S}}_0} = {\left[ {\frac{{{o_N}}}{{\sum\limits_{I = 1}^N {{o_I}} }}} \right]_{1 \times N}} $

(7)

经过K次一步转移概率矩阵运算后得到最终状态S_K，S_K可通过切普曼-柯尔莫哥洛夫方程求得，如下所示：

$ {\mathit{\boldsymbol{S}}_K} = {\mathit{\boldsymbol{S}}_{K - 1}}\mathit{\boldsymbol{P}} = {\mathit{\boldsymbol{S}}_0}{\mathit{\boldsymbol{P}}^K} $

(8)

待马尔可夫链收敛之后，每个最大概率对应的状态被选为修正状态，对应的区间作为相对误差的修正区间，取每个时刻t的预测区间中值U_t作为相对误差值的预测值r_t，表达式如下所示：

$ {r_t} = {d_t}\left( {1 - {U_t}} \right) $

(9)

式中：d_t是经过AVI检测器获取的t时刻行程时间原始数据.

2.3 GJR-GARCH模型

将人工智能算法与统计学方法相结合的组合预测模型容易引入多余噪声，从而产生过拟合效应，这对于高峰时期波动性较大的行程时间的预测精度和预测稳定性带来很大影响.一般认为，过拟合效应所带来的白噪声一般符合白噪声属性^[20].广义的自回归条件化异方差(GARCH)模型能够较好地描述过拟合效应中波动量v_t的概率分布，如下所示：

$ {v_t} = {z_t}\sqrt {{h_t}} $

(10)

$ {h_t} = E\left( {v_t^2|{F_{t - 1}}} \right) $

(11)

式中：z_t为t时刻符合标准正态分布的数集；h_t为t时刻v_t的中间变量；E为期望值计算；F_t-1为(t-1)时刻波动量v_t-1对应的F检验标准值.

基于条件化的异方差模型，本研究所采用的波动分析模型考虑了不同时刻的行程时间数据所对应的不同条件变量，通过异方差模型模拟波动性变量v_t在不同时刻的概率分布.

Bollerslev^[27]首次提出可采用广义的自回归条件化异方差模型来模拟噪声分布，该模型适用性较广，但没有考虑原数据的不对称性，而研究路段的行程时间具有明显的潮汐性，因此该方法并不适用.Glosten等^[28]在Bollerslev研究的基础上提出了GJR-GARCH模型，通过引入新的二维条件变量，获取股票数据初始预测误差中的不对称特性，并通过正变量和负变量的交替以及不同时段下系数与波动量的交叉修正，缓解了多步预测时误差在传播过程中所产生的振荡，对过拟合所形成的多余噪声进行了平滑修正，从而很大程度上缓解了过拟合效应，表达式如下所示：

$ {h_t} = G + \sum\limits_{j = 1}^l {{\beta _j}} {h_{t - j}} + \sum\limits_{k = 1}^Q {\left( {{\alpha _k}v_{t - k}^2 + {\gamma _k}v_{t - k}^2{\lambda _{t - k}}} \right)} $

(12)

式中：G为常数；l为系数β_j对应的波动平滑时段；β_j为与j时刻交叉对应的中间变量h_t-j的非负平滑系数；Q为系数α_k和γ_k对应的波动平滑时段；α_k为与k时刻交叉对应的波动量v_t-k的非负平滑系数；γ_k为与k时刻交叉对应的引入修正变量的波动量v_t-k的非负平滑系数；λ_t-k为(t-k)时刻关于波动量v_t-k的二元修正变量.λ_t-k的表达式如下所示：

$ {\lambda _{t - k}} = \left\{ {\begin{array}{*{20}{l}} {1,}&{{v_{t - k}} < 0}\\ {0,}&{{v_{t - k}} \ge 0} \end{array}} \right. $

(13)

当所有γ_k均为零时，GJR-GARCH模型转变为标准化的GARCH(l, Q)模型.本研究中将采用该模型对行程时间预测中可能产生的过拟合效应进行缓解.

3 模型结果分析 3.1 计算过程与参数标定 3.1.1 改进的小波神经网络模型

基于组合模型WNN-MKC-GJR的架构，对行程时间数据进行组合预测.本研究选用的WNN模型的输入层为所选路段的历史行程时间数据.根据数据筛选，将3月至7月的每周二到四的行程时间数据作为训练组，将8月前12个研究日的数据作为测试组，输出层为第13个研究日，即8月28日的行程时间预测值.将行程时间波动较大的路段D作为目标路段，用以检验波动性分析模块的有效性.以路段D上游的路段A、B、C以及下游的路段E作为关联路段，通过改进的动态小波变换函数对关联路段进行动态权重赋值.五条路段的历史行程时间数据的中值统计情况如图 3所示.

图 3 五个路段的历史行程时间数据分布 Fig.3 Historical travel time data distribution on five links

图 3中, 每个时间点对应的行程时间值为2008年1月—8月中所有对应时间点的行程时间值的平均数.由图 3可以看出，各个路段上每天均有3 h左右的波峰时段，即高峰拥堵时段，但在出现的时间上有先后差异.路段A的行程时间在15:00左右开始增加，16:30左右达到峰值，并在18:00左右完成拥堵消散.路段B、C的行程时间同样在15:00开始呈现上升趋势，17:30左右达到峰值，并在19:00左右恢复平峰速度.路段D、E的行程时间在16:00左右开始上升，较前三个路段晚了1 h，峰值在17:30左右产生，拥堵结束时间为19:00左右.五个路段的行程时间在时空分布上具有相似性和传递性，因此相互之间有着较强的相关性.基于此相关性，在小波神经网络中可将其中几个路段作为关联路段，将剩下的路段作为目标路段进行训练，以提高预测精度.路段D上的行程时间波动较大，可用来检验波动分析模块的有效性.因此, 以路段D为目标路段，以路段D上游的路段A、B、C以及下游的路段E作为关联路段，通过改进的动态小波变换函数对关联路段进行动态赋权.

3.1.2 马尔可夫链模型

在小波神经网络模型得到初步预测值之后，采用马尔可夫链对初步预测值的对应相对误差进行修正，t时刻相对误差Z_t3的表达式如下所示：

$ {Z_{t3}} = \frac{{{Z_{t2}} - {Z_{t1}}}}{{{Z_{t1}}}} $

(14)

式中：Z_t1和Z_t2分别为t时刻行程时间的实际值和小波神经网络预测值.

根据基于二叉判定图^[26]的划分方法对数据链进行状态划分，将初始预测值对应的相对误差集合划分为九个状态(s₁, s₂, …, s₉)，具体对应区间如表 1所示.

下载CSV 表 1 马尔可夫链状态划分 Tab.1 Classification of Markov chain status

基于状态划分结果，分别建立小波神经网络测试组在15:30—19:30各个时刻的状态分布矩阵.将15:30的状态分布矩阵作为初始状态矩阵S₀，并构建马尔可夫链一步转移概率矩阵P，如下所示：

$ \mathit{\boldsymbol{P}} = \left[ {\begin{array}{*{20}{c}} {3/7}&0&{1/7}&0&0&0&0&{1/7}&{2/7}\\ 0&{1/2}&{1/2}&0&0&0&0&0&0\\ 0&0&{1/5}&0&{1/5}&0&{2/5}&{1/5}&0\\ {1/7}&{2/7}&{1/7}&{1/7}&0&{2/7}&0&0&0\\ 0&0&{1/8}&{1/4}&{3/8}&{1/4}&0&0&0\\ 0&0&{1/8}&0&{3/8}&{1/4}&0&0&{1/4}\\ 0&0&0&{3/8}&{1/8}&{1/4}&0&0&{1/4}\\ {1/6}&0&0&0&0&0&{1/2}&{1/3}&0\\ {2/9}&0&0&0&0&{1/9}&{1/9}&{2/9}&{1/3} \end{array}} \right] $

(15)

基于切普曼-柯尔莫哥洛夫方程，可得到8月28日15:30—19:30每隔5 min的时刻点对应的预测相对误差值.

3.1.3 GJR-GARCH模型

不同的(l, Q)组合下，GJR-GARCH模型的噪声削减效果不尽相同.Zhang等^[20]指出，当l、Q均为1时，GJR-GARCH(1, 1)模型相比于其他参数模型能够更好地应对非对称性较强的行程时间数据，并且具有较好的白噪声削减作用，因此研究也采用GJR-GARCH(1, 1)模型作为波动性分析模型.参数估计都采用最大似然估计法，并通过Matlab的“garch”工具箱中的多变量GARCH模型实现GJR-GARCH(1, 1)模型的波动性分析功能.

3.1.4 对照模型

使用三个经典模型作为组合预测模型的对照组，分别是传统小波神经网络模型、BP神经网络模型以及两步自回归(automatic regression 2-step, AR(2))模型.AR(2)模型的计算表达式如下所示：

$ H(t) = \theta H(t - 1) + (1 - \theta )H(t - 2) + \delta (t) $

(16)

式中：H(t)为t时刻AR(2)模型的预测值；θ为平滑权重系数；δ(t)为t时刻的随机噪声.

经过对不同θ的检验测试，当平滑权重系数搜索至0.5附近时，模型的预测表现最佳，并且在(0.50-0.01, 0.50+0.01)范围内波动时AR(2)的预测精度区别不大，因此以0.5作为AR(2)模型的平滑权重系数.

除以上三个模型，本研究还将基于BP、AR(2)、MKC和GJR-GARCH模型构建另外两个对照组合模型，因此共有五个对照模型.两个对照组合模型分别是BP-MKC-GJR模型和AR(2)-MKC-GJR模型，结构及计算过程与WNN-MKC-GJR模型类似，波动分析模块均采用GJR-GARCH(1, 1)模型.

采用平均绝对误差E₁、平均绝对百分比误差E₂与均方根误差E₃评价模型性能，表达式如下所示：

$ \begin{array}{*{20}{c}} {{E_1} = \frac{1}{n}\sum\limits_{t = 1}^n {\left| {{X_t} - {Z_{t1}}} \right|} }\\ {{E_2} = \frac{1}{n}\sum\limits_{t = 1}^n {\left| {\frac{{{X_t} - {Z_{t1}}}}{{{Z_{t1}}}}} \right|} }\\ {{E_3} = \sqrt {\frac{{\sum\limits_{t = 1}^n {{{\left( {{X_t} - {Z_{t1}}} \right)}^2}} }}{n}} } \end{array} $

(17)

式中：n为预测时段内时刻点的总个数.

3.2 预测结果分析

所有模型对2008年8月28日路段D行程时间数据的预测如图 4、5所示.

图 4 行程时间预测结果 Fig.4 Predicted performance of travel time

图 5 预测的相对误差 Fig.5 Predicted relative error

图 4比较了各模型预测值与真实值的差异，用于观察各模型的预测精度.图 5展示了各个时间点不同模型预测值与真实值的相对误差，用于体现各模型在不同时段的预测稳定性.

如图 4所示，在非拥堵时段15:30—16:45内，各模型曲线趋于平稳且较为接近，说明该时段内各模型都能较好地预测行程时间；在拥堵时段16:50—18:50内，WNN-MKC-GJR组合模型所在的曲线最接近真实值曲线，说明该组合预测模型在高峰时段内有较高的预测精度；AR(2)所在的曲线偏离真实值曲线较多，并且当16:50行程时间出现突变时，AR(2)对于该拐点的预测滞后于其他五个模型，在拐点的预测误差为62 s，说明AR(2)模型在处理波动性较强的数据时有明显局限性；WNN-MKC-GJR组合模型在拐点16:50预测上没有滞后性，在16:45—16:50准确预测了行程时间的突变趋势，在突变点的预测值与真实值最为接近，预测误差为18 s.

如图 5所示，非拥堵时段内各模型预测值对应的相对误差波动较小，说明各模型在该时段都有着较好的预测稳定性；在行程时间发生突变的时间点16:50，各预测模型相对误差曲线都出现了不同程度的振荡，其中WNN-MKC-GJR组合模型的振荡幅度最小，相对误差为-15%，并且该值在拥堵时段内一直保持相对较低的水平，曲线保持平稳，相对误差极值为26%，说明该组合模型在高峰时段内有着较好的预测稳定性；AR(2)模型在拥堵时段内的相对误差较于其他五个模型偏高，说明该模型的预测稳定性较低.

图 4、5表明：在增加马尔可夫链二次修正模块和GJR-GARCH模型的波动性分析模块后，模型的预测精度和预测稳定性较之对应的单个模型都会有不同程度的提升.通过三个指标进一步反映各个模型在不同时段(行程时间突变点前后)内的预测能力，如表 2所示.从表 2可得出以下结论：

下载CSV 表 2 预测性能指标比较 Tab.2 Comparison of prediction performance index

(1) 从整个晚高峰时段来看，WNN-MKC-GJR模型在三个指标下的表现都要好于其他五个模型.在行程时间突变发生之前，基于线性预测的AR(2)模型表现最优，原因在于当行程时间波动较小时，基于线性迭代的预测方法能更好地接近真实值；在行程时间发生突变之后，WNN-MKC-GJR模型明显优于其他模型，说明所提出的组合模型在拥堵时段内有着更好的预测精度.

(2) 行程时间突变点之前，在增加MKC-GJR模块之后，WNN、BP和AR(2)模型在三个指标上并未全部提升；在行程时间发生突变之后，MKC-GJR模块对于WNN、BP和AR(2)模型的预测精度均有不同程度的提升，说明马尔可夫链与GJR-GARCH模型的组合可以提升单一模型在拥堵时段内的预测精度.

(3) E₃值方面，单个模型在加入MKC-GJR模块成为组合模型之后，某些预测性能上可能会超过原本比自己高级的单一模型，如BP-MKC-GJR在特定时段(全时段和突变后)内三个指标均优于WNN，同时AR(2)-MKC-GJR在任何时段三个指标均优于BP.在实际运营管理中考虑计算时间的约束时，这一个特征也可以为预测模型的选择带来更多的灵活性.

4 结论

(1) 在充分考虑实际运行过程中行程时间周期性、潮汐性、高峰时段不稳定性后，基于周期性预测、残量修正和波动性分析三个部分构建了新的组合架构，采用改进后的小波神经网络、马尔可夫链和GJR-GARCH模型构建了WNN-MKC-GJR组合预测模型.基于相对误差状态构建的马尔可夫链成分使得组合模型无需对复杂的交通状态进行量化判别，因此具有较强的可移植性.

(2) 加入相对误差修正以及过拟合噪声修正这两个模块之后，WNN-MKC-GJR组合预测模型具有更高的预测精度和更强的预测稳定性，这一表现在高峰时段内尤为明显，预测精度和稳定性要明显优于其他五个对照模型.在平峰时段内，线性的AR(2)模型具有较好的预测精度，这表明在平峰时段内采取平稳的时间序列模型会取得更好的预测效果.

(3) 在行程时间发生突变的时刻，WNN-MKC-GJR组合预测模型可以及时捕捉突变的“拐点”，而其他五种模型都有不同程度的预测滞后.在实际城市交通管控策略的实施过程中，若能准确感知行程时间突变(即大规模拥堵可能形成)时刻，则可以提前采取相关的主动管控措施，缓解拥挤的扩散速度，为高速公路交通流运行管理的决策提供依据.

本研究所涉及的路段上交通事件发生数量不多，因此需要在日后的研究中进一步检验组合模型处理交通事件数据的预测能力.

参考文献

[1]	ZHANG Yanru, ZHANG Yunlong. A comparative study of three multivariate short-term freeway traffic flow forecasting methods with missing data[J]. Journal of Intelligent Transportation Systems, 2016, 20(3): 205 DOI:10.1080/15472450.2016.1147813
[2]	王翔, 陈小鸿, 杨祥妹. 基于K最近邻算法的高速公路短时行程时间预测[J]. 中国公路学报, 2015(1): 102 WANG Xiang, CHEN Xiaohong, YANG Xiangmei. Short term prediction of expressway travel time based on K Nearest Neighbor Algorithm[J]. China Journal of Highway and Transport, 2015(1): 102 DOI:10.3969/j.issn.1001-7372.2015.01.014
[3]	FUSCO G, COLOMBARONI C, ISAENKO N. Comparative analysis of implicit models for real-time short-term traffic predictions[J]. IET Intelligent Transport Systems, 2016, 10(4): 270 DOI:10.1049/iet-its.2015.0136
[4]	YAO Baozhen, CHEN Chao, CAO Qingda, et al. Short-term traffic speed prediction for an urban corridor[J]. Computer-Aided Civil and Infrastructure Engineering, 2017, 32(2): 154 DOI:10.1111/mice.12221
[5]	张娟, 孙剑. 基于SVM的城市快速路行程时间预测研究[J]. 交通运输系统工程与信息, 2011(2): 174 ZHANG Juan, SUN Jian. Prediction of urban expressway travel time based on SVM[J]. Journal of Transportation Systems Engineering and Information Technology, 2011(2): 174 DOI:10.3969/j.issn.1009-6744.2011.02.027
[6]	ELHENAWY M, CHEN Hao, RAKHA H A. Dynamic travel time prediction using data clustering and genetic programming[J]. Transportation Research, Part C: Emerging Technologies, 2014, 42: 82 DOI:10.1016/j.trc.2014.02.016
[7]	孙健, 张颖, 张纯. 基于驾驶人路径选择偏好的OD行程时间预测方法[J]. 交通运输工程学报, 2016(2): 143 SUN Jian, ZHANG Ying, ZHANG Chun. Prediction method of OD travel time based on driver's route choice preference[J]. Journal of Traffic and Transportation Engineering, 2016(2): 143 DOI:10.3969/j.issn.1671-1637.2016.02.017
[8]	ZOU Yajie, ZHU Xinxin, ZHANG Yunlong, et al. A space-time diurnal method for short-term freeway travel time prediction[J]. Transportation Research, Part C: Emerging Technologies, 2014, 43: 33 DOI:10.1016/j.trc.2013.10.007
[9]	NANTES A, NGODUY D, BHASKAR A, et al. Real-time traffic state estimation in urban corridors from heterogeneous data[J]. Transportation Research, Part C: Emerging Technologies, 2016, 66: 99 DOI:10.1016/j.trc.2015.07.005
[10]	ZHANG Xiaoyan, RICE J A. Short-term travel time prediction[J]. Transportation Research, Part C: Emerging Technologies, 2003, 11: 187 DOI:10.1016/S0968-090X(03)00026-3
[11]	VLAHOGIANNI E I, KARLAFTIS M G, GOLIAS J C. Short-term traffic forecasting: where we are and where we're going[J]. Transportation Research, Part C: Emerging Technologies, 2014, 43: 3 DOI:10.1016/j.trc.2014.01.005
[12]	ZHANG Shen, TANG Jinjun, WANG Haixiao, et al. Revealing intra-urban travel patterns and service ranges from taxi trajectories[J]. Journal of Transport Geography, 2017, 61: 72 DOI:10.1016/j.jtrangeo.2017.04.009
[13]	ZOU Yajie, HUA Xuedong, ZHANG Yanru, et al. Hybrid short-term freeway speed prediction methods based on periodic analysis[J]. Canadian Journal of Civil Engineering, 2015, 42(8): 570 DOI:10.1139/cjce-2014-0447
[14]	ZHANG W, QI Y, HENRICKSON K, et al. Vehicle traffic delay prediction in ferry terminal based on Bayesian multiple models combination method[J]. Transportmetrica A: Transport Science, 2017, 13(5): 467 DOI:10.1080/23249935.2017.1294631
[15]	VLAHOGIANNI E I, GOLIAS J C, KARLAFTIS M G. Short-term traffic forecasting: overview of objectives and methods[J]. Transport Reviews, 2004, 24(5): 533 DOI:10.1080/0144164042000195072
[16]	NANTHAWICHIT C, NAKATSUJI T, SUZUKI H. Application of probe-vehicle data for real-time traffic-state estimation and short-term travel-time prediction on a freeway[J]. Transportation Research Record: Journal of the Transportation Research Board, 2003(1855): 49
[17]	D'ANGELO M, Al-DEEK H, WANG M. Travel-time prediction for freeway corridors[J]. Transportation Research Record: Journal of the Transportation Research Board, 1999(1676): 184
[18]	YEON J, ELEFTERIADOU L, LAWPHONGPANICH S. Travel time estimation on a freeway using discrete time Markov Chains[J]. Transportation Research, Part B: Methodological, 2008, 42(4): 325 DOI:10.1016/j.trb.2007.08.005
[19]	POLSON N G, SOKOLOV V O. Deep learning for short-term traffic flow prediction[J]. Transportation Research, Part C: Emerging Technologies, 2017, 79: 1 DOI:10.1016/j.trc.2017.02.024
[20]	ZHANG Yanru, ZHANG Yunlong, HAGHANI A. A hybrid short-term traffic flow forecasting method based on spectral analysis and statistical volatility model[J]. Transportation Research, Part C: Emerging Technologies, 2014, 43: 65 DOI:10.1016/j.trc.2013.11.011
[21]	KAMARIANAKIS Y, GAO H O, PRASTACOS P. Characterizing regimes in daily cycles of urban traffic using smooth-transition regressions[J]. Transportation Research, Part C: Emerging Technologies, 2010, 18(5): 821 DOI:10.1016/j.trc.2009.11.001
[22]	TANG Jinjun, LIU Fang, ZOU Yajie, et al. An improved fuzzy neural network for traffic speed prediction considering periodic characteristic[J]. IEEE Transactions on Intelligent Transportation Systems, 2017, 18(9): 2340 DOI:10.1109/TITS.2016.2643005
[23]	ADAMO F, ANDRIA G, ATTIVISSIMO F, et al. A comparative study on mother wavelet selection in ultrasound image denoising[J]. Measurement, 2013, 46(8): 2447 DOI:10.1016/j.measurement.2013.04.064
[24]	ANTONINI M, BARLAUD M, MATHIEU P, et al. Image coding using wavelet transform[J]. IEEE Transactions on Image Processing, 1992, 1(2): 205 DOI:10.1109/83.136597
[25]	ZHANG H M. Recursive prediction of traffic conditions with neural network models[J]. Journal of Transportation Engineering, 2000, 126(6): 472 DOI:10.1061/(ASCE)0733-947X(2000)126:6(472)
[26]	XIE Aiguo, BEEREL P A. Efficient state classification of finite-state Markov chains[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, 1998, 17(12): 1334 DOI:10.1109/43.736573
[27]	BOLLERSLEV T. Generalized autoregressive conditional heteroskedasticity[J]. Journal of Econometrics, 1986, 31(3): 307 DOI:10.1016/0304-4076(86)90063-1
[28]	GLOSTEN L R, JAGANNATHAN R, RUNKLE D E. On the relation between the expected value and the volatility of the nominal excess return on stocks[J]. The Journal of Finance, 1993, 48(5): 1779 DOI:10.1111/j.1540-6261.1993.tb05128.x