基于车辆轨迹数据的交叉口危险驾驶行为预测

引用本文

唐克双, 杨博文, 许凯, 孙梓栗, 周楠. 基于车辆轨迹数据的交叉口危险驾驶行为预测[J]. 同济大学学报(自然科学版), 2017, 45(10): 1454-1461. DOI: 10.11908/j.issn.0253-374x.2017.10.006.

TANG Keshuang, YANG Bowen, XU Kai, SUN Zili, ZHOU Nan. Prediction of Driver's Risky Behaviors Based on Vehicle Trajectory Data at Signalized Intersections[J]. Journal of Tongji University (Natural Science), 2017, 45(10): 1454-1461. DOI: 10.11908/j.issn.0253-374x.2017.10.006

基金项目

国家自然科学基金(61673302)

第一作者

唐克双(1980—)，男，副教授，博士生导师，工学博士，主要研究方向为交通控制和智能交通系统. E-mail: tang@tongji.edu.cn

文章历史

收稿日期：2016-10-21

Contents Abstract Full text Figures/Tables PDF

基于车辆轨迹数据的交叉口危险驾驶行为预测

唐克双 , 杨博文 , 许凯 , 孙梓栗 , 周楠

同济大学道路与交通工程教育部重点实验室，上海 201804

收稿日期：2016-10-21

基金项目：国家自然科学基金(61673302)

第一作者：唐克双(1980—)，男，副教授，博士生导师，工学博士，主要研究方向为交通控制和智能交通系统. E-mail: tang@tongji.edu.cn

摘要：基于大量实证车辆轨迹数据建立了信号控制交叉口相位切换期间轨迹预测模型和驾驶员心理决策过程预测模型，并在两个模型的基础上建立了驾驶员危险行为识别的规则，三者共同构成了驾驶员危险行为预测方法.经检验，预测方法的整体精度达到88.89%.该预测方法将驾驶员临近交叉口时的隐藏心理决策过程作为一个重要变量运用到危险行为预测方法中, 并实现了对车辆个体动态化的轨迹预测.

关键词：危险行为预测车辆轨迹预测隐藏心理预测危险行为识别

Prediction of Driver's Risky Behaviors Based on Vehicle Trajectory Data at Signalized Intersections

TANG Keshuang , YANG Bowen , XU Kai , SUN Zili , ZHOU Nan

Key Laboratory of Road and Traffic Engineering of the Ministry of Education, Tongji University, Shanghai 201804, China

Abstract: A trajectory prediction model and a driver's hidden decision-making process prediction model were established based on the collection and analysis of vehicle trajectory data at intersection influenced areas. Moreover, based on these two models, the rules for recognizing driver's risky behaviors were built. The three together constitute the overall driver's risky behaviors prediction method at signalized intersections. It is found that the overall accuracy of this prediction method is 88.89%. This prediction method realizes vehicle's individual dynamic trajectory prediction, utilizing driver's hidden decision-making process as an important variable in prediction of driver's risky behaviors.

Key words: risky behaviors prediction vehicle trajectory prediction driver's hidden decision-making process prediction risky behavior recognition

随着我国社会经济水平的迅速发展，人均机动车保有量急速上升，相应的道路交通事故量也随之增长.在这其中，信控交叉口事故占据较大的比例.世界经济合作与发展组织(OECD)2014年的统计数据显示^[1]，发生在交叉口及其周边的交通事故占整个道路交通事故的30%左右.交叉口的常见事故包括闯红灯、急停、追尾等.

当前对交叉口危险行为的研究主要包括以下三个方面：

一方面是基于两难区的驾驶员危险行为识别.Gazis等^[2]于1960年首次提出关于车辆在黄灯时刻陷入两难区的定义，建立了GazisHermanMaraduin模型；在之后的研究中, Moon等^[3]提出了基于到达车辆变化的速度、加速度，确定实时车辆两难区边界的方法；Zegeer等^[4]在论文中研究了两难区规避系统实施前后的交叉口事故率的变化情况，发现通过延长绿灯时间避免车辆在黄灯时刻陷入两难区的信号控制策略，能够有效降低交叉口54%左右的交通事故，成功验证了车辆在黄灯时刻陷入两难区是驾驶员的一种危险行为，及其对交叉口交通事故的显著影响.但值得注意的是，在这些基于信号控制策略的改善方案中，对两难区的预测大多是通过大量数据获得恒定车辆参数经验值(包括车辆的速度、加速度等)的静态两难区预测方法，这种计算方法很难真实地反映针对不同车辆个体的动态两难区边界变化情况，在精度上存在较大误差.

第二方面是通过分析不同类型驾驶员对信号灯的认识和理解程度，研究驾驶员在交叉口的危险行为.一部分学者探讨了绿闪信号对驾驶员可能做出危险决策的影响^[5-6], 而另外一部分学者则探讨了黄灯信号对驾驶员可能做出危险决策的影响^[7].除了信号灯灯色的影响外，Shawarby等^[8]通过研究发现，车辆在黄灯时刻距离停车线的距离也会在很大程度上影响驾驶员在交叉口做出的决策.

第三方面是研究驾驶员个人特征对驾驶行为的影响.Rakha等^[9]研究发现驾驶员的年龄、性别会对驾驶员在黄灯时刻做出的决策产生显著影响.但当前对驾驶员个人特征进行的相关研究中，未给出如何将驾驶员的隐藏心理决策过程作为一个重要变量，运用在危险行为预测上的定量方法.

为了减少交叉口闯红灯、追尾等事故的发生频率，提高交叉口驾驶员的行驶安全性，本文从驾驶员的角度对可能发生的危险驾驶行为进行预测，开发了基于车辆轨迹的交叉口驾驶员危险行为预测方法，并基于预测信息做出提前预警，帮助驾驶员主动改变危险驾驶行为，提高驾驶安全性.

1 数据采集及处理

本课题数据采集自上海市郊区嘉定区曹安公路的3个交叉口，以及市区四平路大连路交叉口.这4个交叉口作为上海市典型的公路交叉口和城市道路交叉口，能够较好地代表上海市两种不同类型交叉口的普遍状况.曹安公路的3个交叉口自西向东分别为：曹安公路嘉松北路，曹安公路曹丰路，曹安公路翔江公路.4个交叉口的基本情况如表 1所示.交叉口数据采集时间为2013年7月至2013年10月间的16个工作日，天气情况均为良好.对每一个交叉口，分别由两台摄像机进行两组视频的拍摄：A摄像机用于记录进口道上游区域的车辆，B摄像机用于记录信号状态.

下载CSV 表 1 交叉口基本情况 Tab.1 Basic situation at the intersection

数据处理过程如下：首先将视频数据导入视频数据处理软件George 2.1；然后从B摄像机记录的视频中记录每个信号灯周期的绿闪时刻，再回到A摄像机记录的视频中所对应的时刻，跟踪记录绿闪前2 s至红灯亮起时的车辆轨迹，数据采集间隔为0.12 s.

剔除交叉口处的转弯、调头车辆的数据，将得到的交叉口处直行车辆数据导入excel中，提取的数据包括状态数据和轨迹数据两部分，共1 025条，其中跟车车辆数据525条，非跟车车辆数据500条.具体包括车辆编号、车辆类型、绿闪启亮时速度、绿闪启亮时至停车线距离、黄灯启亮时速度、黄灯启亮时至停车线距离、到达停车线时速度以及穿越停车线的时刻.

从1 025条车辆数据中分离出全部的15条闯红灯车辆和3条急停的车辆危险行为状态轨迹数据(共18条)用作后文中对整体预测方法精度验证的数据集A，将剩余的1 007条数据作为后文中轨迹预测模型和驾驶员决策预测模型的数据集B.

2 研究方法

危险行为预测方法的整体流程图如图 1所示，图中建立的轨迹预测模型、驾驶员隐藏心理决策过程模型和危险行为识别规则的具体方法和流程将在以下章节具体阐述.

图 1 驾驶员危险行为预测方法整体流程图 Fig.1 Flowchart of driver's risky behaviors prediction method

2.1 轨迹预测 2.1.1 通过模型的建立

由于通过的车辆轨迹与停止的车辆轨迹存在明显差异，因此，首先需要预测车辆的“通过停止”状况，得到用于被预测车辆后续算法的对应历史数据集.本文通过SPSS软件建立车辆通过与否的二元Logit模型^[10].

本研究中，因所研究道路的车流特征有明显差异，所以需要两种通过模型，分别为跟驰状态下的通过模型和非跟驰状态下的通过模型.根据美国1994年版的《道路通行能力手册》规定^[11]：当车头时距≤5 s时，车辆处于跟驰状态.而文献[12]认为，跟驰行为发生在两车车头间距为0~100 m或0~125 m的范围内.结合实际视频观测，郊区曹安公路3个交叉口的车辆可以认为是处于非跟驰(单车)状态，而市区四平路大连路的交叉口必须认作是跟驰(跟车)状态.

对单车状态下通过模型的建立，本文提取498辆位于曹安公路交叉口车辆在绿闪启亮时刻的速度、加速度、距离停车线的距离以及车型(大车为1，小车为0) 这4个指标作为自变量集X_i，把车辆最终是否通过(通过为0，不通过为1) 作为因变量Y_i，进行Logit模型的建立.导入SPSS软件后，结果如表 2中步骤1所示，车型的显著性水平(0.491) 并不高，说明车型对车辆最终是否通过的影响是不显著的，因此可以考虑剔除车型这一变量，重新对模型进行标定，即进行步骤2.步骤2中3个自变量(速度、加速度、距离停车线的距离)都通过了显著性检验.此时进一步对模型的自变量间的相关性检验，发现3个自变量间的相关性均为显著，因此考虑对自变量进行调整，将距离与速度合并为一个变量T_s，并剔除加速度变量，重新对模型进行标定，即进行步骤3.可以认为模型是合理的，同时，模型正确率高达92.4%.因此，最终的通过模型如下：

$ P = \frac{1}{{1 + {{\rm{e}}^{ - \left( {3.481{T_{\rm{s}}} - 5.618} \right)}}}} $

(1)

下载CSV 表 2 Logit模型标定结果 Tab.2 Logit model calibration results

式中：P为车辆不通过停车线的概率；T_s为车辆在绿闪时刻距离停车线的距离(m)与车辆在绿闪时刻的速度(m·s^－1)的比值.

对跟车状态下车辆通过模型的建立, 也可以采取相似的方法.提取剩余的509辆位于四平路大连路交叉口车辆在绿闪启亮时刻的状态和轨迹数据，得到跟车状态下车辆的通过模型如下：

$ P = \frac{1}{{1 + {{\rm{e}}^{ - \left( {2.734{T_{\rm{s}}} - 4.415} \right)}}}} $

(2)

2.1.2 对应历史轨迹数据集的找寻过程

首先将用于轨迹预测模型和驾驶员决策预测模型训练和验证的数据集B(共1 007条)一分为二：一半作为模型训练和矫正的历史数据子集C(共503条数据)，数据子集C根据车辆是否跟车以及车辆是否通过交叉口进一步分为4个历史数据组；另一半作为验证模型精度的历史数据子集D(共504条数据).

随后取被预测车辆在任意特定时刻的速度、加速度和距离停车线的距离作为通过模型的参数，建立模型预测车辆是否通过交叉口，结合该时刻该车与前车间的车头时距，判断其是否处于跟车状态，根据两者的结果找到该车辆在数据集C中对应的数据组.

2.1.3 轨迹预测模型的建立

本文首先考虑基于单纯K-Nearest Neighbors(KNN)算法^[13]建立轨迹预测模型.

为被预测车辆找到对应的历史数据集分组后，根据被预测车辆预测的起始时间t₀、到停车线的距离s(本文选取绿闪前2 s的车辆真实状态和轨迹数据作为预测起始点数据)，在对应的历史数据组内找出同样处于时间t的样本点.若处于时间t₀的样本点数量大于4，则选取距离d最小的4个样本点；若处于时间t₀的样本点的数量小于4，则将时间范围扩大，即在[t₀-4l, t₀+4l]的区间内(l代表步长，本项研究中每个步长取0.12 s)寻找样本点.根据寻找到的4个最接近的历史车辆状态和轨迹数据值，计算样本点之间的距离d，即 $d = \sqrt {{s^2} + t_0^2} $，同时对距离进行离差标准化处理以忽略量纲对计算的影响，即 ${d_j}\prime = \frac{{{d_j} - {d_{{\rm{min}}}}}}{{{d_{{\rm{max}}}} - {d_{{\rm{min}}}}}}$ (j=1, 2, 3, 4)，然后对4个最接近的距离值的权重系数采用平方权函数，使最近的特征值获得最大权重，依次减小.即

$ {w_i} = \left\{ \begin{array}{l} \frac{{{K^2} - {{\left( {i - 1} \right)}^2}}}{{K\left( {K + 1} \right)\left( {4K - 1} \right)/6}},i = 1,2, \cdots ,K\\ 0,i = K + 1,K + 2, \cdots ,N \end{array} \right. $

(3)

式中:K为样本点的个数，这里取4；i为样本点的排序，距离真实轨迹最近的历史轨迹样本点排序为1，以此类推.

最后计算4个最相邻历史数据的加权平均数，得到下一时刻的预测车辆状态和轨迹值.之后将初始预测的下一时刻的车辆状态和轨迹值，作为下一时刻起始的车辆真实状态和轨迹值，用以预测再下一时刻的车辆状态和轨迹值，依次循环，直到黄灯时刻停止.

然而这种基于单纯KNN算法的轨迹预测方法，由于误差在每个步长的不断积累，导致后半段预测轨迹与真实轨迹间的差值较大，因此本文引入卡尔曼滤波算法对KNN算法存在的误差进行降噪矫正.

卡尔曼滤波算法^[14]是用最小均方根误差作为最佳估计准则，利用前一时间步长内对变量的估计值，和当前时间步长内对变量的观测值综合得出当前时刻的最佳估计值.其核心公式如下：

$ {\mathit{\boldsymbol{X}}_{\left( {k\left| {k - 1} \right.} \right)}} = \mathit{\boldsymbol{A}}{\mathit{\boldsymbol{X}}_{\left( {k - 1\left| {k - 1} \right.} \right)}} + \mathit{\boldsymbol{B}}{\mathit{\boldsymbol{U}}_{\left( k \right)}} $

(4)

$ {\mathit{\boldsymbol{P}}_{\left( {k\left| {k - 1} \right.} \right)}} = \mathit{\boldsymbol{A}}{\mathit{\boldsymbol{P}}_{\left( {k - 1\left| {k - 1} \right.} \right)}}{\mathit{\boldsymbol{A}}^{\rm{T}}} + \mathit{\boldsymbol{Q}} $

(5)

$ {\mathit{\boldsymbol{X}}_{\left( {k\left| k \right.} \right)}} = {\mathit{\boldsymbol{X}}_{\left( {k\left| {k - 1} \right.} \right)}} + {K_{{\rm{g}}\left( k \right)}}\left( {{\mathit{\boldsymbol{Z}}_{\left( k \right)}} - \mathit{\boldsymbol{H}}{\mathit{\boldsymbol{X}}_{\left( {k\left| {k - 1} \right.} \right)}}} \right) $

(6)

$ {K_{{\rm{g}}\left( k \right)}} = {\mathit{\boldsymbol{P}}_{\left( {k\left| {k - 1} \right.} \right)}}{\mathit{\boldsymbol{H}}^{\rm{T}}}/\left( {\mathit{\boldsymbol{H}}{\mathit{\boldsymbol{P}}_{\left( {k\left| {k - 1} \right.} \right)}}{\mathit{\boldsymbol{H}}^{\rm{T}}} + \mathit{\boldsymbol{R}}} \right) $

(7)

$ {\mathit{\boldsymbol{P}}_{\left( {k\left| k \right.} \right)}} = \left( {\mathit{\boldsymbol{I}} - {K_{{\rm{g}}\left( k \right)}}\mathit{\boldsymbol{H}}} \right){\mathit{\boldsymbol{P}}_{\left( {k\left| {k - 1} \right.} \right)}} $

(8)

特别注意的是，在KNN结合卡尔曼滤波的算法中，转移系数A不再是系统常数，而成为根据KNN预测轨迹位置变化的变量，即

$ {A_{k - 1}} = \frac{{{s_k}}}{{{s_{k - 1}}}} $

式中：s_k为KNN轨迹预测中车辆在k时刻的位置.

然而这种KNN结合卡尔曼滤波算法的缺点在于它需要实时的真实观测值的输入，这使得随着卡尔曼滤波对KNN算法预测结果矫正时间的延长，模型能够预测的时间长度减少.因此希望找到一个合适的临界点，作为KNN结合卡尔曼滤波算法和单纯KNN算法的交界，实现模型精度与预测时间长度间的平衡.

令绿闪前2 s到黄灯启亮时刻的时间段长度为t，依次取0, 0.1t, 0.2t, …，t作为KNN结合卡尔曼滤波算法和单纯KNN算法的交界点，对交界点前的时间段采用KNN结合卡尔曼滤波算法进行轨迹预测，之后把交界点处最后得到的经过降噪矫正后的预测车辆状态和轨迹数据，作为后一阶段单纯KNN算法的起始真实车辆状态和轨迹数据，提高单纯KNN算法起点数据的精度.

不同状态的车辆在不同交界点条件下的轨迹预测均方根误差(RMSE)如表 3所示.表 3中 1) 为采用全程单纯KNN算法；2) 为采用全程KNN结合卡尔曼滤波算法.

下载CSV 表 3 不同交界点条件下轨迹预测的均方根误差(RMSE) Tab.3 Root mean square error (RMSE) of trajectory prediction under different conditions

其趋势变化图如图 2所示.

图 2 不同条件下轨迹预测均方根误差 Fig.2 Root mean square error chart for trajectory prediction under different conditions

由图 2可以看出，当交界点位置位于0.3t之后(包括0.3t)，随着交界点位置的改变，模型精度变化很小，因此本文选取0.3t作为KNN结合卡尔曼滤波算法与单纯KNN算法的交界位置.该点既最大程度满足了预测的时间长度，同时又实现了模型精度的优化.

2.1.4 对车辆未来黄灯时刻所处区位的判别

利用前一部分轨迹预测模型预测得到的车辆在黄灯时刻的速度v、加速度a, 以及车辆自身加、减速度等车辆状态数据，计算该车辆的最小停车距离X_c和最大通过距离X₀.

根据之前对于车辆在信控交叉口两难区的研究^[2]，X_c和X₀的计算公式分别为

$ {X_{\rm{c}}} = {V_{\rm{Y}}}\delta + \frac{{{V_{\rm{Y}}}}}{{2d}} $

(9)

$ {X_0} = {V_{\rm{Y}}}\delta + {V_{\rm{Y}}}\left( {t - \delta } \right) + \frac{1}{2}a{\left( {t - \delta } \right)^2} - {L_0} - L $

(10)

式(9)、(10) 中：V_Y为黄灯启亮时车辆的速度，m·s^-1；δ为驾驶员反应时间，这里取1.5 s^[15]；d为车辆的减速度，这里取-0.35g^[15]；t为黄灯信号时长，s；a为车辆的加速度，m·s^-2；L₀为交叉口宽度，m；L为车辆长度，m.

随后通过比较前一部分轨迹预测模型预测得到的车辆在黄灯时刻距离停车线的距离X_v与X_c和X₀之间的大小关系，得以判定车辆未来在黄灯时刻所处的区位，如图 3所示.

图 3 区位判定图 Fig.3 Decision of location

(1) X_c > X₀

当X_v > X_c，车辆位于停止区.

当X₀ < X_v < X_c，车辆位于两难区.

当X_v < X₀，车辆位于通行区.

(2) X_c < X₀

当X_v > X₀，车辆位于停止区.

当X_c < X_v < X₀，车辆位于选择区.

2.2 驾驶员隐藏心理决策过程预测

本文尝试引入隐马尔科夫模型对驾驶员隐藏的心理决策过程进行预测.

建立的隐马尔科夫模型^[16]是一种特殊的马尔科夫过程，在这一模型中，假设不可观测状态(驾驶员隐藏心理状态)变化是服从马尔科夫过程的，而每一隐藏状态又对应于一个可观测状态(车辆的特定时刻的速度、加速度)，而可观测状态可以通过采集的车辆状态和轨迹数据得到.利用隐马尔科夫模型的这一特性，可以对驾驶员潜在的危险认知进行预测.

本课题中，隐藏状态是驾驶员从绿闪启亮时至黄灯结束的6 s期间在任意时刻决定通过/不通过的心理状态；可观测状态是驾驶员在这6 s期间的任意时刻的速度、加/减速度.

利用五元组对本课题中的隐马尔可夫模型进行描述，即

$ \lambda = \left( {N,M,\mathit{\boldsymbol{A}},\mathit{\boldsymbol{B}},\mathit{\boldsymbol{\pi }}} \right) $

(11)

五元组具体的矩阵形式如下所示：

$ N = \left\{ {{q_1},{q_2}} \right\} $

(12)

$ M = \left\{ {\begin{array}{*{20}{c}} {\left( {{v_1},{a_1}} \right)}&{\left( {{v_1},{a_2}} \right)}& \cdots &{\left( {{v_1},{a_j}} \right)}\\ {\left( {{v_2},{a_1}} \right)}&{\left( {{v_2},{a_2}} \right)}& \cdots &{\left( {{v_2},{a_j}} \right)}\\ \vdots & \vdots &{}& \vdots \\ {\left( {{v_i},{a_1}} \right)}&{\left( {{v_i},{a_2}} \right)}& \cdots &{\left( {{v_i},{a_j}} \right)} \end{array}} \right\} $

(13)

$ \mathit{\boldsymbol{A}} = \left[ {\begin{array}{*{20}{c}} {{a_{11}}}&{{a_{12}}}\\ {{a_{21}}}&{{a_{22}}} \end{array}} \right] $

(14)

$ \mathit{\boldsymbol{B}} = \left[ {\begin{array}{*{20}{c}} {{b_{11}}}& \cdots &{{b_{1m}}}\\ {{b_{21}}}& \cdots &{{b_{2m}}} \end{array}} \right] $

(15)

$ \mathit{\boldsymbol{\pi }} = \left\{ {{\pi _1},{\pi _2}} \right\} $

(16)

式(11)~(16) 中：N为驾驶员隐藏心理状态(这里特指驾驶员心理通过与否的决策结果)随时间变化的有限集合；M为车辆可观测的状态数据(包括车辆速度、加速度、到停车线距离等)的有限集合；A为状态转移概率矩阵，a_ij是指驾驶员在t-1时刻的心理状态(即通过/停止)转变为t时刻的心理状态(即停止/通过)的概率；B为观察值概率分布矩阵，b_jk是指每一个时间步t，当驾驶员的可观测状态为(v_i，a_j)时，他的心理状态为通过/不通过的概率；π为给定的初始观测状态下，绿闪启亮时驾驶员心中决定通过/不通过的概率.

随后运用向前向后算法和维特比算法对隐马尔可夫模型进行求解.

运用向前向后算法训练得到准确的隐马尔可夫模型的步骤如下：

(1) 初始化.根据文献[17]中给出的关于π_i，a_ij，b_jk的初值赋值方法(满足概率条件)，利用建立模型的1 007条车辆状态和轨迹数据，得到初始Hidden Markov Model(HMM)参数λ₀，设i=0.

(2) 代入初始HMM参数λ₀和实际观测序列(这里选取之前建立的包含503条历史数据的预测数据集作为实际观测序列)，计算期望值ξ_t(i，j)和γ_t(i).

(3) 用步骤(2) 所得的期望值重新估计π_i，a_ij，b_jk，得到模型λ_i+1.

(4) 循环设计.令i=i+1；重复步骤(2) 和(3)，直至π_i，a_ij，b_jk值收敛.

在MATLAB中实现上述算法，得到最终收敛的A，B，π分别为

$ \mathit{\boldsymbol{A}} = \left[ {\begin{array}{*{20}{c}} {0.98}&{0.02}\\ 0&{1.00} \end{array}} \right] $

式中：驾驶员隐藏心理状态由上一时刻通过转变为这一时刻通过的概率为0.98；驾驶员隐藏心理状态由上一时刻通过转变为这一时刻停止的概率为0.02；驾驶员隐藏心理状态由上一时刻停止转变为这一时刻通过的概率为0；驾驶员隐藏心理状态由上一时刻停止转变为这一时刻停止的概率为1.00.

$ \begin{array}{*{20}{c}} {\mathit{\boldsymbol{B}} = \left[ {\begin{array}{*{20}{c}} 0&0&0&0&0&0\\ 0&{0.02}&{0.12}&0&{0.02}&{0.44} \end{array}} \right.}\\ {\left. {\begin{array}{*{20}{c}} {0.08}&{0.12}&0&{0.13}&{0.20}&{0.47}\\ 0&0&{0.40}&0&0&0 \end{array}} \right]} \end{array} $

式中：第1行表示每个时间步驾驶员心理状态为不通过的概率；第2行表示预测时间段内每个时间步驾驶员心理状态为通过的概率.

π={0.90 0.10}，为驾驶员在绿闪启亮时刻心中决定通过和不通过的概率.

在得到训练后的隐马尔可夫模型后，再次输入实际观测得到的车辆状态和轨迹数据M={o₁, …, o_i}，利用维特比算法求解驾驶员隐藏的心理决策状态，具体的步骤如下：

(1) 初始化

$ {\delta _1}\left( i \right) = {\pi _i}{b_i}\left( {{o_1}} \right),{\varphi _1}\left( i \right) = 0,1 \le i \le N $

(17)

式中：δ_t(i)为Viterbi变量，即t时间步沿状态序列q₁，…，q_t且q_t=S_i产生出o₁，…，o_t的最大概率；φ_t(i)为记忆变量，记录概率最大路径上当前状态的前一个状态.最后得到预测的驾驶员隐藏心理决策序列N={q₁, …, q_j}.

(2) 递归

$ \begin{array}{l} \begin{array}{*{20}{c}} {{\delta _t}\left( j \right) = \left[ {\mathop {\max }\limits_{1 \le i \le N} {\delta _{t - 1}}\left( i \right){a_{ij}}} \right]{b_j}\left( {{o_t}} \right),}\\ {2 \le t \le T,1 \le j \le N} \end{array}\\ \begin{array}{*{20}{c}} {{\varphi _t}\left( j \right) = \left[ {\mathop {\arg \max }\limits_{1 \le i \le N} {\delta _{t - 1}}\left( i \right){a_{ij}}} \right]{b_j}\left( {{o_t}} \right),}\\ {2 \le t \le T,1 \le j \le N} \end{array} \end{array} $

(18)

(3) 终结

$ {p^ * } = \mathop {\max }\limits_{1 \le i \le N} \left[ {{\delta _t}\left( i \right)} \right],q_T^ * = \mathop {\arg \max }\limits_{1 \le i \le N} \left[ {{\delta _t}\left( i \right)} \right] $

(19)

(4) 路径回溯

$ q_t^ * = {\varphi _{t + 1}}\left( {q_{t + 1}^ * } \right),t = T - 1,T - 2, \cdots ,1 $

(20)

2.3 危险行为识别规则的建立

根据之前预测的轨迹，可以判定车辆在黄灯时刻将处在通行区、停止区、选择区还是两难区.依据前车是否通过交叉口(单车状态视为前车通过交叉口)，进一步把车辆的状态分为8个小类.对这8个小类，根据预测的车辆黄灯启亮时刻所处区位，以及利用隐马尔可夫模型预测的驾驶员决策心理状态(通过/停止)，建立相应的危险驾驶行为预测识别规则.具体的分类规则见表 4.

下载CSV 表 4 危险行为预测分类规则 Tab.4 Classification rule of risky behavior prediction

3 模型有效性验证 3.1 对轨迹预测模型的有效性验证

利用前文2.1.2节分离出来的预测历史数据集D(504条)对轨迹预测模型的精度进行验证.在504条历史车辆数据中提取从绿闪前2.0 s到绿闪前0.5 s这一时间段内的车辆状态和轨迹数据，代入模型中预测得到后续直到红灯结束时刻的车辆状态和轨迹数据，并利用预测得到的车辆状态和轨迹数据对车辆在黄灯时刻所处的区位进行预测，然后与真实情况进行对比，得到轨迹预测部分模型的精度为93.65%(472/504).

3.2 对隐藏心理决策过程预测模型的有效性验证

同样地，利用之前特意分离出来的预测历史数据集D (504条)，对驾驶员隐藏心理决策过程预测模型的精度进行验证.提取数据集中504条历史车辆从绿闪前2.0 s到黄灯启亮这一时间段内的车辆状态和轨迹数据，代入模型中预测得到相应时间段内的驾驶员隐藏的心理决策过程.将这一决策过程和驾驶员实际的决策结果进行对比，得到驾驶员决策过程预测部分模型的精度为98.81%(498/504).

3.3 对整体驾驶员危险行为预测方法的有效性验证

为了对所建立模型的有效性进行验证，在建立的数据库中提取存在危险行为但未参与模型训练的全部18辆车的轨迹数据，提取每辆车从绿闪前2.0 s到绿闪前0.5 s这一时间段内的车辆轨迹数据，利用建立的模型对18辆车可能的危险行为进行预测.具体的验证结果见表 5.

表 5 模型验证结果 Tab. 5 Results of model validation

车辆编号	前车是否通过交叉口	预测黄灯时刻区位	实际黄灯时刻区位	预测驾驶员决策过程	驾驶员实际驾驶决策	危险行为预测结果	实际结果
1	是	两难区	两难区	持续采取通过决策	通过	闯红灯	闯红灯
2	是	两难区	两难区	持续采取通过决策	通过	闯红灯	闯红灯
3	是	停止区	停止区	持续采取通过决策	通过	闯红灯	闯红灯
4	是	两难区	两难区	持续采取通过决策	通过	闯红灯	闯红灯
5	是	两难区	两难区	持续采取通过决策	通过	闯红灯	闯红灯
6	是	通过区	两难区	持续采取通过决策	通过	无危险行为发生	闯红灯
7	是	两难区	两难区	持续采取通过决策	通过	闯红灯	闯红灯
8	是	两难区	两难区	持续采取通过决策	通过	闯红灯	闯红灯
9	是	通过区	两难区	持续采取通过决策	通过	无危险行为发生	闯红灯
10	是	停止区	停止区	持续采取通过决策	通过	闯红灯	闯红灯
11	是	两难区	两难区	持续采取通过决策	通过	闯红灯	闯红灯
12	是	两难区	两难区	持续采取通过决策	通过	闯红灯	闯红灯
13	是	停止区	停止区	持续采取通过决策	通过	闯红灯	闯红灯
14	是	停止区	停止区	持续采取通过决策	通过	闯红灯	闯红灯
15	是	停止区	停止区	持续采取通过决策	通过	闯红灯	闯红灯
16	否	通过区	通过区	持续采取通过决策	急停(通过转停止)	急停	急停
17	是	两难区	两难区	通过决策转向停止决策	急停(通过转停止)	急停	急停
18	否	两难区	两难区	通过决策转向停止决策	急停(通过转停止)	急停	急停

下载CSV 表 5 模型验证结果 Tab.5 Results of model validation

根据预测的结果，对所建立的危险行为预测模型的误报率进行分析.

18辆车中16辆车的预测结果为存在危险行为，且根据危险行为规则判别的具体危险行为类别，与实际发生的危险行为类别相吻合；剩余2辆车的预测结果为不存在危险行为，与实际驾驶员出现的危险驾驶行为(闯红灯)结果不符，预测出现误差.轨迹预测模型部分的准确率为88.89%(16/18)，驾驶员决策过程预测准确率为100.00%(18/18)，整体模型的精度为88.89%(16/18).

从对模型误报率的结果分析来看，可以认为利用本文提出的危险行为预测模型，对交叉口可能出现的驾驶员危险行为预测的准确性较高.但是，对模型预测失败的数据进行分析后，发现造成模型失准的原因，均为对车辆未来在黄灯时刻所处区位的预测错误.这说明轨迹预测模型的算法精度仍需要进一步提高.此外，当前用于模型验证的事故数据量较小，可能导致模型在有效性验证的精度上与真实值存在较大误差，在未来的研究中还需要利用大量的交叉口事故车辆的数据，对模型进行进一步的验证和改善.

4 结论

为了减少交叉口处的交通冲突，保障道路行车安全，基于车辆轨迹预测和危险驾驶行为识别开发出相应的交叉口危险驾驶行为预警方法.研究工作的主要成果如下：

(1) 基于对车辆历史数据库的采集与分析，利用SPSS软件建立多元Logit通过模型，利用通过模型的数据筛选功能，再结合KNN和卡尔曼滤波的车辆轨迹预测算法，成功建立了车辆轨迹预测模型.

(2) 引入两难区的概念，并结合运用两难区的区位概念及基于隐马尔科夫模型的预测方法，获得了驾驶员隐藏心理状态预测序列，建立了交叉口驾驶员决策过程预测模型.

(3) 基于之前的车辆轨迹预测和驾驶员决策过程预测模型, 确立了整体的交叉口驾驶员危险行为识别规则，进而建立了整体的危险行为识别预测模型.经过验证，整体模型的准确率为88.89%.

本项研究的创新之处在于：利用隐马尔可夫模型预测驾驶员隐藏心理状态，将其与车辆轨迹预测结合起来，用于识别交叉口驾驶员危险行为，大大提高了实际交通流条件下，对每个个体危险驾驶行为识别的准确率.

参考文献

[1]	The Organization for Economic Cooperation and Development. Road injury accidents[DB/OL]. [2016-7-28]. http://stats.oecd.org/ .
[2]	GAZIS D, HERMAN R, MARADUIN A. The problem of the amber signal light in traffic flow[J]. Operations Research, 1960, 8(1): 112 DOI:10.1287/opre.8.1.112
[3]	MOON Y J, COLEMAN F. Dynamic dilemma zone based on driver behavior and car-following model at highway-rail intersections[J]. Transportation Research Part B: Methodological, 2003, 37(4): 323 DOI:10.1016/S0191-2615(02)00014-0
[4]	ZEGEER C V, DEEN R C. Green-extension systems at high-speed intersection[J]. ITE Journal, 1978, 48(11): 19
[5]	FACTOR R, PASHKER J N, MAHALE D. The flashing green light paradox[J]. Transportation Research Part F: Traffic Psychology and Behaviour, 2012, 15(3): 279 DOI:10.1016/j.trf.2012.01.003
[6]	GATES T J, NOYCE D A, LARACUENTE L, et al. Analysis of driver behavior in dilemma zones at signalized intersections[J]. Journal of the Transportation Research Board, 2007, 2030: 29 DOI:10.3141/2030-05
[7]	SHAWARBY I, RAKHA H, INMAN V, et al. Effect of yellow-phase trigger on driver behavior at high-speed signalized intersections[C/CD]//IEEE Intelligent Transportation Systems Conference.[S.l.]: IEEE, 2006.
[8]	SHAWARBY I, AMER A, RAKHA. H Evaluation of driver stopping behavior on high speed signalized intersection approaches[J]. Journal of the Transportation Research Board, 2008, 2056: 60 DOI:10.3141/2056-08
[9]	RAKHA H, AMER A, EL-SHAWARBY I. Modeling driver behavior within a signalized intersection approach decision-dilemma zone[J]. Journal of the Transportation Research Board, 2008, 2069: 16 DOI:10.3141/2069-03
[10]	National Academies of Science. Highway capacity manual 2010[R]. Washington D C: Transportation Research Board, 2010.
[11]	National Academies of Science. Highway capacity manual 1994[R]. Washington D C: Transportation Research Board, 1994.
[12]	National Research Council. Traffic flow theory[R]. Washington D C: Transportation Research Board, 2006.
[13]	AGRESTI A, KATERI M. Categorical data analysis[M]. New York: Wiley, 1990
[14]	KALMAN R E. A new approach to linear filtering and prediction problems[J]. J Basic Eng Trans, ASME, 1960, 82(1): 35 DOI:10.1115/1.3662552
[15]	FAMBRO D B, FITZPATRICK K, KOPPA R J. Determination of stopping sight distances[R]. Washington D C: Transportation Research Board, 1997.
[16]	BAUM L E, PETRIE T. Statistical inference for probabilistic functions of finite state markov chains[J]. Annals of Mathematical Statistics, 1966, 37(6): 1554 DOI:10.1214/aoms/1177699147
[17]	TANG K S, ZHU S F, XU Y Q, et al. Modeling drivers' dynamic decision-making behavior during the phase transition period: an analytical approach based on hidden markov model theory[J]. IEEE Transactions on Intelligent Transportation Systems, 2016, 17(1): 206 DOI:10.1109/TITS.2015.2462738