2. 上海国际汽车城(集团)有限公司,上海 201805
2. Shanghai International Automobile City Group Co., Ltd., Shanghai 201805, China
近年来,在国务院《关于积极推进“互联网+ ”行动的指导意见》推动下,共享经济在我国蓬勃发展,成为经济发展的新动力.2017年我国共享经济市场规模达51 365亿,参与共享经济活动总人数达7亿[1], 交通运输是共享经济发展最活跃的领域之一.以汽车分时租赁为例,该共享经济理念于2010年起在中国发展[2].分时租赁为驾驶人提供了更为经济、灵活的用车可行性,降低了机动化出行门槛.
当前我国汽车分时租赁用户以年轻驾驶人为主,其中高校学生群体约占20%[2].由于分时租赁用户驾驶经验不足,驾驶习惯具有相当大的不确定性,增加了道路交通的运行风险,也对运营企业的系统风险管理提出了挑战, 因此亟需对分时租赁用户的驾驶行为进行深入研究.通过对驾驶群体进行风格分类来识别潜在高风险驾驶人,并利用驾驶安全辅助系统(ADAS)、UBI(usage based insurance)等方式进行风险管理,可降低分时租赁企业运营风险.
驾驶风格是表征驾驶人固有驾驶方式的整体性评价指标[3].相关研究主要从节能驾驶、交通安全等角度,将驾驶人划分为两类(激进、温和[4-8])或三类(激进、温和、谨慎[9-11]).既有研究表明,驾驶人的驾驶风格与交通安全密切关联, 激进驾驶风格驾驶人存在频繁换道、急加减速、近距离跟驰等不良驾驶行为,易增加事故发生概率[12].
驾驶风格研究主要基于主观问卷调查[13]、驾驶模拟[8, 10]、自然驾驶[4-5, 8, 13-17]等方法获取数据, 并以高精度驾驶行为数据为主,如采集频率为1 Hz[4, 13]、10 Hz[5, 15-16]的高频卫星定位(GPS)轨迹数据.然而,汽车分时租赁企业采集的轨迹数据以车辆定位为目的,主要是低频轨迹数据(GPS采集间隔为30~120 s).如何基于低频轨迹数据特征,构建驾驶风格评估指标并开展驾驶风格分类仍待研究.
本研究基于汽车分时租赁企业的低频轨迹数据进行驾驶行为的辨识与特征提取,采用聚类算法对分时租赁用户的驾驶风格进行划分,并开展不同驾驶风格驾驶人的特征分析.
1 研究综述驾驶风格评估的核心在于驾驶行为多维特征提取和分类模型的应用.本节将从驾驶风格特征指标与评估归类方法两方面对既有研究进行探讨.
1.1 驾驶风格特征指标既有研究的驾驶风格特征指标可归类为宏、中、微观驾驶行为特征,常用指标如表 1所示.
由表 1可知,多数研究基于加减速、跟驰等微观驾驶行为进行驾驶风格评估.然而,微观驾驶行为特征指标的获取依赖高精度轨迹数据或视频数据.面向海量用户,汽车分时租赁企业采集的低频轨迹数据不适用于此类微观驾驶行为特征提取的开展.
在宏、中观层面开展的驾驶风格特征研究主要采用速度相关指标.宏观层面主要关注平均速度和速度标准差,常以加速度、急加减速次数等微观特征和超速行驶时间比例等中观特征共同作为驾驶风格评估依据[14, 18].中观层面的驾驶风格特征研究常采用高速行驶或超速行为特征.Constantinescu等[14]、孙川等[18]认为车速超过60 km·h-1和限速的80%时驾驶人具备超速倾向,并将超过上述速度阈值的行驶时间比例作为驾驶风格评估指标.高岩[19]将速度80~120 km·h-1和大于120 km·h-1的行驶时间比例纳入驾驶风格评估指标体系.Feng等[5]定义相对超速时间比例为速度大于所有样本驾驶人运行速度99分位的行驶时间与交通通畅状态下正常速度行驶时间的比值,以此为依据划分驾驶人驾驶风格,此方法排除了路况等因素造成相对低速行驶而无法反映驾驶人真实风格的情况,可更准确地判断驾驶行为是否激进.
综上,针对低频轨迹数据特点,本研究将关注租赁用户的超速行为及其特征指标.
1.2 驾驶风格评估方法驾驶风格评估方法可分为四类:基于规则的分类模型、监督学习模型、非监督学习模型和半监督学习模型[26].
基于规则的分类模型通过指定阈值对驾驶风格进行判定[5, 10, 17],其难点为特征指标阈值的确定.监督学习模型在驾驶风格评估时应用广泛,主要包括随机森林[27]、神经网络[11, 27]、支持向量机[19]等, 该类方法难点在于训练数据中驾驶人风格的标定.
由于驾驶风格是一个相对的概念,通常情况下缺乏先验知识,难以进行人工标注类别.因此,非监督学习模型的类别自动划分功能对于驾驶风格分析更为适用,研究人员常通过对模型结果的解读实现对各风格类别的标注.常用非监督学习方法包括聚类算法[14, 18, 20]、隐狄利克雷(LDA)模型[15]等.其中,由于K-means聚类算法具有简单、快速的特点,而且在处理大数据集时具有可伸缩性和高效性,因此在驾驶风格研究中应用广泛.
2 数据准备本研究基于某分时租赁企业在上海市的运营数据开展驾驶风格评估.研究数据包括用户特征、订单信息、车辆GPS轨迹、总线通讯信息(CAN)四个数据集.分时租赁车辆为纯电动汽车,数据采集时段为2017年6月12日—18日,采样间隔为30 s.
对采样间隔30 s的低频轨迹数据开展实际行车路径还原可行性研究.由于篇幅限制,分析过程不做赘述.结果表明,低频轨迹数据具有以下特点:①对于城市快速路等高等级道路路径识别准确性高,而对于城市道路,尤其路网密集区域轨迹还原精度低;②对宏观路径识别效果较好,结合地理信息数据可获取道路类型等宏观出行信息和限速遵守情况、运行稳定性等中观运行特征;③对微观轨迹识别精度较低,无法支撑变道、基于加速度等微观驾驶行为的研究.
因此,基于驾驶人在快速路上的行驶轨迹数据提取运行特征以开展驾驶风格评估.
2.1 轨迹数据与地理信息图层数据匹配开源路线规划引擎[28](OSRM)是支持OpenStreetMap(OSM)的第三方库,将路线规划算法与OSM的开放道路网络数据相结合,可将坐标捕捉到街道网络,实现地图匹配.利用如图 1所示基于OSRM的地图匹配工具实现GPS数据与地理信息图层数据的匹配.
驾驶风格是个体习惯性的驾驶方式,可靠的驾驶风格分析需要建立在一定里程基础上[12].结合出行特征,借鉴既有研究的驾驶里程筛选条件[5],对城市快速路行驶里程大于80 km的驾驶人的行为数据开展分析,分析样本包含235位驾驶人、累计19 347.69 km的城市快速路驾驶数据.
2.2.1 驾驶风格评估特征指标说明基于相对超速时间比例评估驾驶人驾驶风格.相对超速时间比例(T)定义为特定驾驶情境(指定道路类型和交通运行通畅状态)下速度高于v1行驶时长和速度高于v2行驶时长的比值,即:
$ T = \frac{{{t_{{v_1}}}}}{{{t_{{v_2}}}}} \times 100\% $ |
式中:T为相对超速时间比例;tv1为速度高于v1行驶时长; v1为样本驾驶人城市快速路的99分位车速;tv2为速度高于v2行驶时长; v2为城市快速路自由流车速[29].v1、v2取值参考图 2和表 2,v1=90 km·h-1,v2=73 km·h-1.
基于相对超速时间比例,提出以下两个驾驶风格评估变量:
(1) Tl.驾驶人l在城市快速路行驶的相对超速时间比例,表征驾驶人的超速倾向,计算式如下所示:
$ {T_l} = \frac{{\sum\limits_{g = 1}^n {{t_{{v_1}, q}}} }}{{\sum\limits_{q = 1}^n {{t_{{r_2}, q}}} }} \times 100\% $ |
式中:tv1, q、tv2, q分别为第q次出行速度高于v1、v2行驶时长; n为出行次数;
(2) QTl.驾驶人l在城市快速路行驶的相对超速时间比例的变异系数(标准差与平均数的比值),表征驾驶人相对超速行为的稳定性,即对于特定驾驶人,相对超速是习惯性或偶发行为, 计算式如下所示:
$ \begin{array}{*{20}{c}} {{Q_{{T_l}}} = \frac{1}{T}\sqrt {\frac{1}{{n - 1}}\sum\limits_{q = 1}^n {\left( {{T_{lq}} - \bar T} \right)} } }\\ {\bar T = \frac{1}{n}\sum\limits_{q = 1}^n {{T_{lq}}} } \end{array} $ |
式中:Tlq为第q次出行的相对超速时间比例.
2.2.2 驾驶风格评估数据集形成基于第2.1节中GPS数据与地图匹配结果,完成对各驾驶人城市快速路出行和驾驶操作信息的计算和整理,形成如表 3所示评价数据集.
MacQueen[30]提出的K-means算法是聚类技术中最简单且有效的方法之一, 工作机理为:设有k个类,根据目标函数最小化原则,计算各样本和聚类中心之间的最小距离,将样本分配给距离它最近的聚类中心,如此反复迭代至满足目标函数最小或保持不变.K-means聚类算法最小化目标函数为
$ D(C, X) = \sum\limits_i^k {\sum\limits_{{x_j} \in {C_i}} {{{\left\| {{\mathit{\boldsymbol{x}}_j} - {\mathit{\boldsymbol{m}}_i}} \right\|}_2}} } $ |
式中:C为驾驶风格类别, C={C1, C2, …, Ci, …, Ck};X为样本驾驶人集合, X={x1, x2, …, xj, …, xn},xj=(Tj, QTj)T,其中聚类变量Tj和QTj分别为驾驶人在城市快速路的相对超速时间比例和各次出行相对超速时间比例的变异系数;mi为第i类的聚类中心,即第i类样本数据的均值;||xj-mi||2为第i类各样本点到聚类中心的欧式距离.
应用K-means进行聚类分析时,聚类数需要事先给定.由Kaufman等[31]提出的轮廓系数可作为聚类有效性评价指标,以优选聚类数.某样本点xj的轮廓系数定义为
$ s\left( {{\mathit{\boldsymbol{x}}_j}} \right) = \frac{{b\left( {{\mathit{\boldsymbol{x}}_j}} \right) - a\left( {{\mathit{\boldsymbol{x}}_j}} \right)}}{{\max \left\{ {a\left( {{\mathit{\boldsymbol{x}}_j}} \right), b\left( {{\mathit{\boldsymbol{x}}_j}} \right)} \right\}}} $ |
式中:a(xj)是xj与同类其他样本的平均距离,即内聚度;b(xj)是xj与最近类中所有样本的平均距离,即分离度.最近类的定义为
$ {C_i} = \arg \mathop {\min }\limits_{{C_k}} \left( {\frac{1}{n}\sum\limits_{\mathit{\boldsymbol{p}} \in {C_k}} {{{\left| {\mathit{\boldsymbol{p}} - {\mathit{\boldsymbol{x}}_j}} \right|}^2}} } \right) $ |
式中:p是某个类Ck中的样本.利用xj到某个类所有样本平均距离作为衡量该点到该类的距离后,选择离xj最近的一个类作为最近类.
对于样本数据的某次聚类,求出所有样本的轮廓系数后取均值得到平均轮廓系数sk,sk∈[-1, 1].类内样本距离越近,类间样本距离越远,则sk越大,聚类效果越好,sk最大时k即为最佳聚类数.
4 驾驶风格评估结果及特征分析 4.1 基于K-means聚类的驾驶风格评估采用K-means方法划分驾驶风格类别,基于轮廓系数计算结果得到最佳聚类数为3,s3=0.43.聚类结果如图 3、4及表 4所示,依据相对超速时间比例和单次出行相对超速时间比例的变异系数将驾驶风格划分为谨慎、温和、激进三类,各风格分别占样本驾驶人的54.04%、36.60%、9.36%.各风格的特点为:
(1) 谨慎.相对超速时间比例最低且单次出行相对超速时间比例变异系数较高,即超速倾向低,相对超速为偶发行为.
(2) 温和.相对超速时间比例较低且单次出行相对超速时间比例变异系数较高,即超速倾向较低,相对超速为偶发行为.
(3) 激进.相对超速时间比例最高且单次出行相对超速时间比例变异系数较低,即超速倾向较高,相对超速在各次出行中较为稳定地出现.
4.2 驾驶风格特征分析为进一步探究各驾驶风格的差异性,从个体特征、出行特征、车辆运行特征(速度、车辆能耗)和违章记录角度开展了各驾驶风格的特征差异分析.如表 5所示的方差分析结果表明,不同驾驶风格的租赁用户在个体、违章特征无显著差异,但在车辆运行特征和出行特征方面存在显著差异.
个体特征方面,不同驾驶风格在年龄和性别方面无显著差异,但存在一定的趋势,如表 6、7所示.18~25岁年轻驾驶人中仅2.86%驾驶风格激进,这可能与驾龄、驾驶经验、技能等相关,新手或驾驶经验相对不足的年轻驾驶人更为谨慎;与其他年龄组相比,46~60岁谨慎驾驶人比例最低,激进驾驶人比例最高.不同性别驾驶风格构成如表 7所示.
违章特征方面,将违章分为与安全无关(违章停车)和与安全相关(超速、违反标志标线指示等)两类.基于方差分析结果,不同驾驶风格间近半年违章次数、安全相关违章比例均无显著差异,然而具有一定趋势,即激进驾驶人违章次数高于温和及谨慎驾驶人,如表 8所示.三种风格驾驶人的安全相关违章比例均高于上海市总体的69%[32].
出行特征方面,不同驾驶风格的单次出行里程、单次出行时长和高峰行驶时间比例有显著差异,由高到低依次为谨慎、温和、激进,如图 5和表 9所示.夜间行驶时间比例由高到低依次为激进、温和、谨慎,但三种风格驾驶人间不存在显著差异.
车辆运行特征方面,三种驾驶风格间速度差异显著.如图 6和表 10所示,谨慎、温和、激进驾驶人快速路行驶平均速度依次增大,这与聚类变量所表征的超速倾向是一致的,而激进驾驶人速度变异系数更低,保持速度稳定的能力更强.此处速度稳定是相对驾驶人自身速度水平而言,如在相同的速度波动(速度标准差)情况下,平均速度更高的驾驶人具有变异系数更低、速度稳定性更高的特点.既有研究中,Chen等[33]发现速度中等或较高的驾驶人纵向速度波动性更低,与本文结论相似.
车辆能耗特征方面,不同风格驾驶人对应的车辆平均能耗效率(即单位电量行驶里程均值)也存在显著差异,如表 11所示,谨慎、温和、激进驾驶人的平均能耗效率依次升高.表 12表征了不同风格驾驶人的特征对比.
相对超速行为特征可作为驾驶风格识别依据,基于驾驶人相对超速时间比例和各次出行相对超速时间比例两个特征变量,将驾驶风格聚为谨慎、温和、激进三类,其中激进驾驶人占样本总体的9.36%.
不同驾驶风格在出行及运行特征方面也具有差异性.对于出行特征,谨慎、温和、激进驾驶人单次出行平均行驶里程、单次出行平均时长和高峰行驶时间比例依次减少.对于车辆运行特征,谨慎、温和、激进驾驶人的超速倾向、运行速度及车辆能耗效率依次升高.然而,驾驶风格间个人特征(年龄、性别)及违章方面无统计上的显著差异.
本研究仅针对城市快速路驾驶行为,后续可考虑引入其他道路类型(高速公路、城市道路等)的运行特征、出行特征等对驾驶风格及风险进行更全面的评价.此外,当前对驾驶行为的研究仍停留在分析阶段,对于驾驶风格激进的驾驶人群体,可针对性制定安全教育项目或UBI方案等风险管理措施,以降低分时租赁企业运营风险.
[1] |
国家信息中心.中国共享经济发展年度报告(2018)[EB/OL].[2018-03-02]. http://www.sic.gov.cn/archiver/SIC/UpFile/Files/Default/20180320144901006637.pdf. The State Information Center. Annual report of China' s sharing economy development (2018)[EB/OL].[2018-03-02]. http://www.sic.gov.cn/archiver/SIC/UpFile/Files/Default/20180320144901006637.pdf. |
[2] |
Pricewaterhouse Coopers. Development and trends of car-sharing market in China[EB/OL].[2017-06-15]. https://www.strategyand.pwc.com/media/file/Development-trends-of-car-sharing-market-in-China_CN.pdf.
|
[3] |
涂颖菲, 梁修诚, 叶建红. 汽车分时租赁发展中保险机制创新的机遇与挑战[J]. 交通与港航, 2017, 4(6): 32 TU Yingfei, LIANG Xiucheng, YE Jianhong. Opportunities and challenges for insurance mechanism innovation in car-sharing industy[J]. Public Utilities, 2017, 4(6): 32 DOI:10.3969/j.issn.1001-599X.2017.06.007 |
[4] |
MERRIKHPOUR M, DONMEZ B, WANG C, et al. Associations between drivers' safety records and driving styles: a naturalistic study[C]//Proceedings of the Human Factors and Ergonomics Society Annual Meeting. Los Angeles: SAGE Publications, 2013, 57(1): 1973.
|
[5] |
FENG F, BAO S, SAYER J R, et al. Can vehicle longitudinal jerk be used to identify aggressive drivers? An examination using naturalistic driving data[J]. Accident Analysis & Prevention, 2017, 104: 125 |
[6] |
YANG J, DU F, QU W, et al. Effects of personality on risky driving behavior and accident involvement for Chinese drivers[J]. Traffic Injury Prevention, 2013, 14(6): 565 DOI:10.1080/15389588.2012.748903 |
[7] |
JOHNSON D A, TRIVEDI M M. Driving style recognition using a smartphone as a sensor platform[C]//2011 14th International IEEE Conference on Intelligent Transportation Systems (ITSC).[S.l.]: IEEE, 2011: 1609-1615.
|
[8] |
DOSHI A, TRIVEDI M M. Examining the impact of driving style on the predictability and responsiveness of the driver: real-world and simulator analysis[C]//2010 IEEE Intelligent Vehicles Symposium.[S.l.]: IEEE, 2010: 232-237.
|
[9] |
ERICSSON E. Variability in urban driving patterns[J]. Transportation Research, Part D: Transport and Environment, 2000, 5(5): 337 DOI:10.1016/S1361-9209(00)00003-1 |
[10] |
DÖRR D, GRABENGIESSER D, GAUTERIN F. Online driving style recognition using fuzzy logic[C]//17th International IEEE Conference on Intelligent Transportation Systems (ITSC).[S.l.]: IEEE, 2014: 1021-1026.
|
[11] |
XU L, HU J, JIANG H, et al. Establishing style-oriented driver models by imitating human driving behaviors[J]. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(5): 2522 DOI:10.1109/TITS.2015.2409870 |
[12] |
SAGBERG F, PICCININI G F, ENGSTRÖM J, et al. A review of research on driving styles and road safety[J]. Human Factors, 2015, 57(7): 1248 DOI:10.1177/0018720815591313 |
[13] |
HONG J H, MARGINES B, DEY A K. A smartphone-based sensing platform to model aggressive driving behaviors[C]//Proceedings of the SIGCHI Conference on Human Factors in Computing Systems.[S.l.]: ACM, 2014: 4047-4056.
|
[14] |
CONSTANTINESCU Z, MARINOIU C, VLADOIU M. Driving style analysis using data mining techniques[J]. International Journal of Computers Communications & Control, 2010, 5(5): 654 |
[15] |
奇格奇, 吴建平, 杜怡曼, 等. 快速城镇化背景下的驾驶风格多样性分析[J]. 清华大学学报:自然科学版, 2016, 56(12): 1320 QI Geqi, WU Jianping, DU Yiman, et al. Driving styles during rapid urbanization[J]. Journal of Tsinghua University: Science and Technology, 2016, 56(12): 1320 |
[16] |
LI G, LI S E, CHENG B, et al. Estimation of driving style in naturalistic highway traffic using maneuver transition probabilities[J]. Transportation Research, Part C: Emerging Technologies, 2017, 74: 113 DOI:10.1016/j.trc.2016.11.011 |
[17] |
BANERJEE T, CHOWDHURY A, CHAKRAVARTY T. MyDrive: drive behavior analytics method and platform[C]//Proceedings of the 3rd International on Workshop on Physical Analytics.[S.l.]: ACM, 2016: 7-12.
|
[18] |
孙川, 吴超仲, 褚端峰, 等. 基于车联网数据挖掘的营运车辆驾驶速度行为聚类研究[J]. 交通运输系统工程与信息, 2015, 15(6): 82 SUN Chuan, WU Chaozhong, CHU Ruifeng, et al. Driving speed behavior clustering for commercial vehicle based on connected vehicle data mining[J]. Journal of Transportation Systems Engineering and Information Technology, 2015, 15(6): 82 DOI:10.3969/j.issn.1009-6744.2015.06.013 |
[19] |
高岩.基于驾驶行为分类的UBI费率厘定模型[D].北京: 北京交通大学, 2017. GAO Yan. UBI rating model based on driving behavior classification[D]. Beijing: Beijing Jiaotong University, 2017. http://cdmd.cnki.com.cn/Article/CDMD-10004-1017090453.htm |
[20] |
WANG J, ZHENG Y, LI X, et al. Driving risk assessment using near-crash database through data mining of tree-based model[J]. Accident Analysis & Prevention, 2015, 84: 54 |
[21] |
SIMONS-MORTON B G, KLAUER S G, OUIMET M C, et al. Naturalistic teenage driving study: findings and lessons learned[J]. Journal of Safety Research, 2015, 54: 41 |
[22] |
TOLEDO T, MUSICANT O, LOTAN T. In-vehicle data recorders for monitoring and feedback on drivers' behavior[J]. Transportation Research, Part C: Emerging Technologies, 2008, 16(3): 320 DOI:10.1016/j.trc.2008.01.001 |
[23] |
ALJAAFREH A, ALSHABATAT N, AL-DIN M S N. Driving style recognition using fuzzy logic[C]//2012 IEEE International Conference on Vehicular Electronics and Safety (ICVES 2012).[S.l.]: IEEE, 2012: 460-463.
|
[24] |
REYMOND G, KEMENY A, DROULEZ J, et al. Role of lateral acceleration in curve driving: driver model and experiments on a real vehicle and a driving simulator[J]. Human Factors, 2001, 43(3): 483 |
[25] |
CHOI J, TAY R, KIM S, et al. Turning movements, vehicle offsets and ageing drivers driving behaviour at channelized and unchannelized intersections[J]. Accident Analysis & Prevention, 2017, 108: 227 |
[26] |
MARTINEZ C M, HEUCKE M, WANG F Y, et al. Driving style recognition for intelligent vehicle control and advanced driver assistance: a survey[J]. IEEE Transactions on Intelligent Transportation Systems, 2018, 19(3): 666 |
[27] |
KARGINOVA N, BYTTNER S, SVENSSON M. Data-driven methods for classification of driving styles in buses[R]. Detroit: SAE, 2012.
|
[28] |
Mapbox. Open source routing machine[EB/OL].[2018-06-15]. http://project-osrm.org/.
|
[29] |
白旭, 曾胜男, 杜豫川, 等. 城市快速路自由流车速研究[J]. 交通与运输, 2006(增2): 28 BAI Xu, ZENG Shengnan, DU Yuchuan, et al. The research of urban expressway free-flow velocity[J]. Traffic & Transportation, 2006(S2): 28 |
[30] |
MACQUEEN J. Some methods for classification and analysis of multivariate observations[C]//Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability. Berkeley: University of California Press, 1967: 281-297.
|
[31] |
KAUFMAN L, ROUSSEEUW P J. Finding groups in data: an introduction to cluster analysis[M]. New York: John Wiley & Sons, 2009
|
[32] |
上海违章查询.上海交通违章行为排行[EB/OL].[2018-06-30]. https://weizhang.zuzuche.com/wz_action_renking_list.php?page=1&city_id=0&province_id=310000. Shanghai traffic violation query. Shanghai traffic violation ranking[EB/OL].[2018-06-30]. https://weizhang.zuzuche.com/wz_action_renking_list.php?page=1&city_id=0&province_id=310000. |
[33] |
CHEN K T, CHEN H Y W. Driving style clustering using naturalistic driving data[J]. Transportation Research Record, 2019, 2673(6): 176 DOI:10.1177/0361198119845360 |