您好,欢迎来到尚车旅游网。
搜索
您的当前位置:首页基于时间序列挖掘的隧道交通事件分析

基于时间序列挖掘的隧道交通事件分析

来源:尚车旅游网
88

交通信息与安全 2009年第2期 第27卷 总147期

基于时间序列挖掘的隧道交通事件分析

尚军亮1 方 敏1 张晓松2

(西安电子科技大学1 西安710071) (西安公路研究所2 西安710054)

摘 要 为了及时发现隧道内交通安全隐患,尽量减少交通事故的发生,针对现有隧道交通事件预测方法在实际应用中的不足,引入时间序列法,建立了隧道交通事件时间序列预测模型,该模型可以快捷地得出事故影响因素的预测值,预测出道路交通事件总体发展趋势。实验证明,模型能很好地适应于道路交通事故预测,同时具备了资料较少,建模简单,计算快捷等优点。关键词

时间序列;数据挖掘;交通事件预测

中图分类号:TP274 文献标志码:A

随着我国高速公路建设的不断发展,长大隧道的监控系统也在不断建立和完善。但是监控系统中众多传感器数据具有较强的非线性和滞后性特征,缺乏对数据的及时处理及分析,使得大量的检测数据长期处于/闲置0状态,无法发挥其宝贵的内在价值,对存在的安全隐患不能进行及时有效的预测,因此隧道交通事件屡有发生。

数据挖掘(也称知识发现)[1],是从大量的历史数据中发现隐含的、事先未知的和有价值的知识的方法,是一种新兴的、面向决策支持的数据处理手段。时间序列挖掘[2-3]是从大量具有时间维的历史数据中发掘有价值信息的算法及实现的技术,是数据挖掘在时间序列分析中的一种典型运用。

近年来国内外对隧道交通事件检测技术进行了大量的卓有成效的研究工作,各国纷纷将此课题加入到ITS的研究领域。而国内的交通事件研究工作起步较晚,且绝大部分都是针对普通道路交通安全进行的,对隧道交通事件检测技术的研究很少。针对上述情况,本文将时间序列挖掘方法应用于隧道交通事件预测中,首先在明确隧道交通特点及隧道交通事件分类的基础上,通过对时间序列挖掘基本原理的分析,利用时间序列挖掘方法建立隧道交通事件预测模型,并预测隧道交通事件的发展趋势。

车道隧道,2洞间隔一般为30m。隧道一般不设交叉路口,属于无交叉路口地段。隧道内属于半封闭环境,具有与洞外不一致的行驶条件,这就造成了交通状况的差异。

影响隧道内交通的主要因素[4]是隧道的/黑洞效应0,高速行驶的汽车穿过长大隧道时,生理基础决定了司机的视觉要发生微妙的变化。同时,隧道内空间狭小,视野范围狭窄,废气不易排除,影响司机驾驶判断的准确性,容易诱发交通事故。由隧道交通特点及实际经验可知,隧道内是发生交通事故或其他突发性事件的高发区,而且一旦隧道内发生事故则容易导致不易控制的火灾;堵塞车流不易疏散;CO质量浓度迅速上升;洞内人员呼吸困难甚至窒息等情况。因此科学及时预测及发现隧道交通事件,对公路隧道的交通管理具有重要的意义。

1.2 隧道交通事件及其分析

交通事件是指导致道路通行能力下降的意外事件,如车辆故障、交通阻塞等。但隧道内道路及行车环境不同于普通公路。因此,公路隧道交通的特点决定了其交通事件的分类与特点。其分类如图1所示。

1 隧道交通特点及事件分类

1.1 隧道交通的特点

我国隧道通常为上、下行分设的单向交通2

收稿日期:2008-10-05

图1 隧道交通异常事件分类

隧道交通事件可分为货物洒落、车辆故障、交通挤塞、烟雾、CO质量浓度超标、风速和光照异

常等类型。如果这些交通事件没有得到及时处理,很可能引起交通事故,如撞车、火灾等。在以基于时间序列挖掘的隧道交通事件分析)))尚军亮 方 敏 张晓松

89

上隧道交通事件类型中,有些属于突发偶然性事件,有些属于主观人为事件。这些隧道交通事件一般不会频繁出现且无规律可循,隧道监控系统也无法采集这些事件涉及的相关数据。因此,在本文中检测的是频繁出现、有一定规律可循且相关数据可以由隧道监控系统采集的隧道交通事件。如隧道内交通拥塞、烟雾浓度超标造成的隧道交通事件等。

CO质量浓度,VIS质量浓度等时间序列可能是

非平稳的,它们整体上随着时间的推移而增长,其均值随时间变化而变化。通常将非平稳序列做差分预处理,即可得到平稳的序列。

时间序列的差分处理是指将相邻的2个时间数据相减构成一个新的时间序列。设原序列为x1,x2,,,xn,那么y1(t)=$x(t)=x(t)-x(t-1),得到新序列n-1个观测值,称为原时间序列的第1次差分。对于新的时间序列可以进行自相关分析方法检验平稳性,若不满足平稳性可对其再进行一次差分,即y2=$y(t)=y(t)-y(t-1)。一般情况下,一个非平稳时间序列最多进行2级差分就可以转化为平稳时间序列。

对于差分后得到的时间序列应用ARMA模型分析的方法称为自回归整形滑动平均模型(ARIMA),表示为ARIMA(p,d,q)(d为差分次数)。其建模、预测的过程如图2所示。

2 时间序列挖掘理论分析

2.1 时间序列挖掘基本原理

系统中某一变量或指标的数值或统计观测值,按时间顺序排列成一个数值序列x1,x2,,,xn,就称为时间序列。时间序列是一随机过程,隧道监控系统中涉及的监测数据的时间序列都是围绕隧道交通稳定性这一事件变化的随机过程的一个样本,通过对样本的分析研究,找出动态过程的特性,最佳的数学模型、估计模型参数,并检验利用数学模型进行统计预测的精度,这就是隧道监控事件序列挖掘的主要目的[5]。

目前用于隧道交通事件预测的一般为线性模型。线性模型主要包括自回归(AR(p))模型、滑动平均(MA(q))模型和自回归滑动平均(ARMA(p,q))模型等。因模型形式简单,只需要确定阶数和参数,模型就能完全确定。因此本文主要运用线性模型来进行分析。

2.2 自回归整形滑动平均模型(ARIMA)

在传统的时间序列挖掘方法中运用较为广泛的是ARMA法,该方法的基本思路是:对平稳时间序列运用ARMA(p,q)模型建模,对数据进行自相关及偏相关系数分析,确定p和q的数值,然后进行参数辨识,最后用于预测。

对一个时间序列x1,x2,,,xn,用数学公式来描述ARMA(p,q)模型的过程是:

x(t)+A1x(t-1)+,+Apx(t-p)=b0e(t)+b1e(t-1)+,+bqe(t-q)式中:Ai,bi为常数。

式(1)引入延迟算子后可写为

U(B)xt=((B)et

(2)

式中:xt,et分别为原序列和白噪声序列;B为延迟算子,其满足式为Bdx(t)=x(t-n) n=1,2,,

ARMA(p,q)应用的局限性在于所分析的时间序列必须是平稳时间序列,而在实际应用中,如(1)

[6]

图2 ARIMA建模预测过程

整个过程包括:

1)数据的预处理(包括零均值化处理和差分平稳化处理)。是便于进行计算,提高预测精度。2)模型结构辨识。利用自相关和偏相关分析选择合适的模型并确定模型的阶次。

3)模型参数辨识[7]。一般用最小二乘法确定模型的参数值(变量的系数)。

4)模型检验。检验误差序列是否具有随机性,若模型检验不能通过,则需回到步骤2重新进行模型辨识。

5)利用所建立的合适模型导出其预测模型,应用于实际预测。

在大量不间断数据的基础上,此方法的预测精度较高,是一个比较灵活的预测模型。在建模的过程中可以用一系列的统计方法检验模型的适用性,以不断调整模型的阶数,因此该模型特别适用于稳定的检测数据流。

3 铜黄隧道交通事件的时间序列分

3.1 隧道交通事件因素数据获取

本文的时间序列挖掘是针对铜黄高速公路楼90

子沟、罗圈梁、蒿高梁隧道进行的。

铜黄高速公路是包头)))南宁的重要一段,是西铜高速公路的延伸,是国家和陕西省规划建设的包头至北海西部开发大通道的重要路段,也是陕西省新世纪第一条开通的高等级公路。

铜黄隧道监控系统[8]是一个涉及多因素的复杂体系,本文仅涉及通风系统的烟雾浓度和CO质量浓度变量。因此,本文选择烟雾浓度VIS、CO质量浓度作为交通事件检测的因素数据。这些数据由传感器每150s采集一次,并以时间为关键字分别存储在数据库表中。为体现样本性,本文选取隧道同一位置的2台设备,每台设备采集对应的一种数据。这2种数据的容量均为一个月,从而构建交通事件数据库。

3.2 数据预处理

以铜黄隧道监控数据为例。经数据抽取、换算后进行时间序列数据挖掘。由于偶然误差影响数据的离散性,绘出的变形)))时间曲线出现上下波动,难以进行分析,有必要对量测数据进行回归处理,找出被测物理量随时间变化的规律。从

交通信息与安全 2009年第2期 第27卷 总147期

图3看出,通过已发生实际值对未知时刻值(图中竖线后)进行预测,实际值曲线波动不规则,出现较多的锯齿误差,难以找出平稳预测规律。预测值波动大,规律性不强。

时间序列的平稳性[9-10]是建模的重要前提,因此对经信息提取后的残差序列进行平稳化处理,从而产生平稳、标准化的新序列。本文中应用一次差分处理得到了平稳时间序列。从图4VIS_AVG,CO_AVG曲线与对应的VIS,CO曲线比较可以看出经过一次差分处理后取得了良好的效果,图中虚线预测平滑度高。

通过计算序列的样本自相关函数与偏相关函数,检验他们的截尾性、拖尾性、周期性判断得出用AR模型形式来拟合。根据自编程序分析的结果,模型的阶数为4。相应模型为:

Xt=0.4021Xt-1-0.3321Xt-2+

0.1426Xt-3-0.065Xt-4+Et

3.3 实验结果分析

本文实验环境为MicrosoftVisualC++6.0,

MicrosoftSQLServer2005。从图4中可以看

图3 CO实测数据时间序列挖掘图

出,经过一次差分处理的数据与实测数据对预测都有相同的趋势。但是一次差分后预测值更显平

滑。通过对预测值与数据库中真实值进行对比,发现真实值与通过实测值进行预测的误差均小于10%,而真实值与通过对实测值进行一次差分回归后进行预测的值误差均小于3%。说明该方法的预测精度是相当高的,因此,采用因素时间序列挖掘对隧道交通进行预测是切实可行的。

事件预测模型,通过实例验证了模型的预测精度,考虑了主要的交通因素预测,同时又具备所需数据资料较少,建模简单,计算快捷等优点。需要指出的是文中建立的模型中传感器的选取会对最终的预测结果产生一定的影响。由于隧道交通事件数据的随机性、波动性以及不确定性[11-12],应进一步深入研究,综合运用各种预测方法,以使得隧道交通事件预测值更为准确可靠,从而为交通安全控制提供有效的决策支持。下一步工作重点是探索合适的事件检测方法[13]用于实时检测数据与判定规则库的匹配。

4 结 论

文中引入时间序列挖掘方法,建立隧道交通

基于时间序列挖掘的隧道交通事件分析)))尚军亮 方 敏 张晓松

91

图4 一次分差处理图与原图比较

参考文献

[1] HanJiawei,KamberMicheline.数据挖掘:概念与

技术[M].范明,孟小峰,译.北京:机械工业出版社,2001

[2] JianPeimHanJiawei.MiningSequentialPatterns

byPattern-growth:ThePrefixSpanApproach[J].IEEETransactionsonknowledgeanddataeng-ineering,2004,16(11):1424-1440

[3] JianPei,HanJiawei,Pintoh,etal.PrefixSpan:

MiningSequentialPatternsEfficientlybyPrefix-projectedPatternGrowth[C]//Proc2001IntCon-fDataEngin(ICDE01).LosAlamitos:IEEECom-puterSocietyPress,2001

[4] 张生瑞,马壮林,石 强.高速公路隧道群交通事故

分布特点及预防对策[J].长安大学学报:自然科学版,2007,27(1):63-66

[5] 赫 哲,王晓初,罗 敖,等.韩家岭隧道检测数据

的时序分析方法[J].2007,24(4):483-488

[6] 季彦婕,王 炜,邓 卫.道路交通事故多因素时间

序列宏观预测模型[J].武汉理工大学学报:交通科学与工程版,2006,30(3):433-436

[7] 吕 锋,张炜玮.4种序列模式挖掘算法的特性研究

[J].武汉理工大学学报,2006,28(2):57-60[8] JIGD70-2004.公路隧道设计规范.北京:人民交通

出版社,2004

[9] 薛洁妮,史忠科.基于混沌时间序列分析法的短时

交通流预测研究[J].交通运输工程与信息,2008,18(5):68-72

[10] 樊小红,荆便顺.基于遗传算法的交通事件检测

[J].长安大学学报:自然科学版,2005,25(4):70-72

[11] AgrawalR,SriakntR.MiningSequentialPatters

[A].Procofthe11thInt'lConferenceonDataEn-gineering[C].Taipei:1995

[12] SrikantR,AgrawalR.Miningsequentialpatterns:

generalizationsandperformanceimprovements[C].Proc.FifthInt'lConf.ExtendingDatabaseTechnology(EDBT'96),1996:3-17

[13] MassegliaF,PonceletP,TeisseireM.Incremen-talminingofsequentialpatternsinlargedatabases[J].DataandKnowledgeEngineering,2003,46(1):97-121

TrafficIncidentsAnalysisofTunnelBasedon

TimeSeriesDataMining

SHANGJunliang1 FANGMin1 ZHANGXiaosong2

(XidianUniversity,Xi'an710071,China)

1

2

(Xi'anHighwayResearchInstitute,Xi'an710054,China)

Abstract:Inordertodiscoverthehiddendangerinhighwaytunnelintimeandtrythebesttodecreasethenegative

effectofaccident,basedontheanalysisofthedeficiencyinpracticaluseofpresentroadaccidentpredictionmethods,a

mult-ifactortimeseriesmethodwaspresentedandamult-ifactortimeseriesmodelforforecastingroadaccidentswas

built.Thismodelcaneasilyobtainthefactorsaffectingaccidents,andforecastthegeneraldevelopingtrendofroadacc-i

dents.Anexampleshowsthatthemodelcanbewellappliedtoroadaccidentprediction,andthatithassuchadvantagesaslessrequireddata,simplemodelingtechnique,andquickcomputation.

Keywords:timeseries;datamining;trafficincidentsprediction

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- sceh.cn 版权所有 湘ICP备2023017654号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务