老哥学习网 - www.lg9.cn 2024年05月12日 09:14 星期日
当前位置 首页 >公文范文 > 公文大全 >

一种融合ST-GCN算法的高速公路节假日流量预测模型

发布时间:2023-07-01 13:40:03 浏览数:

贾百强, 徐延军,, 周 涛

(1.中远海运科技股份有限公司,上海 200135;
2.上海船舶运输科学研究所有限公司,上海 200135)

近年来,随着经济的不断发展,我国的人均汽车保有量不断增加,交通拥堵已成为高速公路中常见的现象。尤其是在节假日期间,高速公路拥堵现象更为严重。因此,预测节假日期间交通流量的变化趋势,对于缓解交通拥堵现象,确保路网运行畅通而言具有重要意义。

现有的交通流量预测方法可分为模型驱动的方法和数据驱动的方法2种。

1)模型驱动的方法主要解释交通流量、速度和密度之间的瞬时和稳态关系。这种方法需基于对先验知识的全面掌握和详细的系统建模才能实现,代表性方法有排队论模型[1]和交通速度模型[2]等。现实中,交通数据会受多种因素的影响,采用该方法很难得到准确的交通模型。

2)数据驱动的方法根据数据的统计规律推断交通的变化趋势,并最终预测和评估交通状态。这种方法不分析交通系统的物理特性和动态行为,具有很强的灵活性,代表性方法有历史平均模型[3]、自回归移动平均(Autoregressive Integrated Moving Average,ARIMA)模型[4]、k-最近邻模型[5]、支持向量回归(Support Vactor Regression,SVR)模型[6]和神经网络模型等。

目前,传统的高速公路管理信息化平台只对收集到的数据进行简单的统计,形成交通评价结果,没有充分利用数据中隐含的更有价值的信息预测未来的交通状况。流量预测场景大多集中在旅游区游客流量预测[7]和航空交通流量预测[8]等领域中,高速公路场景下的交通流量预测很少。因此,选择合适、高效的交通流量预测方法,利用有限的节假日历史数据,适应节假日流量预测需求,实现快速准确的流量预测,是亟需解决的问题。

基于上述分析,本文提出一种融合时空图卷积网络(Spatio-Temporal Graph Convolutional Network, ST-GCN)算法的高速公路节假日流量预测模型。以宁夏高速公路某区段为研究对象,对该模型的有效性进行验证。该模型基于收集到的大量交通数据,既能在面对高并发等场景时具有较强的稳定性和鲁棒性,又能有效利用交通数据达到高效准确预测未来时段内的交通流量的目的。

1.1 总体架构

该融合ST-GCN算法的高速公路节假日流量预测模型主要由数据预处理、交通流量预测与分析和数据展示与共享等3部分组成,见图1。

图1 系统总体架构

1)数据预处理部分主要是数据准备和数据清洗,实时收集的数据包括业务数据和参数数据。业务数据有出入口收费站数据、门架交易数据、行车数据、基础路网数据和天气数据等;
参数数据有模型参数、预测参数和路网参数。对收集的数据进行清洗,如缺失值填充、异常值清洗和格式内容校验等。

2)交通流量预测与分析部分主要包括数据库数据整合、预测场景、算法模型和模型评价体系。

(1)数据库存放经过预处理得到的数据,通过将数据库中的多源数据整合到模型中,提高模型的预测精度;

(2)预测场景包括常规节假日场景和特殊场景,模型主要应用于宁夏高速公路中,宁夏除了有常规的节假日以外,还有开斋节和古尔邦节,对应的预测模型也需进行适应性设定;

(3)模型针对高速公路预测场景的时空特性,利用长短期记忆(Long Short-Term Memory,LSTM)网络[9]模型处理时序数据得到时间特性,利用图卷积网络[10](Graph Convolutional Network,GCN)模型捕获高速公路空间特性,采用注意力机制处理天气等影响交通状况的外部因素;

(4)建立模型评价体系,对预测结果与真实数据进行比较,计算预测数据与现实数据之间的误差和预测的准确度,通过分析发现模型中存在的问题,结合在线学习不断对模型进行迭代更新和优化调整。

3)数据展示与共享部分主要是对预测的数据进行展示和对外支撑。对预测到的未来一段时间内的车速和交通流量数据进行可视化展示,并与过去同时段的数据相对比;
同时,源数据和预测数据通过API(Application Program Interface)接口提供共享调用服务。

1.2 技术架构

该模型的技术架构主要分为展示层、访问层、支撑层和基础数据层,每个层次根据不同的作用分为不同的功能模块,采用不同的前沿技术支撑功能,见图2。

图2 系统技术架构

1)展示层采用HTML5结合CSS3对预测结果和其他相关信息进行展示,利用canvas技术实现对部分矢量图像的绘制。对于需要3D立体绘图的功能,采用webGL进行渲染。基于以上技术,展示层实现融合监控、态势预测、统计报表制作和事件报警等功能。

2)访问层采用Nginx技术提高系统的并发能力和可靠性,并通过API Gateway对外提供共享数据访问接口。访问层结合API接口对外展示未来的交通信息,如路侧情报板、门架式LED(Light-Emitting Diade)指示屏等。

3)支撑层基于Redis数据计算和存储服务,包括OLAP(On-Line Analysis Processing)分布式文件存储和分布式搜索引擎等,由TensorFlow为系统预测提供底层算法库和机器学习框架。支撑层主要对源数据进行处理、存储和计算等操作,对展示层负责,提供高效、高质量的数据。

4)基础数据层采用FTP(File Transfer Protocol)方式和SQL(Structured Query Language)方式实现外部数据的接入,将各种高速公路收费站数据和其他路侧设备的监测数据接入系统中。系统接入多种源数据,包括出入口收费站流水、门架采集的数据、基础路网数据、GIS(Geographic Information System)数据、气象数据和实时交通事件等。

1.3 数据预处理

高速公路节假日拥堵预测系统采集的数据来自于不同的系统和设备,存在因传输受到干扰而导致数据出现异常值的问题,以及因不同数据来源的标准不同而导致数据的格式不一致的问题等,因此需对采集的数据进行清洗,清洗过程如下。

1)数据格式转换:对源数据进行格式验证,统一数据格式标准。常见的数据格式问题有:时间、日期和数值计数法等格式显示不一致;
错误字符冗余,如字符串首尾存在空格和字符串乱码等;
数据类型与该字段所需内容不一致,如在天气数据中,一些是用数字代指天气类型,一些是以文本的形式描述。对于这些问题,数据转换方法和转换方式不限于格式化、字符替换和删除等。

2)缺失值填充:对数据中的空值和缺失值进行取数填充,一般采用前/后值填充、均数/中位数填充等方式。

3)异常值处理:采集的数据中可能会存在一些明显不符合实际情况的异常值,如车速为负等,同时还有可能存在不合理的重复值等,一般采用删除法去重,填充合理数据替换异常值。

4)非必要数据剔除:接入的多源数据中有一部分字段是系统预测不需要的,如收费站数据中的交易数据等,将这些非必要的数据剔除。

ST-GCN模型由GCN和LSTM网络2部分组成。

1)空间依赖性。

交通量的变化主要取决于高速公路路网的拓扑结构。上游道路的交通状况通过传递效应影响下游道路的交通状况,下游道路的交通状况通过反馈效应影响上游道路的交通状况。同时,高速公路路网不同于图像,其具有非欧几里得拓扑结构。在本文研究的宁夏典型高速公路路段中,涉及到的路段有银绕城高速、京藏高速、青银高速和银昆高速等,道路长度约为77.3 km,具体研究区域见图3。该区域内涉及到交通枢纽和互通立交,同时道路线性以曲线为主,包含收费站、服务区、旅游风景区和飞机场等多种服务属性,具有典型的宁夏高速公路路网特征。面对当前研究区域的路网结构涉及到的交通节点和枢纽较多的复杂路网,采用GCN模型提取路网中的空间依赖性。

GCN的主要作用是在考虑相邻节点的影响的同时,获得图中每个节点的表示,能对非欧几里得域中的复杂关系和相互依赖性进行建模。在傅里叶域中构造一台滤波器,将其作用于图的节点及其1阶邻域内,捕捉节点之间的空间特征,通过堆叠多个卷积层构建GCN模型。图3为宁夏高速公路研究区域示意图。

图3 宁夏高速公路研究区域示意图

2)时间依赖性。

由于季节变化可能影响温度和天气,进而影响交通,若只使用1个月或几个月的数据,则模型不能推广到不同的季节应用。同时,若只使用特定时间段的数据或只使用工作日的数据,也会引发问题,因为模型不能很好地概括到所提供数据边界之外的情况。例如,仅使用07:00—23:00的交通数据可能会降低模型在该时段外的性能,而仅使用工作日的数据可能会对模型预测周末交通的性能产生不利影响。因此,为综合考虑季节变化和每日全时段不同的交通流量变化趋势,在数据集中采用一整年全天全时段的数据进行学习训练。

为应对高速公路交通中时间序列数据的长短期依赖性,模型采用LSTM网络结构。在这种结构中,输入层与时间序列相关联,每个隐藏层的LSTM网络单元的数量与时间序列的时间步长相关联。为确定LSTM网络层数和神经元数量,构建更优的LSTM网络结构,分别将LSTM网络层数设置为1层、2层和3层,分别将LSTM网络中的神经元数量设置为100个和200个,进行一系列对比试验,选取更佳的网络结构。对比试验结果见表1。由表1可知:当LSTM网络层数增加至3 层时,模型出现过拟合现象,预测精度明显变差;
当LSTM网络层数相同时,随着神经元个数的增加,模型预测结果与实际值的偏差增大,这是由于本文输入特征不多,神经元数量和LSTM网络层数不宜过多。经过比较,2层LSTM网络、100个神经元的预测模型更契合本文的试验数据,预测精度最高,故选择该模型进行车速预测试验。因此,利用2个隐藏层形成一个堆叠的LSTM网络(见图4),用于进行异常点检测。与只有1个隐藏层的LSTM网络相比,堆叠的LSTM网络能提高模型学习更复杂特征的性能。

表1 对比试验结果

图4 堆叠的LSTM结构

ST-GCN模型能处理复杂的空间依赖性和时间动态性问题。一方面,利用GCN对高速公路网络的拓扑结构进行捕捉,得到高速公路网络的空间相关性;
另一方面,利用LSTM网络捕捉道路交通信息的动态变化,得到高速公路网络的时间依赖性。同时,利用注意力机制学习每一时刻交通信息的重要性,计算出能表达交通状态全局变化趋势的上下文向量,用于完成未来的交通流量预测任务。覆盖全局交通变化信息的上下文向量Ct的计算公式为

(1)

式(1)中:hi为LSTM不同时刻的隐藏状态;
αi为特征向量。

因此,采用ST-GCN算法建模,获取高速公路节假日期间的时间特征和空间特征,融合特征信息,预测未来一段时间内的多目标信息,模型构建流程见图5。根据历史数据和预测情况,给出客观准确的节假日流量预测结果,在分析研判系统内用于指导路网管控,并在节假日路段运行分析系统内进行展示、对比和评估,为管理者提供相应的管理建议,为出行者提供公路交通类流量预警。

图5 ST-GCN算法模型构建流程

3.1 预测指标

在该模型中采用交通流量、平均速度和交通流密度等3个交通流参数作为对高速公路交通流量进行预测的输出指标。

1)交通流量q是指在单位时间内通过某路段的车辆总数,其计算公式为

(2)

式(2)中:N为T时段内通过某路段的车辆数。

2)平均速度是指单位时间内通过该路段所有车辆行驶的距离,其计算公式为

(3)

式(3)中:vj为j路段的车辆平均速度;
si为第i辆车单位时间内行驶的距离;
t为设定的单位时间。

3)交通流密度D是指某路段单位时间内通过单位距离的车辆数,其计算公式为

(4)

式(4)中:v为车辆速度。

3.2 模型目标

评价因素集是由能用于判断当前或未来交通状态的各种因素组成的集合。在设计融合ST-GCN算法的高速公路节假日流量预测系统时,根据特定的场景和业务需求了解交通状态划分标准,从而建立起相应的评价因素集。

建立评价因素集A,包含交通流量a1、交通流密度a2、平均车速a3和通行方向a4等,其表达式为

A={a1,a2,a3,a4}

(5)

建立评语集M,其是划分评价因素等级的集合。根据真实场景中的交通状况,将评价因素划分为5个等级(包括自由流、基本畅通、轻度拥堵、中度拥堵和严重拥堵),其表达式为

M={m1,m2,m3,m4,m5}={自由流,基本畅通,轻度拥堵,中度拥堵,严重拥堵}

(6)

根据ST-GCN模型输出的预测结果,结合评价集,对当前节假日流量进行等级划分,并在高速公路路侧情报板上展示(见图6),提供未来一段时间内的高速公路节假日流量信息。

图6 高速公路路侧情报板展示

4.1 预测结果验证

为验证融合ST-GCN算法的高速公路节假日流量预测模型的有效性,对模型的预测结果进行验证。选取宁夏高速公路路网中某路段2020年5月—2021年4月的流量数据进行分析,先根据数据编号字段筛选相关数据并去除重复的数据行,再按时间顺序对选取的数据进行排序,对缺失流量字段进行插值处理,得到相对完整的试验组数据。由于原始数据以5 min为汇聚度,需以天为单位对数据进行汇聚,得到每日的交通量。平均速度是评价道路通畅程度最直观的指标之一,不失一般性,将ST-GCN模型的平均速度预测结果与采用以下基线方法的模型预测结果相对比。

1)ARIMA模型。该模型为统计模型中最常见的一类模型,能实现对时间序列的预测,是在将非平稳时间序列转化为平稳时间序列过程中,仅对因变量的滞后值和随机误差项的现值和滞后值加以回归建立的模型。

2)SVR模型[11]。SVR 是一种能用来处理非线性问题和大规模预测问题的算法,其通过采用历史数据对模型进行训练,得到输入与输出之间的关系,从而对未来的交通数据做出预测。

3)LSTM单元模型,详见第2.1节。

4)GCN模型,详见第2.1节。

5)扩散卷积循环神经网络(Diffusion Convolutional Recurrent Neural Network,DCRNN)[12]。

利用有向图的双向随机游动捕获空间依赖,通过编解码结构和定时采样捕获时间依赖。DCRNN 是一个融合了空间依赖性和时间依赖性的交通流预测深度学习框架。

采用ST-GCN模型与基于其他基线方法的预测模型对未来1 h内高速公路交通数据中的速度指标进行预测,结果见表2。从表2中可看出:ARIMA模型只能处理线性数据,对非线性数据的预测效果很差;
SVR模型能有效处理非线性数据,在高速公路数据集中,准确度提高显著;
LSTM模型和GCN模型分别用于捕获时间特性和空间特性,2个模型的误差相对于ST-GCN模型来说较高,这证明了ST-GCN模型优于具有单一捕获特性的模型;
ST-GCN模型和DCRNN模型同为捕获时空特性的模型,但ST-GCN模型的预测精度更高,ST-GCN模型相比DCRNN模型ERMS下降约3.31%,准确度提高约3.01%。通过试验发现,ST-GCN模型在所有评估指标下都有最佳的预测性能,证明了该模型的有效性。

表2 不同预测模型的车辆速度预测结果对比

4.2 模型鲁棒性分析

在实际收集数据过程中,不可避免地存在噪声。为测试ST-GCN模型的抗噪性和鲁棒性,开展扰动分析试验。在试验过程中,将2种常见的随机噪声添加到数据中。随机噪声服从高斯分布N∈(0,σ2)(σ∈(0.2,0.4,0.8,1.2))和泊松分布P(λ)(λ∈(1,2,4,8,16))。在研究过程中将噪声矩阵的值归一化为[0,1]。图7为高斯扰动分析结果,显示了在高速公路数据集中加入高斯噪声的结果,其中σ为高斯噪声分布变化。图8为泊松扰动分析结果,显示了在高速公路数据集中加入泊松噪声的结果,其中λ为泊松噪声分布变化。从图7和图8中可看出,各项评估指标几乎没有发生变化,因此ST-GCN模型的鲁棒性能通过“不同噪声设置下的评估指标变化很小,可忽略不计”这一表现得到验证。

图7 高斯扰动分析结果

图8 泊松扰动分析结果

基于宁夏高速公路节假日期间交通流预测业务的需求,依托多源数据和先进的算法模型,构建了一种融合ST-GCN算法的高速公路节假日流量预测系统,实现数据和预测结果共享式调用展示。基于分布式数据库和算法库,充分利用节假日历史交通数据,并考虑时间、事件、天气和道路拓扑结构等影响因素,融合分析预测,提供有效、准确的交通流预测信息。同时,通过在线学习,不断利用最新的交通数据完善预测模型,使其预测结果更贴合实际交通态势。该融合ST-GCN算法的高速公路节假日流量预测模型能为高速公路的管理和运营提供数据支撑,为高速公路建设提供准确、可靠的决策依据。

猜你喜欢交通流量高速公路交通繁忙的交通童话世界(2020年32期)2020-12-25基于XGBOOST算法的拥堵路段短时交通流量预测建材发展导向(2019年11期)2019-08-24基于GA-BP神经网络的衡大高速公路日交通流量预测中国交通信息化(2018年7期)2018-09-14小小交通劝导员小学生导刊(2018年16期)2018-07-02高速公路与PPP中国交通信息化(2016年9期)2016-06-06基于复合卡和ETC的交通流量采集研究中国交通信息化(2014年11期)2014-06-05MLFF系统在交通流量控制中的应用中国交通信息化(2014年8期)2014-06-05高速公路上的狗小说月刊(2014年4期)2014-04-23GPS在高速公路中的应用河南科技(2014年18期)2014-02-27阅读理解三则中学英语之友·上(2008年1期)2008-03-20

推荐访问:节假日 算法 高速公路

相关文章:

Top