老哥学习网 - www.lg9.cn 2024年05月19日 20:38 星期日
当前位置 首页 >公文范文 > 公文大全 >

基于遗传算法优化BP神经网络的集装箱吞吐量预测

发布时间:2023-06-21 18:10:12 浏览数:

集装箱运输具有减少货损货差率、绿色环保、提高装卸效率、可多式联运等优点,集装箱运输逐渐取代了传统的散货运输方式,成为主要贸易运输方式[1-2]。

根据交通运输部统计,2021年全国港口集装箱吞吐量达2.83亿TEU,在新冠疫情影响下实现逆势同比增长7.0%。在集装箱运输蓬勃发展的同时,伴随而来的是港口建设产能过剩、资源配置效率低等问题[3]。港口的需求是港口投资建设与运营的重要依据[4],而港口基础投资具有高风险、不可逆转的性质[5],因此准确的对港口集装箱吞吐量需求进行预测对提高港口投资效率、指导港口发展方向、规划港口整体布局、制定日常生产作业计划具有重要意义。

自20世纪80年代以来,集装箱吞吐量预测是一个比较热门的研究领域,目前国内外学者针对港口集装箱吞吐量预测的主要方法可分为单一模型和混合模型[6]。单一模型又可分为时间序列模型和非线性模型[7],时间序列模型如指数平滑(Exponential Smoothing,ES)、季节性自回归综合移动平均(Seasonal Autoregressive Integrated Moving Average Model,SARIMA)和灰色预测模型(Grey Forecasting Model,GM)等。例如,陈宁等[8]提出利用对数二次指数平滑方法预测港口吞吐量,结果表明对数二次指数平滑方法适用于快速成长的港口的吞吐量预测。Ghaderi等[9]应用ES方法对澳大利亚主要港口集装箱吞吐量的变化趋势进行预测。王向前等[10]提出一个ARIMAX-SVR预测方法对天津港吞吐量进行预测,改进后的模型精度为0.43%,提高了预测精度。董洁霜等[11]采用SARIMA模型对上海港集装箱吞吐量的季节性变化规律进行分析,并给出月度数据预测值。上述模型大多基于线性假设,不能很好地刻画原始数据中的非线性特征,集装箱吞吐量受到腹地经济、政策环境等因素的影响,其时间序列具有高度非线性[7,12]。随着计算机技术的进步,逐渐开发出人工智能技术为基础的非线性模型,主要包括反向传播(Back Propagation,BP)神经网络、遗传规划(GP)和支持向量机(SVM)。如吴利清[13]以历史前三年的集装箱吞吐量作为输入样本建立BP神经网络预测模型并对验证集进行验证发现精度良好,验证模型可行性后对福州港集装箱吞吐量进行预测。Tang等[14]在分析上海港和连云港的集装箱吞吐量变化时,发现BP模型的预测效果优于GM、三重指数平滑和多元线性回归等时间序列模型。黄安强等[15]首次将遗传规划算法(GP)应用于集成预测问题的研究,并使用最小二乘估计算法(LSE)对经典遗传规划算法进行改进预测青岛港集装箱吞吐量,结果表明基于GP-LSE的非线性集成预测方法在预测数值准确度和方向准确度两个维度都显著优于时间序列模型。宋长利等[16]构建了基于支持向量机模型的多步混合预测方法,并通过对大连港66个月吞吐量样本数据进行了实证分析,结果表明集装箱的预测值与实际值的平均相对误差为2.8%。

集装箱吞吐量受众多因素影响,由于单一模型方法本身的限制,单一模型存在各种缺陷。众多学者提出使用各种混合模型进行预测,如李长安等[17]为提高模型精度,通过蚁群算法优化BP神经网络后进行预测,结果表明混合模型的精度优于其他单一模型。高伟等[18]通过熵值法确定各指标的影响权重,结合BP神经网络方法对机场旅客吞吐量进行预测,证明上述方法可减小误差。谢新连等[19]建立基于随机森林(Random Forest,RF)算法的预测模型,以大连港为案例进行验证,并与三次指数平滑、多元回归分析和BP神经网络三种方法预测进行对比,结果表明随机森林算法预测准确性更高。孙晓聪等[20]提出基于随机森林与双向长短期记忆网络(Long Short-Term Memory Network,LSTM)结合的集装箱吞吐量预测方法对青岛港集装箱吞吐量进行预测,结果显示RF-双向LSTM预测精度显著高于其他模型。He和Wang[21]将GM 1,()1和BP神经网络相结合结果表明,组合模型分别优于其他单一模型,具有更高的预测精度。

BP神经网络具有良好的非线性拟合能力,适合应用于集装箱吞吐量预测[22]。但网络输入变量的合理选择对预测效果至关重要。目前在使用BP神经网络进行集装箱吞吐量的预测研究中,大部分学者使用历史集装箱吞吐量作为输入变量进行预测,如吴利清、陈锦文、曹杰等人[13,23-24]均采用历史集装箱吞吐量数据作为输入变量进行预测。影响集装箱吞吐量的重要因素同时还应包括腹地GDP和腹地货运量[25],等等。本文采用历史前三年集装箱吞吐量、腹地GDP、腹地货运量作为输入变量,遗传算法适用于解决复杂的非线性和多维空间寻优问题[26],利用遗传算法(GA)来弥补BP神经网络连接权值和阈值选择上的随机性缺陷,建立GA-BP预测模型。

1.1 BP神经网络

BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络。BP神经网络能学习和存贮大量的输入输出模式映射关系,网络由输入层、隐含层、输出层组成,其结构如图1所示。

图1 BP神经网络结构图

图1中,X1,X2,…,Xn是网络的输入;
Y1,Y2,…,Ym是网络的输出;
Wij和Wjk是网络的权值;
l是隐藏神经元的个数。目前如何设置隐含层神经元个数没有完整的理论指导,依靠经验公式[27]试验确定。

式(1)中:m为输入层节点个数,n为输出层节点个数,a是自取的任意值,一般范围在1到10之间;
b1,b2…,bn是网络的阈值。

BP神经网络的主要特点是信号前向传播,误差反向传播。设定期望输出值,网络根据预测输出与期望输出的误差对比结果进行反向传播,调整各神经元的权值和阈值。整个过程反复进行,直到网络样本输出误差E<ε(ε为期望误差精度)或训练达到最大迭代次数为止。

1.2 遗传算法

遗传算法是模拟自然界生物进化机制的一种算法。在遗传算法中,通过编码组成初始群体后,遗传操作对群体的个体按照它们对环境适应度施加一定的操作,从而实现优胜劣汰的进化过程。从优化搜索的角度而言,遗传操作可使问题的解一代又一代地优化,并逼近最优解。遗传操作包括以下三个基本操作:选择、交叉和变异。

(1)选择

从群体中选择优胜的个体,淘汰劣质个体的操作叫选择。轮盘赌选择法是最简单也是最常用的选择方法,在该方法中个体的选择概率与其适应度值成比例。设群体大小为n,其中个体i的适应度为fi,则i被选择的概率为:

(2)交叉

交叉是指把两个父代个体的部分结构加以替换重组而生成新的个体的操作。

(3)变异

变异的基本内容是对群体中的个体串的某些基因座上的基因值做变动产生新的个体。

1.3 GA-BP模型

遗传算法优化BP神经网络的步骤如下:

(1)确定BP神经网络拓扑结构从而确定网络的权值和阈值数。

(2)设定GA的相关网络参数。

(3)GA初始值编码并根据BP网络训练误差进行迭代。

(4)用GA迭代得到最优个体并赋值给BP神经网络,运行BP神经网络得到预测结果。

遗传算法优化BP神经网络的流程如图2所示。

图2 GA-BP神经网络流程图

2.1 数据预处理

选取福州港2008—2020年的腹地GDP、腹地货运量、历史前三年的吞吐量数据作为训练样本,考虑数据样本较少,同时设定2008—2020年的相关数据为测试样本,以便进行验证。根据姜云飞的研究[28],福州港腹地GDP=(福州GDP)*95%+(三明GDP)*25%+(南平GDP)*25%+(宁德GDP)*20%+(莆田GDP)*10%。具体数据如表1所示。

表1中,X1为腹地GDP(单位:亿元),X2为腹地货运量(单位:万吨),X3为当年的前三年集装箱吞吐量(单位:万TEU),X4为当年的前2年集装箱吞吐量(单位:万TEU),X5为当年的前1年集装箱吞吐量(单位:万TEU)。Yi为当年实际集装箱吞吐量(单位:万TEU)。

表1 福州港2008—2018年各统计指标数据

2.2 网络参数的设置

遗传算法相关参数:初始种群规模为30,最大进化代数为50,交叉概率为0.8,变异概率为0.2。

BP神经网络相关参数:最大训练次数为1 000,学习速率为0.01,学习最小误差为1×10-6,采用3层结构的网络进行训练,输入层节点为5,输出层节点为1,根据试验法确定隐含层神经元个数,经过大量训练,隐含层神经元个数为4时训练效果较好。

2.3 评价指标

本文选取MAE和MAPE作为模型的评价指标:

其中:m为测试集的个数,xi、yi分别为预测值与实际值。

2.4 仿真结果

通过Matlab R2019a软件仿真,2008—2020年福州港集装箱实际吞吐量、BP神经网络预测值与GA-BP网络预测值以及预测相对误差如表2、图3所示。

图3 BP神经网络与GA-BP预测值对比

表2 福州港2008—2020年预测值对比

通过测试样本的仿真结果,BP神经网络平均绝对误差MAE为26.78,GA-BP模型平均绝对误差MAE为1.636,BP神经网络平均绝对百分比误差MAPE为14.28%,GA-BP模型平均绝对百分比误差MAPE为0.87%,表明GA-BP模型精度更高,同时对比吴利清[13]以历史集装箱吞吐量为输入变量对福州港2012—2020集装箱吞吐量的验证集预测,MAE和MAPE分别为6.27和2.1%,本文同时期测试集的MAE和MAPE分别为1.55和0.59%,显著低于其结果,表明本文的输入变量更合理。

2.5 集装箱吞吐量预测

通过测试集的仿真结果,验证了GA-BP模型进行预测的有效性。根据前文建立的GA-BP预测模型对福州港2021—2025年集装箱吞吐量进行预测。首先采用线性回归预测方法预测腹地货运量,其拟合函数及R2值如图4所示。

图4 线性回归方法预测腹地货运量

根据所得线性拟合函数预测历年货运量值如表3所示。

表3 线性回归方法预测腹地货运量

分析线性拟合函数的结果,平均相对误差MAPE为5.8%,效果良好。同时采用指数回归预测方法预测腹地GDP,其拟合函数及R2值如图5所示。

图5 指数回归方法预测腹地GDP

根据所得指数拟合函数预测历年GDP如表4所示。

表4 指数回归方法预测腹地GDP

分析指数拟合函数的结果,平均相对误差MAPE为3.6%。由此得到2021—2025年福州港腹地货运量与腹地GDP如表5所示。

表5 2021—2025年腹地货运量与腹地GDP预测值

利用GA-BP预测模型预测各年的集装箱吞吐量,预测数据及过程如表6所示。

表6 2021—2025年福州港集装箱吞吐量预测

其中:Yi分别为2021—2025年GA-BP模型的集装箱吞吐量预测值。通过Matlab R2019a仿真,福州港2021—2025年集装箱吞吐量预测值如表7所示。

表7 2021—2025年福州港集装箱吞吐量预测值

2021年福州港实际集装箱吞吐量为345万TEU,预测值为342.11万TEU,再次验证了预测模型的有效性。

本文通过提出腹地GDP、腹地货运量、历史前三年的集装箱吞吐量作为网络输入建立了BP神经网络预测模型,并利用遗传算法优化BP神经网络的初始权值和阈值,从而建立了GA-BP预测模型并进行了验证和预测。通过仿真结果表明,与BP神经网络和以历史集装箱吞吐量数据为输入相比,本文基于腹地GDP、腹地货运量、历史前三年的集装箱吞吐量建立的GA-BP预测模型具备更高的预测精度和合理性,为港口集装箱吞吐量预测提供了一定的参考。

猜你喜欢 腹地货运量吞吐量 2017年上半年拉脱维亚港口货运量同比增长7%大陆桥视野(2017年13期)2017-12-23港口经济与腹地经济互动发展综述经营者(2017年5期)2017-06-26基于SWOT分析法的台州港集装箱运输发展策略水运管理(2017年5期)2017-06-152017年3月长三角地区主要港口吞吐量集装箱化(2017年4期)2017-05-172016年10月长三角地区主要港口吞吐量集装箱化(2016年11期)2017-03-292016年11月长三角地区主要港口吞吐量集装箱化(2016年12期)2017-03-20厦门港集装箱集疏运系统现状分析及发展研究物流科技(2016年2期)2016-05-31“闽越国”腹地的神秘古城——城村汉城大众考古(2014年3期)2014-06-262014年1月长三角地区主要港口吞吐量集装箱化(2014年2期)2014-03-15

推荐访问:神经网络 吞吐量 集装箱

相关文章:

Top