老哥学习网 - www.lg9.cn 2024年05月01日 01:29 星期三
当前位置 首页 >公文范文 > 公文大全 >

基于集成深度学习的网络中短期流量精准预测研究

发布时间:2023-04-05 08:25:12 浏览数:

沈毅波

基于集成深度学习的网络中短期流量精准预测研究

沈毅波

(漳州职业技术学院 教务处,福建 漳州 363000)

网络中短期流量特征不同,依靠单一的方法预测流量,造成预测结果均方根误差较大。因此,提出了基于集成深度学习的网络中短期流量精准预测方法。运用BDS统计量检验方法建立非线性判断机制,提取网络流量内包含的非线性特征。依据小波变换理念分解和重构复杂的网络流量,引入集成深入学习理念,在Stacking集成策略的作用下,建立包含循环神经网络和卷积神经网络的集成流量预测模型。从网络结构和修剪过程两方面入手,优化预测模型结构,并通过正交最小二乘法求解网络中短期流量预测值。仿真测试结果表明:所用方法的网络中短期流量预测均方根误差为0.12,实现了网络中短期流量精准预测。

集成深度学习;
小波分析;
网络流量;
建模预测;
细节信号;
非线性特征

网络管理工作的开展,需要依托于网络流量数据。为了确保网络拥塞控制策略更加符合实际环境[1],需要对网络中短期流量进行预测,最大程度减少网络崩溃现象。考虑到网络流量的传输结构较为复杂,流量转发方式和通信协议等因素都会影响网络业务行为[2],流量预测方法设计过程中,可以以网络流量行为特征为基础。现有的预测方法,面对越来越复杂的网络拓扑结构,无法得到精准的流量预测结果。

杨晓敏[3]采集历史网络流量数据并进行预处理,以支持向量机为核心,构建网络流量预测模型。为了确保流量历史数据学习结果更加真实,引入改进灰狼算法,设计预测模型最优参数搜索方案,生成可以得到精准预测结果的模型。根据预测模型应用结果可知,该方法预测结果无法满足实时性要求。李晓会等[4]针对大规模网络流量进行研究,通过混沌算法提取网络流量的随机性特点,以此为基础结合云计算平台进行流量建模,再结合大数据分析方法和支持向量机模式,计算网络流量预测结果,但该方法预测精度较低。宋元隆等[5]采用多个神经网络结构,提取网络流量数据所包含的多维度特征,结合时间和空间两方面特征提取的结果,求解出目

标网络中短期流量预测结果,但该方法预测结果与实际流量值之间误差较大。

本文以网络中短期流量预测为研究对象,考虑到中短期网络的复杂性以及网络流量信息的随机性,采用集成深度学习理念,结合循环神经网络和卷积神经网络,构建流量精准预测模型。从仿真测试结果可以看出,文中设计的预测方法,可以得到更加贴近实际流量值的预测结果,为后续网络控制方案设计的提供参考。

1.1 建立网络流量非线性判断机制

以BDS统计量检验法为核心,建立网络流量非线性判断机制,深入分析网络流量时间序列所包含的特征信息[6],将其作为流量预测方法设计的基础。针对已知长度的网络流量时间序列,嵌入向量计算公式可以表示为公式(1),相关积分计算公式可以表示为公式(2):

公式中的表示嵌入向量,表示嵌入维数,表示时延;
表示时间序列长度,表示时间序列点组成的维度球的半径,表示参考距离,表示Heaviside函数。

采用BDS统计量检验法进行非线性特征判断时,需要先针对原始序列,建立一个拟合自回归模型,剔除原始序列中包含的线性成分得到残差序列[7],再进行特征检验。如果该残差序列不能满足零假设数据分布条件,表明该序列具有非线性特点。

同时,文中采用Hurst指数对于具有非线性特点的时间序列进一步分析,根据Hurst指数判断网络自相似程度,从而反映网络流量数据的非线性程度。文中采用R/S类分析模式,进行Hurst指数计算:

公式中的表示极差,表示标准差,表示常数,表示样本数量,表示Hurst指数。根据Hurst指数计算结果,求取网络流量序列的数据点斜率,生成非平稳时间序列。

1.2 设计网络中短期流量分解方法

为了便于分析网络流量序列变化规律,文中针对非平稳时间序列,运用小波变换方法分解非平稳数据,生成不同特性对应的时间信号[8],从整体和细节两方面,获取网络流量预测结果。其中,网络流量信号所涉及的小波变换函数可以表示为:

公式中的表示流量信号,表示小波变换函数,表示小波分解平移参数,表示小波分解尺度参数,表示小波函数。

以公式(4)为基础,针对分解后的网络流量信息进行重构处理,信号空间重构公式可以描述为:

公式中的t表示时刻。为了加强网络流量信息的空间分解的合理性,文中采用多分辨小波分析模式,将原始信号空间转换为多个子空间,通过高通、低通滤波器,将最初的网络流量信号向每个子空间进行投影[9],获取可以反映流量整体变化趋势的低频信号,以及反映网络流量随机性特征的高频信号。文中采用包含三层分解结构的小波分解树,具体结构如图1所示。

按照图1所示的小波分解树,对原始网络流量信号进行分解,并采用Mallat算法进行流量信号的重构,具体计算公式为公式(6)和公式(7)。

通过上述分解和重构处理,获取网络流量信号的变化特征,也可以作为后续流量预测模型的输入向量。

1.3 构建集成深度学习预测模型

考虑到以单一学习网络为基础的预测模型,无法满足流量预测精度要求,文中选择循环神经网络和卷积神经网络两种深度学习网络结构[10],在Stacking集成策略的融合作用下,构建集成深度学习预测模型。

其中,循环神经网络具有极强的记忆力,运用该网络可以从近期网络流量数据中,选择性地采集流量信号,建立时间序列数据模型。在循环神经网络结构设计过程中,文中依托于门控循环单元,搭建一对一形式展开的网络URU层,为了提升时序数据运算效率,提出采用图2所示的堆叠方式,连接相邻的网络层。

图2 基于GRU的循环神经网络堆叠连接结构

运用上述提出的循环神经网络得到的结果,可以从时间轴上提取预测时刻前后关联网络流量信息。此外,还需要采用由卷积层、池化层和全连接层组成的卷积神经网络,从高维空间角度,获取不同层面的中短期网络流量特征。为了充分发挥两个神经网络的自身优势,采用Stacking集成模型将RNN和CNN看作两个个体学习器,再添加一个元学习器,得到图3所示的集成深度学习预测模型。

图3 集成深度学习预测模型

在图3所示的预测模型应用前,需要预先建立两个训练集,分别用于两个模型的个体学习器训练,采用训练后的模型进行后续网络流量预测。之后,文中设计包含ReUL激活、线性激活的2层全连接层的元学习器,拼接两个个体学习器输出结果,得到网络中短期流量预测结果。

1.4 实现流量预测模型结构优化

针对集成深度学习预测模型,采用结构简化与剪枝算法,优化流量预测模型结构,获取更加精准的网络流量预测结果。其中,结构优化是为了去除集成深度学习网络内包含的冗余神经元,达到降低预测模型计算量的目的,计算量表达公式为:

结构优化过程中,在保证集成深度学习网络运算结果稳定的基础上,削减部分不常用的前馈单元,以最小计算量为优化目标,实现集成深度学习预测模型网络结构的简化处理。针对结构优化处理后的预测模型,运用剪枝算法优化网络计算过程,将冗余的权重节点从运算网络中剔除。

为了实现神经网络的结构精简,文中采用遗传算法进行全局搜索,根据集成深度学习预测模型中每个网络结构内包含的神经元数量,分别计算其对应的调整系数,得到适应度函数:

按照遗传算法中的优胜劣汰规则,以适应度计算结果为依据,运用轮盘赌方法进行遗传个体选择,达到简化模型结构的目的。

对于优化后的流量预测模型,文中将神经网络的运算流程看作线性变换过程,采用正交最小二乘法进行求解,计算模型的预计输出矢量,再根据预计输出量与实际输出量之间的误差,得到最终输出量。预测模型输出量计算公式可以表示为:

公式中的表示流量预测计算结果,表示正交变换矩阵。结合公式(10)与公式(11)进行计算,输出网络中短期流量预测数据。

基于集成深度学习理念,针对中短期网络流量预测问题,课题组设计了一种新的预测方法。为了体现该方法的有效性,应用Windows 10操作系统,结合200GB硬盘、80GB内存等硬件,搭建仿真测试环境,进行网络流量精准预测。

2.1 测试数据采集与处理

本次仿真测试所应用的数据取自某局域网中主要交换机内部,运用网络流量监测软件,从2021年3月1日开始,对该交换机进行为期两周的网络流量数据采集工作。考虑到该局域网内流量数据随机性较强,本次测试数据采集过程中,设置网络流量数据采集时间间隔为1小时,共获得500个网络流量时间序列,作为仿真测试基础数据。采用Matlab 7.0仿真工具箱,将采集的测试数据描述为图4。

根据图4所示的网络流量数据图可以看出,该局域网内流量数据存在突发性和非平稳性特征,为了保证流量预测结果更加真实,针对采集的测试数据进行最大最小化处理,具体的表达公式为:

公式中的表示原始网络流量数据,表示预处理后数据,表示样本数据中最大值,表示样本数据中最小值。

利用预处理后的测试数据,对集成深度学习网络预测模型进行训练,将测试数据集中75%的数据划分为模型训练集合,选取5%的测试数据建立验证集,剩余的数据组成测试集。

2.2 模型参数设置

本文所提出的中短期网络流量预测方法,以集成深度学习技术为核心,为了保证仿真测试的顺利进行,将预测模型的训练参数设置为表1。

表1 集中深度学习网络训练参数

根据表1所示的参数值,完成集中深度学习网络模型参数的设置,在此基础上,运行文中提出的预测方法,得出网络流量预测结果。

2.3 流量预测结果分析

为了更好地描述文中设计预测方法的流量预测性能,在同样的仿真环境下,采用文献[3]改进灰狼算法、文献[4]云计算和大数据分析方法,获取网络流量预测结果,并与文中提出方法预测结果、实际网络流量值进行对比,形成图5。

图5 不同预测方法的网络流量预测结果

三种预测方法均得到了网络流量预测结果,并且按照时间序列展现了网络流量变化趋势。从图5可以看出,文中提出方法得出的预测结果,明显更贴近实际网络流量值。为了准确给出所提方法的预测性能,引入均方根误差RMSE,作为量化评价指标:

表2 不同方法的均方根误差对比结果

根据表2可知,文中提出的网络流量预测方法的均方根误差为0.12。改进灰狼算法、云计算和大数据分析方法的均方根误差分别为0.25和031。综上所述,文中研究的预测方法与其他两种方法相比,均方根误差降低了52%、61%,有效提升了网络流量预测精度,推动了网络管理工作的顺利开展。

针对网络流量预测问题进行研究,以获取精准预测结果为目标,文中提出运用集成深度学习理念和Stacking集成策略,设计由循环神经网络和卷积神经网络共同组成的网络流量预测模型。从仿真测试结果可以看出,文中设计的预测方法可以更加准确地输出网络流量预测结果,保证网络性能稳定。但是本文方法不能在所有站点内发挥相同的预测效果,下一步研究过程中,需要与其他网络模型相结合,建立多个个体学习器,获取稳定的网络流量预测结果。

[1]康梦轩,宋俊平,范鹏飞,等.基于深度学习的网络流量预测研究综述[J]. 计算机工程与应用,2021,57(10):1–9.

[2]张志宏,刘传领.基于灰狼算法优化深度学习网络的网络流量预测[J].吉林大学学报: 理学版,2021,59(3):619–626.

[3]杨晓敏.改进灰狼算法优化支持向量机的网络流量预测[J]. 电子测量与仪器学报,2021,35(3):211–217.

[4]李晓会,陈潮阳,伊华伟,等. 基于云计算和大数据分析的大规模网络流量预测[J].吉林大学学报: 工学版,2021,51(3):1034–1039.

[5]宋元隆,吕光宏,王桂芝,等. 基于图卷积神经网络的SDN网络流量预测[J].计算机科学,2021,48(S1):392–397.

[6]熊皓,刘嘉勇,王俊峰.基于神经网络和自回归模型的网络流量预测[J].计算机应用,2021,41(S1):180–184.

[7]周任军,王文晶.基于深度神经网络的网络流量预测模型仿真[J]. 计算机仿真,2021,38(6):475–479.

[8]朱江,潘成胜,孔志翔,等.基于Prophet融合MGF提取的网络流量预测[J].计算机仿真,2021,38(7):475–480.

[9]牟晓惠,李丽香. Dropout回声状态网络的网络流量预测[J]. 北京邮电大学学报,2021,44(5):10–13+20.

[10]曹素娥,杨泽民.基于聚类分析算法和优化支持向量机的无线网络流量预测[J].计算机科学,2020,47(8):319–322.

Research on Accurate Prediction of Network Short- and Medium-Term Traffic Based on Integrated Deep Learning

SHEN Yi-Bo

(Academic Affairs Office, Zhangzhou Institute of Technology, Zhangzhou Fujian 363000, China)

The short- and medium-term traffic in the network shows different characteristics that may result in great root-mean-square errors if predicted with a single method. Therefore, an accurate prediction method of network short- and medium-term traffic is proposed based on integrated deep learning. The nonlinear judgment mechanism is established by using BDS statistical test method to extract the nonlinear characteristics contained in the network traffic. The complex network traffic is decomposed and reconstructed under the idea of wavelet transform. With the introduction of the integrated deep learning, an integrated traffic prediction model containing cyclic neural network and convolutional neural network is established on the effect of stacking integration strategy. From the network structure and pruning process, the structure of prediction model is optimized, and the short- and medium-term traffic prediction value of network is solved by orthogonal least square method. The simulation test results show that the root-mean-square error of the proposed method is 0.12, which realizes the accurate prediction of short- and medium-term network traffic.

integrated deep learning; wavelet analysis; network traffic; modeling prediction; detailed signal; nonlinear characteristics

2022-04-01

福建省教育厅中青年教育科研项目(JZ180811);
福建省教育厅中青年教育科研项目(JAT210845)

沈毅波(1981—),男,福建华安人,讲师,硕士,研究方向:深度学习、数据挖掘。

TP393.06

A

2095-9249(2022)03-0060-05

〔责任编校:吴侃民〕

猜你喜欢 网络流量神经网络流量 大数据驱动和分析的舰船通信网络流量智能估计舰船科学技术(2022年10期)2022-06-17冰墩墩背后的流量密码玩具世界(2022年2期)2022-06-15基于递归模糊神经网络的风电平滑控制策略现代电力(2022年2期)2022-05-23基于双向长短期记忆循环神经网络的网络流量预测计算机应用与软件(2022年2期)2022-02-19张晓明:流量决定胜负!三大流量高地裂变无限可能!房地产导刊(2021年8期)2021-10-13基于大数据分析的非线性网络流量组合预测模型*沈阳工业大学学报(2020年6期)2020-12-29寻找书业新流量出版人(2020年4期)2020-11-14神经网络抑制无线通信干扰探究电子制作(2019年19期)2019-11-23大数据环境下的网络流量非线性预测建模微型电脑应用(2019年8期)2019-08-22Efficacy of high-flow nasal cannula on acute exacerbation of chronic obstructive pulmonary disease:A meta-analysisMedical Data Mining(2019年4期)2019-04-05

推荐访问:中短期 精准 深度

相关文章:

Top