最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

基于复杂网络的交通序列数据特性

IT圈 admin 30浏览 0评论

2024年6月14日发(作者:褒籁)

山东科学

第37卷第1期2024年2月出版

Vol.37No.1Feb.2024

SHANDONGSCIENCE

基于复杂网络的交通序列数据特性

孟勃

ꎬ孔祥科

ꎬ李树彬

3∗

(1.中国人民公安大学犯罪学学院ꎬ北京100038ꎻ2.山东轨道交通勘察设计院有限公司ꎬ山东济南250014ꎻ

3.山东警察学院道路交通安全研究所ꎬ山东济南250014)

摘要:为了进一步研究交通流特性ꎬ采用复杂网络方法对交通序列数据进行分析ꎮ提出了箱型图

聚类算法模型用于识

别和填充初始数据中的缺失值和异常值ꎻ通过相空间重构方法将一维数据重构为网络节点ꎬ选取连接阈值确定网络节点

的连接关系ꎬ将交通序列数据构建为复杂网络ꎬ对复杂网络的结构和定量指标进行分析ꎮ研究结果表明交通序列数据复

杂网络的结构一定程度上可以反映路段的交通流状态ꎮ该结果有助于优化数据预处理方法ꎬ拓展复杂网络在交通序列

数据研究中的应用ꎮ

关键词:复杂网络ꎻ数据分析ꎻ网络构建方法ꎻ相空间重构ꎻ聚类算法

中图分类号:U491   文献标志码:A   文章编号:1002 ̄4026(2024)01 ̄0107 ̄11

开放科学(资源服务)标志码(OSID):

Thecharacteristicsoftrafficsequencedatabasedoncomplexnetwork

(1.CollegeofCriminologyꎬPeople′sPublicSecurityUniversityofChinaꎬBeijing100038ꎬChinaꎻ2.ShandongRailTransit

SurveyandDesignInstituteCo.ꎬLtd.ꎬJinan250014ꎬChinaꎻ3.InstituteofRoadTrafficSafetyꎬ

ShandongPoliceCollegeꎬJinan250014ꎬChina)

MENGBo

ꎬKONGXiangke

ꎬLIShubin

3∗

Abstract∶Tostudythetrafficflowcharacteristicsꎬthetrafficdataisanalyzedusingacomplexnetworkmethod.Aboxplot ̄

clusteringalgorithmmodelisproposedtoidentifyandfillinmissingvaluesandoutliersintheinitialdata.Theone ̄dimensional

dataisreconstructedintonetworknodesusingthephasespacereconstructionmethod.Additionallyꎬtheconnection

thresholdisselectedtodeterminetheconnectionrelationshipofnetworknodestoconvertthetrafficsequencedataasa

complexnetworkandanalyzethestructureandquantitativeindicatorsofthenetwork.Theresultshowsthatthestructureof

thecomplexnetworkoftrafficdatacanreflectthetrafficflowstateoftheroadsectiontoacertainextent.Theresearch

optimizesthedatapreprocessingmethodandextendstheapplicationofcomplexnetworksintotrafficdataresearch.

Keywords∶complexnetworksꎻdataanalysisꎻnetworkbuildingmethodsꎻphasespacereconstructionꎻclustering

algorithm

收稿日期:2023 ̄04 ̄09

基金项目:国家自然科学基金(71871130ꎬ719711254)ꎻ山东省公安厅科技专项(SDGP370000000202302006727A001)ꎻ山东公安科技创新计划项

目(GAKJCX2022

1)

作者简介:孟勃(1986—)ꎬ女ꎬ博士研究生ꎬ研究方向为交通犯罪学ꎮE ̄mail:bo13963591527@163.com

∗通信作者ꎬ李树彬ꎬ男ꎬ教授ꎬ研究方向为系统分析与集成、智能交通系统ꎮE ̄mail:li_shu_bin@163.com

  近年来ꎬ随着数据分析、人工智能的发展ꎬ通过交通序列数据研究复杂的交通系统逐渐成为研究热点ꎮ

交通序列数据是按照时间顺序和固定的时间间隔采集的交通流参数数据ꎬ用于描述交通流随时间的变化情

况ꎮ目前ꎬ基于交通序列数据的研究主要集中在采用人工智能算法的交通流预测ꎮ武琼

[1]

基于支持向量回

归模型预测交通流参数ꎬ并进行了动态预测系统开发ꎮ赵怀柏等

[2]

利用遗传算法对BP(backpropagation)反

向传播神经网络神经网络的参数进行优化ꎬ实验证明了优化后模型在进行交通流预测时在预测精度和运算

效率方面具有明显提升ꎮMa等

[3]

构建了基于长短期神经网络的交通流预测模型ꎬ对比验证了该模型具有

更好的预测精度ꎮ上述研究主要集中于交通序列数据的直接应用ꎬ研究重点集中在通过优化模型参数或构

建组合模型来提高模型的预测精度ꎬ往往缺乏对交通序列数据的深入分析和挖掘ꎮ

复杂网络理论作为一种表征系统内部各因素相互关系的通用工具ꎬ逐渐在各个研究领域得到更多应用ꎮ

以交通领域为例ꎬ复杂网络广泛应用在城市道路网和城市公共交通网的研究中ꎮ对于城市道路网ꎬStrano等

[4]

以原始图法对比分析了欧洲10个城市的街道网络的结构相似性和特性ꎮ叶彭姚

[5]

分析了中国城市道路网

络的特征ꎬ并验证了网络节点度服从幂分布ꎮ对于城市公交网络ꎬLu等

[6]

验证了公交网络参数符合复杂网

络特征ꎬ并发现这些参数对公共交通的可达性、安全性有影响ꎮ许晴等

[7]

利用公交路线换乘关系模型研究

了中国330个城市的公交复杂网络结构特征ꎮYang等

[8]

构建了公交

地铁复合网络ꎬ通过级联失效模型ꎬ研

究极端天气下公共交通网络的鲁棒性ꎮ

城市道路和公共交通均具备一定的网络实体结构ꎬ如城市道路可以抽象为交叉口和路段组成的网络结

构ꎬ公共交通可以抽象为站点和线路组成的网络结构ꎬ因此在构建复杂网络时往往是对其物理结构的复现ꎮ然

而ꎬ不同于上述网络ꎬ数据不具备典型的网络结构形式ꎬ在构建复杂网络时需要进行节点的构造和连接关系的

确定ꎮWang等

[9]

利用可见图法构建GDP国内生产总值时序数据复杂网络ꎬ并分析网络特性ꎮGao等

[10]

验证

了以时间序列数据构建的网络能够保留数据的主要性质ꎮMao等

[11]

基于可见图的预测方法将时间序列转

换成复杂网络ꎬ预测节点间的相似度ꎮ

目前ꎬ通过复杂网络对交通序列数据的研究还较少ꎬ在交通序列数据处理、网络构建等方面还存在不足ꎮ

因此ꎬ本文以交通序列数据为研究对象ꎬ主要研究交通序列数据的网络化表示方法以及网络结构、特性指标

所表现出的交通流特征ꎬ探究二者之间的内在联系ꎮ本文首先提出了箱型图

聚类算法模型ꎬ用于处理数据

中的缺失值和异常值ꎻ然后通过相空间重构和临界阈值将交通序列数据构建为复杂网络ꎬ最后进行网络结构

分析和网络指标计算ꎮ

1 数据分析与预处理

1.1 交通序列数据

交通系统是一个多维、动态的复杂系统ꎬ系统内部各因素相互影响ꎮ交通流特性是交通流运行状态的定

性、定量表征ꎬ宏观上用于描述交通流作为一个整体表现出来的特性ꎬ微观上是指彼此相关的交通参与者的

运行状态ꎮ在不受横向交叉影响的路段上ꎬ交通流呈连续流状态ꎻ当受到横向干扰时ꎬ如路口信号灯管制时ꎬ

交通流呈现出断续流状态ꎮ

交通流随着时间和空间的变化而变化ꎬ由于出行的规律性ꎬ交通流在一定周期内呈现出重复性ꎬ即具有

周期性特征ꎻ同时ꎬ交通流受到车辆、行人和其他干扰因素的影响ꎬ又表现出强烈的随机性和不确定性ꎮ交通

流的特性可以通过交通序列数据进行表征和分析ꎬ本文主要以交通流的速度序列数据为研究对象ꎮ图1绘

制了广州市两条快速路不同时间周期的速度变化图ꎬ数据来源于广州市交通委员会公布的开源数据ꎮ由图1

可以看出路段速度变化在一周内具有明显的周期波动性ꎬ每天的速度变化具有相似性ꎬ但并非完全相同ꎬ这

表明了交通系统具有一定的随机性ꎮ

图1 交通序列数据变化图

  交通序列数据是交通系统运行状态的最直接反应ꎬ分析研究交通序列数据对于挖掘交通系统运行规律、

缓解城市交通拥堵具有重要意义ꎮ目前ꎬ交通序列数据的采集方式主要有磁频采集技术、波频采集技术和视

据和噪声数据的干扰ꎬ从而影响到基于数据的分析结果

[12]

数据预处理是进行数据分析的重要前提ꎬ缺失值的填充、异常值的替换是数据预处理的两个关键ꎮ插值

频采集技术等方法ꎬ由于受到环境干扰、传感器精度等因素的影响ꎬ交通序列数据的质量往往会受到缺失数

1.2 改进数据预处理方法

Fig.1 Trafficsequencedatachangeplot

法和数理统计法是较为常见的数据预处理方法

[13 ̄14]

ꎮ插值法主要依赖时间或空间相邻数据进行填充ꎬ对于

连续缺失的数据处理效果较差ꎮ数理统计法主要通过假设的数据分布估计填充值ꎬ相关参数的假设对于填

充值的影响较大ꎮ为了提高数据预处理的效果ꎬ本文基于机器学习ꎬ改进传统的数据预处理方法ꎬ提出了箱

型图

聚类算法的数据预处理模型ꎮ模型共分为如下关键步骤ꎮ

步骤一:通过箱型图法识别数据集中的异常值ꎮ箱型图法是一种较为客观的判定异常值的有效方

[14]

ꎮ如式(1)所示ꎬf(x)为异常值的判定函数ꎬ当f(x)

1时ꎬ判定数据为异常值ꎻ反之ꎬ当f(x)

0时ꎬ判

定数据为正常值ꎮ

f(x)

{

其中ꎬQ

为升序数列的25%位点ꎻQ

为升序数列的75%位点ꎻΔ

1ꎬ其他

0ꎬ(Q

1.5Δ)≤x≤(Q

1.5Δ)

ꎬ(1)

步骤二:通过聚类算法对交通序列数据进行聚类分析ꎮ本文选用的聚类算法为层次聚类算法ꎬ该方法依

据数据点的相似度ꎬ构建多层嵌套树模型进行数据聚类ꎬ主要聚类流程为将采集的原始数据构建为初始数据

簇ꎬ在初始数据簇的基础上ꎬ每次选择相似度最高的两个数据簇合并为新的簇ꎬ依次迭代到目标分类数ꎮ

步骤三:根据步骤二的层次聚类结果对不同类别的交通状态进行认定ꎬ计算相同交通状态数据的平均

值ꎮ

步骤四:确定缺失值或异常值所处的交通状态ꎬ以相同状态数据的平均值进行填充ꎮ层次聚类算法填充

缺失值和异常值的主要流程如图2所示ꎮ

图2 箱型图

聚类算法的数据预处理流程图

Fig.2 Boxplot ̄clusteringalgorithmdatapreprocessingmodelflowchart

2 复杂网络的构建

2.1 网络节点的确定

网络是由节点和节点间的连接关系确定的ꎬ以城市轨道交通网络为例ꎬ在构建复杂网络时常以轨道站点

作为节点ꎬ存在地铁线路连接的站点之间则设置连边ꎮ由于在数据中不存在典型的网络节点ꎬ因此本文利用

相空间重构方法ꎬ将一维数据构建为多维相空间ꎬ作为复杂网络的节点ꎮ相空间重构存在两个关键参数:延

迟时间和嵌入维数ꎮ在Takens嵌入定理中ꎬ证明了延迟时间和嵌入维数理论上的存在性

[15]

ꎮ在实际数据

应用中ꎬ需要根据数据的实际情况选取ꎮ

构矩阵Xꎬ如式(2)所示ꎮ

é

ê

ù

ú

é

ê

ê

úê

êú

ê

ê

úê

êúê

ê

úê

ëûë

2.1.1 延迟时间选取

τ

τ

τ

2024年6月14日发(作者:褒籁)

山东科学

第37卷第1期2024年2月出版

Vol.37No.1Feb.2024

SHANDONGSCIENCE

基于复杂网络的交通序列数据特性

孟勃

ꎬ孔祥科

ꎬ李树彬

3∗

(1.中国人民公安大学犯罪学学院ꎬ北京100038ꎻ2.山东轨道交通勘察设计院有限公司ꎬ山东济南250014ꎻ

3.山东警察学院道路交通安全研究所ꎬ山东济南250014)

摘要:为了进一步研究交通流特性ꎬ采用复杂网络方法对交通序列数据进行分析ꎮ提出了箱型图

聚类算法模型用于识

别和填充初始数据中的缺失值和异常值ꎻ通过相空间重构方法将一维数据重构为网络节点ꎬ选取连接阈值确定网络节点

的连接关系ꎬ将交通序列数据构建为复杂网络ꎬ对复杂网络的结构和定量指标进行分析ꎮ研究结果表明交通序列数据复

杂网络的结构一定程度上可以反映路段的交通流状态ꎮ该结果有助于优化数据预处理方法ꎬ拓展复杂网络在交通序列

数据研究中的应用ꎮ

关键词:复杂网络ꎻ数据分析ꎻ网络构建方法ꎻ相空间重构ꎻ聚类算法

中图分类号:U491   文献标志码:A   文章编号:1002 ̄4026(2024)01 ̄0107 ̄11

开放科学(资源服务)标志码(OSID):

Thecharacteristicsoftrafficsequencedatabasedoncomplexnetwork

(1.CollegeofCriminologyꎬPeople′sPublicSecurityUniversityofChinaꎬBeijing100038ꎬChinaꎻ2.ShandongRailTransit

SurveyandDesignInstituteCo.ꎬLtd.ꎬJinan250014ꎬChinaꎻ3.InstituteofRoadTrafficSafetyꎬ

ShandongPoliceCollegeꎬJinan250014ꎬChina)

MENGBo

ꎬKONGXiangke

ꎬLIShubin

3∗

Abstract∶Tostudythetrafficflowcharacteristicsꎬthetrafficdataisanalyzedusingacomplexnetworkmethod.Aboxplot ̄

clusteringalgorithmmodelisproposedtoidentifyandfillinmissingvaluesandoutliersintheinitialdata.Theone ̄dimensional

dataisreconstructedintonetworknodesusingthephasespacereconstructionmethod.Additionallyꎬtheconnection

thresholdisselectedtodeterminetheconnectionrelationshipofnetworknodestoconvertthetrafficsequencedataasa

complexnetworkandanalyzethestructureandquantitativeindicatorsofthenetwork.Theresultshowsthatthestructureof

thecomplexnetworkoftrafficdatacanreflectthetrafficflowstateoftheroadsectiontoacertainextent.Theresearch

optimizesthedatapreprocessingmethodandextendstheapplicationofcomplexnetworksintotrafficdataresearch.

Keywords∶complexnetworksꎻdataanalysisꎻnetworkbuildingmethodsꎻphasespacereconstructionꎻclustering

algorithm

收稿日期:2023 ̄04 ̄09

基金项目:国家自然科学基金(71871130ꎬ719711254)ꎻ山东省公安厅科技专项(SDGP370000000202302006727A001)ꎻ山东公安科技创新计划项

目(GAKJCX2022

1)

作者简介:孟勃(1986—)ꎬ女ꎬ博士研究生ꎬ研究方向为交通犯罪学ꎮE ̄mail:bo13963591527@163.com

∗通信作者ꎬ李树彬ꎬ男ꎬ教授ꎬ研究方向为系统分析与集成、智能交通系统ꎮE ̄mail:li_shu_bin@163.com

  近年来ꎬ随着数据分析、人工智能的发展ꎬ通过交通序列数据研究复杂的交通系统逐渐成为研究热点ꎮ

交通序列数据是按照时间顺序和固定的时间间隔采集的交通流参数数据ꎬ用于描述交通流随时间的变化情

况ꎮ目前ꎬ基于交通序列数据的研究主要集中在采用人工智能算法的交通流预测ꎮ武琼

[1]

基于支持向量回

归模型预测交通流参数ꎬ并进行了动态预测系统开发ꎮ赵怀柏等

[2]

利用遗传算法对BP(backpropagation)反

向传播神经网络神经网络的参数进行优化ꎬ实验证明了优化后模型在进行交通流预测时在预测精度和运算

效率方面具有明显提升ꎮMa等

[3]

构建了基于长短期神经网络的交通流预测模型ꎬ对比验证了该模型具有

更好的预测精度ꎮ上述研究主要集中于交通序列数据的直接应用ꎬ研究重点集中在通过优化模型参数或构

建组合模型来提高模型的预测精度ꎬ往往缺乏对交通序列数据的深入分析和挖掘ꎮ

复杂网络理论作为一种表征系统内部各因素相互关系的通用工具ꎬ逐渐在各个研究领域得到更多应用ꎮ

以交通领域为例ꎬ复杂网络广泛应用在城市道路网和城市公共交通网的研究中ꎮ对于城市道路网ꎬStrano等

[4]

以原始图法对比分析了欧洲10个城市的街道网络的结构相似性和特性ꎮ叶彭姚

[5]

分析了中国城市道路网

络的特征ꎬ并验证了网络节点度服从幂分布ꎮ对于城市公交网络ꎬLu等

[6]

验证了公交网络参数符合复杂网

络特征ꎬ并发现这些参数对公共交通的可达性、安全性有影响ꎮ许晴等

[7]

利用公交路线换乘关系模型研究

了中国330个城市的公交复杂网络结构特征ꎮYang等

[8]

构建了公交

地铁复合网络ꎬ通过级联失效模型ꎬ研

究极端天气下公共交通网络的鲁棒性ꎮ

城市道路和公共交通均具备一定的网络实体结构ꎬ如城市道路可以抽象为交叉口和路段组成的网络结

构ꎬ公共交通可以抽象为站点和线路组成的网络结构ꎬ因此在构建复杂网络时往往是对其物理结构的复现ꎮ然

而ꎬ不同于上述网络ꎬ数据不具备典型的网络结构形式ꎬ在构建复杂网络时需要进行节点的构造和连接关系的

确定ꎮWang等

[9]

利用可见图法构建GDP国内生产总值时序数据复杂网络ꎬ并分析网络特性ꎮGao等

[10]

验证

了以时间序列数据构建的网络能够保留数据的主要性质ꎮMao等

[11]

基于可见图的预测方法将时间序列转

换成复杂网络ꎬ预测节点间的相似度ꎮ

目前ꎬ通过复杂网络对交通序列数据的研究还较少ꎬ在交通序列数据处理、网络构建等方面还存在不足ꎮ

因此ꎬ本文以交通序列数据为研究对象ꎬ主要研究交通序列数据的网络化表示方法以及网络结构、特性指标

所表现出的交通流特征ꎬ探究二者之间的内在联系ꎮ本文首先提出了箱型图

聚类算法模型ꎬ用于处理数据

中的缺失值和异常值ꎻ然后通过相空间重构和临界阈值将交通序列数据构建为复杂网络ꎬ最后进行网络结构

分析和网络指标计算ꎮ

1 数据分析与预处理

1.1 交通序列数据

交通系统是一个多维、动态的复杂系统ꎬ系统内部各因素相互影响ꎮ交通流特性是交通流运行状态的定

性、定量表征ꎬ宏观上用于描述交通流作为一个整体表现出来的特性ꎬ微观上是指彼此相关的交通参与者的

运行状态ꎮ在不受横向交叉影响的路段上ꎬ交通流呈连续流状态ꎻ当受到横向干扰时ꎬ如路口信号灯管制时ꎬ

交通流呈现出断续流状态ꎮ

交通流随着时间和空间的变化而变化ꎬ由于出行的规律性ꎬ交通流在一定周期内呈现出重复性ꎬ即具有

周期性特征ꎻ同时ꎬ交通流受到车辆、行人和其他干扰因素的影响ꎬ又表现出强烈的随机性和不确定性ꎮ交通

流的特性可以通过交通序列数据进行表征和分析ꎬ本文主要以交通流的速度序列数据为研究对象ꎮ图1绘

制了广州市两条快速路不同时间周期的速度变化图ꎬ数据来源于广州市交通委员会公布的开源数据ꎮ由图1

可以看出路段速度变化在一周内具有明显的周期波动性ꎬ每天的速度变化具有相似性ꎬ但并非完全相同ꎬ这

表明了交通系统具有一定的随机性ꎮ

图1 交通序列数据变化图

  交通序列数据是交通系统运行状态的最直接反应ꎬ分析研究交通序列数据对于挖掘交通系统运行规律、

缓解城市交通拥堵具有重要意义ꎮ目前ꎬ交通序列数据的采集方式主要有磁频采集技术、波频采集技术和视

据和噪声数据的干扰ꎬ从而影响到基于数据的分析结果

[12]

数据预处理是进行数据分析的重要前提ꎬ缺失值的填充、异常值的替换是数据预处理的两个关键ꎮ插值

频采集技术等方法ꎬ由于受到环境干扰、传感器精度等因素的影响ꎬ交通序列数据的质量往往会受到缺失数

1.2 改进数据预处理方法

Fig.1 Trafficsequencedatachangeplot

法和数理统计法是较为常见的数据预处理方法

[13 ̄14]

ꎮ插值法主要依赖时间或空间相邻数据进行填充ꎬ对于

连续缺失的数据处理效果较差ꎮ数理统计法主要通过假设的数据分布估计填充值ꎬ相关参数的假设对于填

充值的影响较大ꎮ为了提高数据预处理的效果ꎬ本文基于机器学习ꎬ改进传统的数据预处理方法ꎬ提出了箱

型图

聚类算法的数据预处理模型ꎮ模型共分为如下关键步骤ꎮ

步骤一:通过箱型图法识别数据集中的异常值ꎮ箱型图法是一种较为客观的判定异常值的有效方

[14]

ꎮ如式(1)所示ꎬf(x)为异常值的判定函数ꎬ当f(x)

1时ꎬ判定数据为异常值ꎻ反之ꎬ当f(x)

0时ꎬ判

定数据为正常值ꎮ

f(x)

{

其中ꎬQ

为升序数列的25%位点ꎻQ

为升序数列的75%位点ꎻΔ

1ꎬ其他

0ꎬ(Q

1.5Δ)≤x≤(Q

1.5Δ)

ꎬ(1)

步骤二:通过聚类算法对交通序列数据进行聚类分析ꎮ本文选用的聚类算法为层次聚类算法ꎬ该方法依

据数据点的相似度ꎬ构建多层嵌套树模型进行数据聚类ꎬ主要聚类流程为将采集的原始数据构建为初始数据

簇ꎬ在初始数据簇的基础上ꎬ每次选择相似度最高的两个数据簇合并为新的簇ꎬ依次迭代到目标分类数ꎮ

步骤三:根据步骤二的层次聚类结果对不同类别的交通状态进行认定ꎬ计算相同交通状态数据的平均

值ꎮ

步骤四:确定缺失值或异常值所处的交通状态ꎬ以相同状态数据的平均值进行填充ꎮ层次聚类算法填充

缺失值和异常值的主要流程如图2所示ꎮ

图2 箱型图

聚类算法的数据预处理流程图

Fig.2 Boxplot ̄clusteringalgorithmdatapreprocessingmodelflowchart

2 复杂网络的构建

2.1 网络节点的确定

网络是由节点和节点间的连接关系确定的ꎬ以城市轨道交通网络为例ꎬ在构建复杂网络时常以轨道站点

作为节点ꎬ存在地铁线路连接的站点之间则设置连边ꎮ由于在数据中不存在典型的网络节点ꎬ因此本文利用

相空间重构方法ꎬ将一维数据构建为多维相空间ꎬ作为复杂网络的节点ꎮ相空间重构存在两个关键参数:延

迟时间和嵌入维数ꎮ在Takens嵌入定理中ꎬ证明了延迟时间和嵌入维数理论上的存在性

[15]

ꎮ在实际数据

应用中ꎬ需要根据数据的实际情况选取ꎮ

构矩阵Xꎬ如式(2)所示ꎮ

é

ê

ù

ú

é

ê

ê

úê

êú

ê

ê

úê

êúê

ê

úê

ëûë

2.1.1 延迟时间选取

τ

τ

τ

发布评论

评论列表 (0)

  1. 暂无评论