2024年3月13日发(作者:笪从筠)
5G网络CPE MTU设置不当导致4K高清视频回传出现概率性断流问题分析
目 录
一、
二、
问题描述 ...................................................................................................................................................................... 2
分析过程 ...................................................................................................................................................................... 4
基础核查 .............................................................................................................................................................................. 4
信令分析排查 ...................................................................................................................................................................... 5
抓包分析 .............................................................................................................................................................................. 7
三、
四、
解决措施 ...................................................................................................................................................................... 7
经验总结 ...................................................................................................................................................................... 8
MTU介绍 ............................................................................................................................................................................. 8
1
【摘要】广州电信业务演示现场5G CPE进行4K高清视频回传,拓扑链路为视频流
从4K摄像头-CPE-基站-传输-核心网-天翼云服务器-播放大屏的回传及显示业务。基站开
通后小区正常无告警,现场测试上行速率平均在75Mbit/s左右且很稳定,完全满足无人
机图像回传要求的最高速率60Mbit/s。但在业务调试时发现视频回传存在断流的风险,严
重影响业务演示的效果。通过对演示环境、端到端信令跟踪、CPE与基站的抓包分析发现
是由于CPE MTU设置不合理导致视频回传存在重传和乱序,通过更改CPE的MTU后问
题解决。
【关键字】5G,视频回传、断流
一、 问题描述
视频回传组网图如下:
推流链路(广州塔):4K摄像机拍摄画面→CPE→基站→核心网→承载网→视频服
务器(天翼云)→播放大屏
业务需求:直播视频需满足稳定性和时延要求,业务需求为上行平均速率60Mbps,
2
平均时延小于30ms,直播画面稳定无卡顿、无花屏
站点分布:N番禺沙园(汇珑)NR-AAU102-5GZ1PY0003-XJ为演示使用基站,市
桥东方NR-AAU101-GZ5G00112为备用站点。。
问题现象:初始测试时将用于回传的CPE与摄像头相连并定点放置,进行4K视频
回传时图像清晰,无卡顿。但是现场出现每2-3分钟突然断连1-2s的现象,需要重新进
行推流,严重影响业务演示。持续观测后发现该现象可能恶化,概率性出现视频回传断流
现象,短则数秒出现,长则5分钟以上不出现。出现视频断流时,CPE的web管理界面上
行速率以及利用OMT的上行速率检测都显示此时除除物理层外,速率均掉为0,如下图
所示。此外,观察CPE上的SIG指示灯发现出现断流时SIG等处于非正常状态(熄灭或者
闪红灯)。
3
二、 分析过程
基础核查
1.在原地点让摄像头厂家进行多种方式、不同服务器推流,此类问题仍然会出现。尝
试将视频从4K降至1080P,此问题依然会出现。尝试更换使用备用摄像头进行推流回传,
问题仍会出现。基本排除了摄像头、推流服务器的问题。
2.进行基站数据配置核查,和之前演示过该业务的基站进行数据配置对比,关键参数
一致,基本排除基站数据配置错误的问题。
3.由于演示业务地点限制,CPE放置地点距离基站距离超过550米,已经超出了5G
基站建议的300-500米的覆盖范围,因此考虑是否是由于基站与演示点距离过远导致信号
接收不稳定。尝试将CPE挪近基站,距离在100-250米之间选择几个点进行测试,发现
4
该问题仍然存在。在距基站550米地方OMT实际测试时,电平值在-85到-93之间,信
号强度仍能满足接入要求。
4.现场网优测试周边不存在对3.5G频段的干扰,排除干扰的存在。考虑到现场情况,
进行天线下倾角的调整之后,问题仍然存在。
至此,现场初步排查结束,排除了摄像头、推流服务器的问题、基站的数据配置问题、
现场干扰问题以及信号强度问题。
信令分析排查
在4G侧进行S1、UU、X2接口跟踪,S1、UU跟踪结果正常,X2接口存在异常释放,
具体如下图所示。
5
5G小区发起的SRS重配置流程(通过4G配置消息下发给CPE),没有收到CPE响应
最终5G载波释放,业务中断数秒;
通过修改参数MOD NRDUCellRsvdOptParam: NrDuCellId=xx, ParamId=128,
Param1=0; (保留参数128,设置为0)5G侧SRS自适应带宽关闭SRS配置流程后,
FTP测试15分钟没有5G载波释放和数据中断数秒问题。观察CPE上信号指示灯,没有
再出现熄灭或者闪红灯的情况。再次进行信令跟踪时,没有出现5G载波释放的情况。至
6
此,信令面的异常处理完毕。
抓包分析
再次进行直播视频回传业务测试,发现断流问题仍然存在。需要同时在CPE以及基站
上进行抓包。
对CPE侧的抓包进行分析发现结果无明显异常。
对基站侧的抓包分析发现部分报文存在分包以及重传,具体如下图所示:
由此可以怀疑分包导致的重传和乱序导致了该站点的视频回传概率性断流现象,而重
传很大可能是由于端到端链路网元的MTU设置不合理导致。通过排查,发现是CPE的MTU
值设置为1500,CPE的MTU值设置过大,导致数据流到了基站侧、传输侧、以及核心网
侧会出现分包,从而导致视频流重传和乱序。
三、 解决措施
将CPE MTU由1500改成1400后,该问题不再出现。
7
四、 经验总结
从抓包结果来看,分片比较严重,基站往上存在丢包导致TCP中断和视频中断,判定
是由于传输网络节点中存在分包,分包大小为1460,导致了重传和丢包。 CPE侧MTU
设置成1400后,避免传输设备分片后,问题解决。
MTU介绍
以太网和802.3对数据帧的长度都有一个限制,其最大值分别是1500和1492字节。
链路层的这个特性MTU,最大传输单元。由于IP数据报在由IP层交由数据链路层传输时,
要将包括IP报头和IP数据的内容作为数据链路层的载荷封装在数据链路帧中。因此,MTU
实际上是限制了IP层中IP数据报的总长度,当IP数据报的总长度超过MTU时,即需要
分片(fragmentation),把数据报分成若干片,这样每一片都小于MTU。
在数据流传输时,基站S1-U会给数据流增加36字节GTPU报文头,如果TCP按照
MTU 1500协商,发送报文最终会超过1500,基站出端口报文会分片为一个1500左右大
8
2024年3月13日发(作者:笪从筠)
5G网络CPE MTU设置不当导致4K高清视频回传出现概率性断流问题分析
目 录
一、
二、
问题描述 ...................................................................................................................................................................... 2
分析过程 ...................................................................................................................................................................... 4
基础核查 .............................................................................................................................................................................. 4
信令分析排查 ...................................................................................................................................................................... 5
抓包分析 .............................................................................................................................................................................. 7
三、
四、
解决措施 ...................................................................................................................................................................... 7
经验总结 ...................................................................................................................................................................... 8
MTU介绍 ............................................................................................................................................................................. 8
1
【摘要】广州电信业务演示现场5G CPE进行4K高清视频回传,拓扑链路为视频流
从4K摄像头-CPE-基站-传输-核心网-天翼云服务器-播放大屏的回传及显示业务。基站开
通后小区正常无告警,现场测试上行速率平均在75Mbit/s左右且很稳定,完全满足无人
机图像回传要求的最高速率60Mbit/s。但在业务调试时发现视频回传存在断流的风险,严
重影响业务演示的效果。通过对演示环境、端到端信令跟踪、CPE与基站的抓包分析发现
是由于CPE MTU设置不合理导致视频回传存在重传和乱序,通过更改CPE的MTU后问
题解决。
【关键字】5G,视频回传、断流
一、 问题描述
视频回传组网图如下:
推流链路(广州塔):4K摄像机拍摄画面→CPE→基站→核心网→承载网→视频服
务器(天翼云)→播放大屏
业务需求:直播视频需满足稳定性和时延要求,业务需求为上行平均速率60Mbps,
2
平均时延小于30ms,直播画面稳定无卡顿、无花屏
站点分布:N番禺沙园(汇珑)NR-AAU102-5GZ1PY0003-XJ为演示使用基站,市
桥东方NR-AAU101-GZ5G00112为备用站点。。
问题现象:初始测试时将用于回传的CPE与摄像头相连并定点放置,进行4K视频
回传时图像清晰,无卡顿。但是现场出现每2-3分钟突然断连1-2s的现象,需要重新进
行推流,严重影响业务演示。持续观测后发现该现象可能恶化,概率性出现视频回传断流
现象,短则数秒出现,长则5分钟以上不出现。出现视频断流时,CPE的web管理界面上
行速率以及利用OMT的上行速率检测都显示此时除除物理层外,速率均掉为0,如下图
所示。此外,观察CPE上的SIG指示灯发现出现断流时SIG等处于非正常状态(熄灭或者
闪红灯)。
3
二、 分析过程
基础核查
1.在原地点让摄像头厂家进行多种方式、不同服务器推流,此类问题仍然会出现。尝
试将视频从4K降至1080P,此问题依然会出现。尝试更换使用备用摄像头进行推流回传,
问题仍会出现。基本排除了摄像头、推流服务器的问题。
2.进行基站数据配置核查,和之前演示过该业务的基站进行数据配置对比,关键参数
一致,基本排除基站数据配置错误的问题。
3.由于演示业务地点限制,CPE放置地点距离基站距离超过550米,已经超出了5G
基站建议的300-500米的覆盖范围,因此考虑是否是由于基站与演示点距离过远导致信号
接收不稳定。尝试将CPE挪近基站,距离在100-250米之间选择几个点进行测试,发现
4
该问题仍然存在。在距基站550米地方OMT实际测试时,电平值在-85到-93之间,信
号强度仍能满足接入要求。
4.现场网优测试周边不存在对3.5G频段的干扰,排除干扰的存在。考虑到现场情况,
进行天线下倾角的调整之后,问题仍然存在。
至此,现场初步排查结束,排除了摄像头、推流服务器的问题、基站的数据配置问题、
现场干扰问题以及信号强度问题。
信令分析排查
在4G侧进行S1、UU、X2接口跟踪,S1、UU跟踪结果正常,X2接口存在异常释放,
具体如下图所示。
5
5G小区发起的SRS重配置流程(通过4G配置消息下发给CPE),没有收到CPE响应
最终5G载波释放,业务中断数秒;
通过修改参数MOD NRDUCellRsvdOptParam: NrDuCellId=xx, ParamId=128,
Param1=0; (保留参数128,设置为0)5G侧SRS自适应带宽关闭SRS配置流程后,
FTP测试15分钟没有5G载波释放和数据中断数秒问题。观察CPE上信号指示灯,没有
再出现熄灭或者闪红灯的情况。再次进行信令跟踪时,没有出现5G载波释放的情况。至
6
此,信令面的异常处理完毕。
抓包分析
再次进行直播视频回传业务测试,发现断流问题仍然存在。需要同时在CPE以及基站
上进行抓包。
对CPE侧的抓包进行分析发现结果无明显异常。
对基站侧的抓包分析发现部分报文存在分包以及重传,具体如下图所示:
由此可以怀疑分包导致的重传和乱序导致了该站点的视频回传概率性断流现象,而重
传很大可能是由于端到端链路网元的MTU设置不合理导致。通过排查,发现是CPE的MTU
值设置为1500,CPE的MTU值设置过大,导致数据流到了基站侧、传输侧、以及核心网
侧会出现分包,从而导致视频流重传和乱序。
三、 解决措施
将CPE MTU由1500改成1400后,该问题不再出现。
7
四、 经验总结
从抓包结果来看,分片比较严重,基站往上存在丢包导致TCP中断和视频中断,判定
是由于传输网络节点中存在分包,分包大小为1460,导致了重传和丢包。 CPE侧MTU
设置成1400后,避免传输设备分片后,问题解决。
MTU介绍
以太网和802.3对数据帧的长度都有一个限制,其最大值分别是1500和1492字节。
链路层的这个特性MTU,最大传输单元。由于IP数据报在由IP层交由数据链路层传输时,
要将包括IP报头和IP数据的内容作为数据链路层的载荷封装在数据链路帧中。因此,MTU
实际上是限制了IP层中IP数据报的总长度,当IP数据报的总长度超过MTU时,即需要
分片(fragmentation),把数据报分成若干片,这样每一片都小于MTU。
在数据流传输时,基站S1-U会给数据流增加36字节GTPU报文头,如果TCP按照
MTU 1500协商,发送报文最终会超过1500,基站出端口报文会分片为一个1500左右大
8