2024年8月26日发(作者:翦曼衍)
阿尔卡特SDH常见告警及处理方法
阿尔卡特sdh故障
2.1rup,rum,icp类告警处理
监视系统产生原因:
1.原因1rum还可能是网管配置了板,但实际配插板2.原因2机盘硬件故障
3.原因3icp有可能就是其它盘引发,如1660的矩阵、主控;1662的synth16;
1642的mb板告警处理方法:
1.原因1对于rum首先核实与否现场每插板,例如没有插板可以在网管回去布局(对
于
有配置电路或作为时钟源的,需先删除这些配置),当然现场每插板,由配置了电路
或时钟源需仔细核实是否是垃圾数据在删。2.原因2替换相应的故障盘
3.对于icp监视系统例如替代故障盘后仍不消失,则须要考量可能将就是其它的矩阵、
主控、
synth16、mb盘等引起。可先对这些怀疑的板做插拔(注意对业务和监控的影响,一
般主控盘插拔只影响监控;矩阵和synth16均有保护,如无异常状态或第二处故障,插拔
备用也不影响业务(要插拔当前的主用矩阵需先切换成备用角色再插拔,切换后等15分
钟让它同步完再操作)),定位到故障板后替换故障板。2.2td,uru,tf告警
监视系统名称或故障现象:设备光口或端口报td(transmitterdegraded),uru
(underlyingresourceunavailable),tf(transmitterfailure)监视系统。
告警产生原因:
1.原因1如有光模块的机盘,则可能将就是故障
2.原因2机盘故障告警处理方法:1.原因1替换光模块2.原因2替换机盘
2.3los,lof告警处理
监视系统名称或故障现象:los(lossofsignal;lof(lossofframe);ms-ais;ms-
rdi监视系统
告警产生原因:1.原因1光缆故障
2.原因2对端设备停水或绞死(主要就是互连设备)
3.原因3显现硬件故障,相应光板报rup、rum、icp、uru、td、tf等告警4.原因4
隐性硬件故障5.原因5光模块吊死告警处理方法:
1.原因1对光及otdr测试等排查光路故障,去除光缆故障(具体内容见到光缆故障
处理)
2.原因2现场开电或环mb板
3.原因3显现硬件故障请替换相应的故障板
4.原因4当光路对光正常,并无显著的硬件故障后,则可能将就是隐性硬件故障。
处理方法如下:首先两边对应的端口做尾纤自环,看哪个光口自环后故障出现,则替
换那块光板。做光口自环需注意如下问题:1:注意光功率,根据不同的光盘添加不同的
衰减器,避免过载,光口参数参见10.244.9.52网管组学习资料(gponptn)阿尔
卡特培训资料/;2:自环前测一下光功率,避免因故障尾纤、接头没插好等导致的误判断;
3:对于涉及ms-spring环保护的光口,尾纤自环前必须对对于的光口做人工
“forceswith”操作,自环解除后必须清除强制倒换!这是因为“forceswith”的级别大
于“losofsignal”,这样,自环后即使超过5分钟业务也不会倒回来,不会因此影响业
务。
5.原因5,对于阿尔卡特编号为8dg结尾(l64.2e)光盘,当发生los监视系统后
光模块可能吊死从而不发光,此时需现场插拔一下光模块。2.4光口eber、ds告警处
理
监视系统名称或故障现象:eber(excessiveeber性能越减半);ds
(degradedsignal信号劣化),光口性能劣化。
告警产生原因:1.原因1光缆故障2.原因2隐性硬件故障
监视系统处置方法:
1.原因1对光及otdr测试等排查光路故障,清除光缆故障(具体见光缆故障
处置)
2.原因2当光路对光正常,则可能是隐性硬件故障。处理方法如下:首先两
边对应的端口搞尾纤自环,自环后查阅光口性能,看看那块光盘仍然存有误码,则替
代那块光板。搞光口自环需注意如下问题:1:特别注意光功率,根据相同的光盘嵌入相
同的衰减器,防止负载,光口参数参看10.244.9.52网管组自学资料(gponptn)
阿尔卡特培训资料/;2:自环前测一下光功率,防止因故障尾纤、接点没挂不好等引致的
误推论;3:对于牵涉ms-spring环维护的光口,尾纤自环前必须对对于的光口搞人工
“forceswith”操作方式,自环中止后必须去除强制性滤除!这是因为“forceswith”的
级别大于“losofsignal”,这样,自环后即使少于5分钟业务也不能好像回去,不能因
此影响业务。2.5csf监视系统处置
1.原因1相应两端光口的lapd配置不匹配或一边没配置
2.原因2适当的光板上加los,lof,ms-rdi,ms-ais,ds,eber,rup,rum
等其他告警
3.原因31660主控板,1642mb板,16626槽位的synth16盘存有故障监视系统处置方
法:
1.原因1重新配置lapd,配置原则是network必须与user配对。2.原因2先处理其
他故障以清除本告警。
3.原因3插拔或重新启动适当的主先知先觉(通常都就是报csf监视系统网元的对端
设备存有
问题)或换主控板。2.6cpe告警处理
监视系统产生原因:1.原因1布局问题2.原因2硬件问题监视系统处置方法:
1.原因1对于出告警的光口属msp1+1保护组的,一般均是保护组两边网元的
单、双向选项不一致,删掉维护组重配即可。删帖维护戊二烯,恳请核实主水泵光口
需用,否则可能将影响业务。对于msp-spring环维护光口,则升级给传输室处置。
2.原因2如相应的光板有rup,rum等告警则先处理这些告警。否则升级给传
输室处置
2.7insidefailuer告警处理
监视系统名称或故障现象:insidefailure内部总线监视系统
告警产生原因:
1.原因1设备时钟处在民主自由盘整状态,并无有效率的参照时钟2.原因2业务板故
障3.原因3矩阵故障监视系统处置方法:
1.原因1此时备用矩阵到所有业务盘均是红线,需先处理时钟故障
2.原因2如果某业务盘到主备矩阵均就是红线,则首先替代该业务盘。如果只是
某块业务盘到一块矩阵有红线,也首先替换业务盘看故障是否消失。3.原因3如果某
块矩阵到多个业务盘有红线,则替换该矩阵。2.8coolingfanfailure,housekeeping告警
处理告警名称或故障现象:风扇告警告警
监视系统产生原因:1.原因1风扇硬件故障2.原因2风扇电源故障监视系统处置方法:
1.原因1替代故障风扇
2.原因2查看风扇电源熔丝是否开启,清除电源故障。2.9batteryfailure,
fusefailure告警处理告警名称或故障现象:电源相关告警
监视系统产生原因:1.原因1外部电源故障2.原因2congi盘故障监视系统处置方法:
1.原因1处理外部电源故障,确保列头柜有电,架顶电源开关打上,无短路想
象
2.原因2更换报障的congi盘。更换前先确认好报障congi板在架顶的对应电
源控制器,证实有误后先断裂对应的安座,观测设备绝无停水现象,然后拆毁congi
板上的线缆,穿上新板并再次接通电缆,然后打开架顶上对应的控制器。
2.10lossoftimingsources;frequencyoffset监视系统处置监视系统名称或故障现象:时
钟源遗失,时钟频偏监视系统
2024年8月26日发(作者:翦曼衍)
阿尔卡特SDH常见告警及处理方法
阿尔卡特sdh故障
2.1rup,rum,icp类告警处理
监视系统产生原因:
1.原因1rum还可能是网管配置了板,但实际配插板2.原因2机盘硬件故障
3.原因3icp有可能就是其它盘引发,如1660的矩阵、主控;1662的synth16;
1642的mb板告警处理方法:
1.原因1对于rum首先核实与否现场每插板,例如没有插板可以在网管回去布局(对
于
有配置电路或作为时钟源的,需先删除这些配置),当然现场每插板,由配置了电路
或时钟源需仔细核实是否是垃圾数据在删。2.原因2替换相应的故障盘
3.对于icp监视系统例如替代故障盘后仍不消失,则须要考量可能将就是其它的矩阵、
主控、
synth16、mb盘等引起。可先对这些怀疑的板做插拔(注意对业务和监控的影响,一
般主控盘插拔只影响监控;矩阵和synth16均有保护,如无异常状态或第二处故障,插拔
备用也不影响业务(要插拔当前的主用矩阵需先切换成备用角色再插拔,切换后等15分
钟让它同步完再操作)),定位到故障板后替换故障板。2.2td,uru,tf告警
监视系统名称或故障现象:设备光口或端口报td(transmitterdegraded),uru
(underlyingresourceunavailable),tf(transmitterfailure)监视系统。
告警产生原因:
1.原因1如有光模块的机盘,则可能将就是故障
2.原因2机盘故障告警处理方法:1.原因1替换光模块2.原因2替换机盘
2.3los,lof告警处理
监视系统名称或故障现象:los(lossofsignal;lof(lossofframe);ms-ais;ms-
rdi监视系统
告警产生原因:1.原因1光缆故障
2.原因2对端设备停水或绞死(主要就是互连设备)
3.原因3显现硬件故障,相应光板报rup、rum、icp、uru、td、tf等告警4.原因4
隐性硬件故障5.原因5光模块吊死告警处理方法:
1.原因1对光及otdr测试等排查光路故障,去除光缆故障(具体内容见到光缆故障
处理)
2.原因2现场开电或环mb板
3.原因3显现硬件故障请替换相应的故障板
4.原因4当光路对光正常,并无显著的硬件故障后,则可能将就是隐性硬件故障。
处理方法如下:首先两边对应的端口做尾纤自环,看哪个光口自环后故障出现,则替
换那块光板。做光口自环需注意如下问题:1:注意光功率,根据不同的光盘添加不同的
衰减器,避免过载,光口参数参见10.244.9.52网管组学习资料(gponptn)阿尔
卡特培训资料/;2:自环前测一下光功率,避免因故障尾纤、接头没插好等导致的误判断;
3:对于涉及ms-spring环保护的光口,尾纤自环前必须对对于的光口做人工
“forceswith”操作,自环解除后必须清除强制倒换!这是因为“forceswith”的级别大
于“losofsignal”,这样,自环后即使超过5分钟业务也不会倒回来,不会因此影响业
务。
5.原因5,对于阿尔卡特编号为8dg结尾(l64.2e)光盘,当发生los监视系统后
光模块可能吊死从而不发光,此时需现场插拔一下光模块。2.4光口eber、ds告警处
理
监视系统名称或故障现象:eber(excessiveeber性能越减半);ds
(degradedsignal信号劣化),光口性能劣化。
告警产生原因:1.原因1光缆故障2.原因2隐性硬件故障
监视系统处置方法:
1.原因1对光及otdr测试等排查光路故障,清除光缆故障(具体见光缆故障
处置)
2.原因2当光路对光正常,则可能是隐性硬件故障。处理方法如下:首先两
边对应的端口搞尾纤自环,自环后查阅光口性能,看看那块光盘仍然存有误码,则替
代那块光板。搞光口自环需注意如下问题:1:特别注意光功率,根据相同的光盘嵌入相
同的衰减器,防止负载,光口参数参看10.244.9.52网管组自学资料(gponptn)
阿尔卡特培训资料/;2:自环前测一下光功率,防止因故障尾纤、接点没挂不好等引致的
误推论;3:对于牵涉ms-spring环维护的光口,尾纤自环前必须对对于的光口搞人工
“forceswith”操作方式,自环中止后必须去除强制性滤除!这是因为“forceswith”的
级别大于“losofsignal”,这样,自环后即使少于5分钟业务也不能好像回去,不能因
此影响业务。2.5csf监视系统处置
1.原因1相应两端光口的lapd配置不匹配或一边没配置
2.原因2适当的光板上加los,lof,ms-rdi,ms-ais,ds,eber,rup,rum
等其他告警
3.原因31660主控板,1642mb板,16626槽位的synth16盘存有故障监视系统处置方
法:
1.原因1重新配置lapd,配置原则是network必须与user配对。2.原因2先处理其
他故障以清除本告警。
3.原因3插拔或重新启动适当的主先知先觉(通常都就是报csf监视系统网元的对端
设备存有
问题)或换主控板。2.6cpe告警处理
监视系统产生原因:1.原因1布局问题2.原因2硬件问题监视系统处置方法:
1.原因1对于出告警的光口属msp1+1保护组的,一般均是保护组两边网元的
单、双向选项不一致,删掉维护组重配即可。删帖维护戊二烯,恳请核实主水泵光口
需用,否则可能将影响业务。对于msp-spring环维护光口,则升级给传输室处置。
2.原因2如相应的光板有rup,rum等告警则先处理这些告警。否则升级给传
输室处置
2.7insidefailuer告警处理
监视系统名称或故障现象:insidefailure内部总线监视系统
告警产生原因:
1.原因1设备时钟处在民主自由盘整状态,并无有效率的参照时钟2.原因2业务板故
障3.原因3矩阵故障监视系统处置方法:
1.原因1此时备用矩阵到所有业务盘均是红线,需先处理时钟故障
2.原因2如果某业务盘到主备矩阵均就是红线,则首先替代该业务盘。如果只是
某块业务盘到一块矩阵有红线,也首先替换业务盘看故障是否消失。3.原因3如果某
块矩阵到多个业务盘有红线,则替换该矩阵。2.8coolingfanfailure,housekeeping告警
处理告警名称或故障现象:风扇告警告警
监视系统产生原因:1.原因1风扇硬件故障2.原因2风扇电源故障监视系统处置方法:
1.原因1替代故障风扇
2.原因2查看风扇电源熔丝是否开启,清除电源故障。2.9batteryfailure,
fusefailure告警处理告警名称或故障现象:电源相关告警
监视系统产生原因:1.原因1外部电源故障2.原因2congi盘故障监视系统处置方法:
1.原因1处理外部电源故障,确保列头柜有电,架顶电源开关打上,无短路想
象
2.原因2更换报障的congi盘。更换前先确认好报障congi板在架顶的对应电
源控制器,证实有误后先断裂对应的安座,观测设备绝无停水现象,然后拆毁congi
板上的线缆,穿上新板并再次接通电缆,然后打开架顶上对应的控制器。
2.10lossoftimingsources;frequencyoffset监视系统处置监视系统名称或故障现象:时
钟源遗失,时钟频偏监视系统