2024年3月6日发(作者:贺坚诚)
华为SDH设备主控板常见故障及处理
当前,因光纤通信技术具有抗干扰能力强,传输速度快、传输信息量大等优点,广泛应用于通信行业,越来越多的单位配置各类光端机,运用光纤技术来传输图像、声音、数据和其它信息,目前华为SDH设备的应用比较普便,有Metro1000、Metro3000、OSN3500、OSN7500、OSN1800等型号,然而应用过程中不可避免的会出现一些故障,有光路问题、设备数据接口问题、设备板卡故障问题等等,本文以华为SDH设备Metro系列主控板常见故障为例进行分析。
一、主控板性能介绍
(一)主控板的概念
主控板也叫系统控制及通信板(System Conrtol&Communication unit),简称SCC板,具备完成主控与公务的功能,主控是完成设备的系统控制及通信功能,提供设备与网络管理系统的接口。公务是提供公务功能和开销处理,主要完成公务字节E1和E2,通道字节F1及四个未用字节X1、X2、X3和X4的提取和插入、交换和处理。
(二)主控板的主要功能
1.协同网络管理系统对网元的各单板进行管理,实现对设备网元及整个同步设备网络的实时监控、维护和管理。
2.转化、处理和存贮来自设备其它各功能模块的性能事件和告警,同时将控制、管理信息传递给设备各功能模块。
3.处理D1-D12字节,实现网元之间的通信。DCC的处理有多种方式,如只处理D1-D3或D4-D12或D1-D12;并方便不同厂家设备对接,可以实现DCC的透传。
4.提供设备与网络管理系统连接的F接口和Q接口,实现设备与网络管理系统之间的通信。F接口采用RS-232接插件,Q接口采用RJ-45接插件。
5.可通过网线直连、局域网、广域网等多种方式建立网管终端与设备间的连接。
6.完成开销字节E1、E2、F1及其它四个用户字节的提取、交换、插入。
7.通过主备环重复利用E1、E2 字节,单站最多可提供三路公务电话,接插件采用RJ-11。电话支持寻址呼叫、会议电话、子网会议电话、出子网电话。
8.提供64K同向数据接口F1,接口特性符合ITU-T G.703建议。
9.提供四路透明传输的点到多点的数据串口Serial1、Serial2、 Serial3、Serial4 ,最大数据传输速率为19.2 kbit/s,接口特性为RS-232/RS-422可选。所用开销字节为S1-S4。
(三)主控板的工作原理
其中控制逻辑及邮箱是用于保持与各单板的通信,实现对各单板的监测、管理与控制。DCC接口是处理数据通信通路(DCC)中的D1-D12字节,用于再生段终端之间交流OAM信息。微处理器是实现对各功能模块的监控,控制所有存储器。存储器用来存放设备运行所需的BIOS程序、主机软件,保存性能监视和配置数据。网管接口提供与网管系统连接的F接口和Q接口。通过F接口可实现本地网元与网管系统的通信。通过Q接口可实现整个SDH设备网络与网管系统的通信。话机用户电路单元通过用户电路与开销处理单元联系,完成控制系统信令的发送和接收,支持普通的音频二线话机正常工作。同向数据接口单元提供F1接口,完成才64kbit/s数据的发送与接收。数据接口单元最大传输速率为19.2kbit/s。
四路透明传输接口可完成点到多点的数据广播。两路非透明传输接口与PHONE2或PHONE3配合,实现数据的出子网连接。开销处理单元与线路单元相连,接收方向,完成线路业务E1、E2、F1开销字节的提取。发送方向,完成线路业务E1、E2、F1开销字节的插入。
(四)主控板与其它单板的板间关系
1.设备其它各单板向主控板上报单板参数、状态、性能告警等数据。
2.主控板向设备其它各单板下发数据配置、参数定义等控制信息。
3.主控板与交叉时钟板相联系,接收来自交叉时钟板产生的定时信号。
4.从接收方向的支路、线路业务中提取E1、E2、F1开销字节,向发送方向的支路、线路业务中插入E1、E2、F1开销字节。
二、典型故障案例分析
案例一:因突然断电主控板损坏的故障分析
(一)故障现象
某传输站突然断电,5分钟恢复供电后,该机房一部华为Metro1000型155M光端机(网元A、网关网元)的13STG(同步定时发生器)报HARD-BAD硬件故障紧急告警。经过该设备的视频业务出现多个画面卡顿,在此设备上挂表测试视频业务2M信道,均有持续误码。
(二)故障原因分析
通过网管查询此网元A的收光功率正常,未见异常告警和性能事件,该网元13STG出现的HARD-BAD告警有可能导致误码,设备非正常断(加)电可能导致主控板某个模块硬件损坏从而产生HARD-BAD告警。
(三)故障存在的隐患
1.该设备有可能脱管,网管无法控制,无法进行告警和性能事件查询、配置业务等操作。
2.经该设备的业务出现误码,音视频、网络等业务会出现延迟和卡顿。
3.故障处理不及时,有可能导致所经业务中断。
(四)故障排查思路和方法
1.单板出现故障时,可以执行软件复位或硬件复位操作尝试解决。复位后,单板数据不会丢失,硬件复位所需的时间比软件复位稍长。硬复位和软复位都不会影响业务,除非网络发生了复用段保护倒换。但是当主控板处于复位状态时,网管通信将暂时中断,直到SCC板重新进入正常运行态。因此可利用网管将该155M-13STG先后进行软复位、硬复位,也可以通过主控板拉手条上的复位按钮“RST”来进行复位,按下此按钮,SCC板就复位一次,进行此操作后HARD-BAD告警消失,如果数分钟后告警再次上报,表示故障未排除。
2.通过插拔主控板来复位单板。将13STG单板重新拔插, 拔出时10秒以上,加电后HARD-BAD告警不消失,表示故障未排除。
3.更换主控板,因主控板与其它单板不同,不能简单的插拔,更换前需要做大量工作。
(1)从网管上读取需要更换主控板的网元ID。新主控板的ID与旧的必须完全一致。因Metro1000设备的主控板不能拨动,只能在网管上更改。更改时原网元A和新网元不能同时在一个网管,先在其它网管上进行更改。Metro3000设备的主控板上有ID拨码,可以在新板子上直接进行硬件拨码,拨成和原主控板一致的ID值。拨码时禁止使用水笔,墨水会腐蚀拨码开关里面的金属片,长期运行后,可能出现ID失效的情况。
(2)如果该网元是网关网元,还需要记录IP、子网掩码、子网号以及路由配置信息,准备好网线,需要严格按照色谱制作,并保证可以正常连接。
(3)从网管中查询原主控板上保留的网元用户信息和各网管终端使用的登陆网元用户信息(用户名和密码),避免更换上新主控板后,因未创建对应的网元用户,导致部分已经登陆的网元用户登陆异常。如新换的主控板没有添加原来客户端上某网元用户,而它又不断尝试去登陆该网元,新装的主控板会上报SECU_ALM告警(安全告警),这个告警属于网元安全管理类告警,应该是登录过程中产生的,原因一般有两个,一是登录网元用户名不正确,或者是网元用户密码不对。
(4)记录旧主控板的版本及序列号前10位数字,新更换的主控板版本和序列号前10位数最好一致。
(5)将该网元的相关配置截图并导出表格或导出脚本文件备用。
(6)保证新主控板的数据库数据为空。最好替换一个新的主控板,如果没有全新的主控板,而此板还有其它网元配置数据的,则开工后可能会下发部分已有的配置影响到正常运行的业务,此时应立即使用Navigator下发初始化配置的命令:cfg-init-all,注意不能再下发校验命令,并且擦除该主控板上的数据库,命令为:dbms-delete-all:drdb/fdb0/fdb1;//3个库需要分别下发命令,单独删除。
(7)上载原主控板数据到网管中,保证网管上的配置数据为最新配置。
(8)戴好防静电手坏,拔出原主控板,并插上新的主控板,注意不要插倒针,同时注意光纤的收、发,切不可接反。
(9)网管计算机连接至主控板的“Ethernet”口;如果新的主控板残存有未知的IP地址等设置,可以从其它网元通过ECC登录到该网元上,在获取相应的通信设置后再连接网管计算机。通过ECC登录新更换的SCC板的网元,必须确保登录到了正确的目标网元。
(10)新换上的主控板主机开工后(能连上网元即为开工或者看主控板闪灯状态),必须立即登录到新主控板,使用“:cfg-get-nestate”查询新SCC上网元状态,正常情况应处于“安装态”。
(11)检查新主控板上的软件版本,确保与原网元上使用的版本一致或符合新功能新特性版本要求。
(12)如果是网关网元,按照原来查询的IP、子网掩码、子网号及路由信息进行设置,设置完成后先备份数据库,再复位主机,并测试网管是否可以正常登录。
(13)登陆root用户,按照记录的网元用户信息,创建相关的网元用户。
(14)下发业务配置数据:如果网管配置正确,则用网管登录到该网元,下发该网元原有的配置,下发完后,检查业务状态,一切正常后在网管上备份网元数据库;如果网管配置不能保证正确,需要命令行下发配置文件,同样需要检查业务状态,正常后用网管重新上载网元数据,并用网管备份网元数据库。
(15)设置网元时间和性能监视起始时间、检查告警和性能自动上报设置是否需要调整、检查复用段参数和协议状态、检查SNCP状态、检查TPS状态等,并尽可能进行倒换测试验证。
(16)以上操作完毕后查看故障告警是否消失,最后挂表监测其中一个2M业务,至少24小时,如误码消失,故障排除,业务恢复。
案例二:某网元处于安装态的故障排查
(一)故障现象
某两纤双向复用段保护环上的节点网元为Metro3000设备,某日主控板上报NESTATE-INSTALL 告警(见下图),所有单板变灰,但网元未显示脱管。
(二)故障原因分析
经询问,网管站和该站均未对此设备进行过任何操作。经分析,判断为该节点主控板上数据被清空, 需对该网元进行数据下载或更换主控板。
(三)故障存在的隐患
该节点落地和穿通的所有业务均运行正常, 但因主控板数据缺失, 存在以下通信隐患:
1.无法查询该节点除 NESTATE-INSTALL告警以外的任何告警;
2.无法查询该节点的性能事件;
3.该节点的公务电话无法拨入、 拨出;
4.无法配置在该节点落地或穿通的业务,创建路径后提示部分激活、产生
TU-AIS告警;
5.环网在该节点无法启动保护倒换协议,断纤时部分业务将中断;
6.该节点设备断电重启后, 无法从主控板读取所需数据, 业务将中断;
7.为避免网管侧数据丢失, 不能对该节点进行任何 “查询”和“上载”操作。
(四)故障排查思路和方法
1.对该节点主控板进行数据下载。数据下裁过程中,该节点落地或穿通的所有业务将中断。如下载失败,将二次进行数据下载。
(1)下载前的准备工作。将该单站的相关配置截图留存或导出表格,并导出脚本文件备用;在网管上,将该网元用户名切换为“root”。
(2)数据下载操作。在网管菜单中,点击“配置”、“网元配置数据管理”,选中该网元,点击右下角“下载”,将网管中的数据下发至该主控板。此时业务将中断,约2-10分钟。如提示下载失败,可二次进行下载;观察主控板
的运行状态。下载结束后,通过网管和观察主控板的指示灯,判断其运行是否正常。
(3)数据下载后的检验工作。
①校对网管与网元的数据一致性 。“网元配置数据管理”界面中,选中该网元,点击右下角“一致性校验”;核对保护子网属性、逻辑系统、时钟、公务、网元时间、性能监视、网元登录等配置。参考已备份好的单站配置截图, 核对各项设置并视情更改。
②创建路径测试。利用路径法分别创建在该站落地、串通的2M业务。
③在网管上核对SDH业务配置并对业务进行测试。参考已备份好的单站业务截图、表格,逐条核对该站的SDH业务配置,尤其是以太网板端口使能状态等,如发现业务配置数据丢失和错误,在网管上进行手工配置和更改。
④进行公务拨打、告警上报、性能查询及断纤倒换测试。与网管站进行公务拨打;通过插拔该站内DDF的2M端口测试该网元告警能否上报到网管站;查询该网元性能参数;在网管站进行保护倒换测试:在 SDH保护子网属性正常时,拔尾测试后复原,并观察10分种至“等待恢复态”结束,查询该站光板的收光功率。
⑤检查必要的网元用户。如有同元用户丢失,需重建,并进行网元用户登录。
2.更换主控板。通过数据下载操作,如主控板上异常告警消失、网元数据恢复、各项测试正常,则故障排除。如下载两次均提示失败,则进行更换主控板操作(操作步骤参考案例一)。更换完新的主控板后,要进行数据下载,方法同上述。若网管上的“NESTATE-INSTALL”等异常告警消失,故障排除。
三、结论
在设备的扩容和维护中,常常需要添加或更换单板,而不正确的操作往往引发通信事故。尤其是主控板的更换较复杂,一定要区分更换前、更换中、更换后的的操作步骤和注意事项。更换前要检查并记录主控板的规格,确认更换前后的
一致性,记录主控板相关配置,准备新板及操作工具,同时检查主控板是否有引出纤缆,纤缆的标签是否完整,对缺少的要及时进行补充。更换中要戴防静电手环,正确插拔单板,如果单板有纤缆引出,应先移去。更换后要重新下发配置数据,设置性能监视,备份数据库,对于有保护的功能单元,检查倒换是否正常,检查单板指示灯闪烁情况,确认是否正常工作,通过网管查询有无异常告警和性能事件,换下的单板放入防静电袋中,贴上维护标签、网元名称及故障现象。
小技巧:在更换主控板时,也可提前配好新的主控板,再替换旧的主控板,省去安装新板下发配置业务的环节,可缩短业务中断时间。方法:搭建相同的环境,用备用同型号设备,确保各单板位置一致,将新主控板插入模拟设备,连上网管,修改ID、IP,创建用户,用单站法逐条配置原主控板上记录的业务,再配置时间同步,公务、时钟、手工修改端口。新主控板配置完毕,替换坏的主控板,后续业务核对、测试倒换方法如前。
2024年3月6日发(作者:贺坚诚)
华为SDH设备主控板常见故障及处理
当前,因光纤通信技术具有抗干扰能力强,传输速度快、传输信息量大等优点,广泛应用于通信行业,越来越多的单位配置各类光端机,运用光纤技术来传输图像、声音、数据和其它信息,目前华为SDH设备的应用比较普便,有Metro1000、Metro3000、OSN3500、OSN7500、OSN1800等型号,然而应用过程中不可避免的会出现一些故障,有光路问题、设备数据接口问题、设备板卡故障问题等等,本文以华为SDH设备Metro系列主控板常见故障为例进行分析。
一、主控板性能介绍
(一)主控板的概念
主控板也叫系统控制及通信板(System Conrtol&Communication unit),简称SCC板,具备完成主控与公务的功能,主控是完成设备的系统控制及通信功能,提供设备与网络管理系统的接口。公务是提供公务功能和开销处理,主要完成公务字节E1和E2,通道字节F1及四个未用字节X1、X2、X3和X4的提取和插入、交换和处理。
(二)主控板的主要功能
1.协同网络管理系统对网元的各单板进行管理,实现对设备网元及整个同步设备网络的实时监控、维护和管理。
2.转化、处理和存贮来自设备其它各功能模块的性能事件和告警,同时将控制、管理信息传递给设备各功能模块。
3.处理D1-D12字节,实现网元之间的通信。DCC的处理有多种方式,如只处理D1-D3或D4-D12或D1-D12;并方便不同厂家设备对接,可以实现DCC的透传。
4.提供设备与网络管理系统连接的F接口和Q接口,实现设备与网络管理系统之间的通信。F接口采用RS-232接插件,Q接口采用RJ-45接插件。
5.可通过网线直连、局域网、广域网等多种方式建立网管终端与设备间的连接。
6.完成开销字节E1、E2、F1及其它四个用户字节的提取、交换、插入。
7.通过主备环重复利用E1、E2 字节,单站最多可提供三路公务电话,接插件采用RJ-11。电话支持寻址呼叫、会议电话、子网会议电话、出子网电话。
8.提供64K同向数据接口F1,接口特性符合ITU-T G.703建议。
9.提供四路透明传输的点到多点的数据串口Serial1、Serial2、 Serial3、Serial4 ,最大数据传输速率为19.2 kbit/s,接口特性为RS-232/RS-422可选。所用开销字节为S1-S4。
(三)主控板的工作原理
其中控制逻辑及邮箱是用于保持与各单板的通信,实现对各单板的监测、管理与控制。DCC接口是处理数据通信通路(DCC)中的D1-D12字节,用于再生段终端之间交流OAM信息。微处理器是实现对各功能模块的监控,控制所有存储器。存储器用来存放设备运行所需的BIOS程序、主机软件,保存性能监视和配置数据。网管接口提供与网管系统连接的F接口和Q接口。通过F接口可实现本地网元与网管系统的通信。通过Q接口可实现整个SDH设备网络与网管系统的通信。话机用户电路单元通过用户电路与开销处理单元联系,完成控制系统信令的发送和接收,支持普通的音频二线话机正常工作。同向数据接口单元提供F1接口,完成才64kbit/s数据的发送与接收。数据接口单元最大传输速率为19.2kbit/s。
四路透明传输接口可完成点到多点的数据广播。两路非透明传输接口与PHONE2或PHONE3配合,实现数据的出子网连接。开销处理单元与线路单元相连,接收方向,完成线路业务E1、E2、F1开销字节的提取。发送方向,完成线路业务E1、E2、F1开销字节的插入。
(四)主控板与其它单板的板间关系
1.设备其它各单板向主控板上报单板参数、状态、性能告警等数据。
2.主控板向设备其它各单板下发数据配置、参数定义等控制信息。
3.主控板与交叉时钟板相联系,接收来自交叉时钟板产生的定时信号。
4.从接收方向的支路、线路业务中提取E1、E2、F1开销字节,向发送方向的支路、线路业务中插入E1、E2、F1开销字节。
二、典型故障案例分析
案例一:因突然断电主控板损坏的故障分析
(一)故障现象
某传输站突然断电,5分钟恢复供电后,该机房一部华为Metro1000型155M光端机(网元A、网关网元)的13STG(同步定时发生器)报HARD-BAD硬件故障紧急告警。经过该设备的视频业务出现多个画面卡顿,在此设备上挂表测试视频业务2M信道,均有持续误码。
(二)故障原因分析
通过网管查询此网元A的收光功率正常,未见异常告警和性能事件,该网元13STG出现的HARD-BAD告警有可能导致误码,设备非正常断(加)电可能导致主控板某个模块硬件损坏从而产生HARD-BAD告警。
(三)故障存在的隐患
1.该设备有可能脱管,网管无法控制,无法进行告警和性能事件查询、配置业务等操作。
2.经该设备的业务出现误码,音视频、网络等业务会出现延迟和卡顿。
3.故障处理不及时,有可能导致所经业务中断。
(四)故障排查思路和方法
1.单板出现故障时,可以执行软件复位或硬件复位操作尝试解决。复位后,单板数据不会丢失,硬件复位所需的时间比软件复位稍长。硬复位和软复位都不会影响业务,除非网络发生了复用段保护倒换。但是当主控板处于复位状态时,网管通信将暂时中断,直到SCC板重新进入正常运行态。因此可利用网管将该155M-13STG先后进行软复位、硬复位,也可以通过主控板拉手条上的复位按钮“RST”来进行复位,按下此按钮,SCC板就复位一次,进行此操作后HARD-BAD告警消失,如果数分钟后告警再次上报,表示故障未排除。
2.通过插拔主控板来复位单板。将13STG单板重新拔插, 拔出时10秒以上,加电后HARD-BAD告警不消失,表示故障未排除。
3.更换主控板,因主控板与其它单板不同,不能简单的插拔,更换前需要做大量工作。
(1)从网管上读取需要更换主控板的网元ID。新主控板的ID与旧的必须完全一致。因Metro1000设备的主控板不能拨动,只能在网管上更改。更改时原网元A和新网元不能同时在一个网管,先在其它网管上进行更改。Metro3000设备的主控板上有ID拨码,可以在新板子上直接进行硬件拨码,拨成和原主控板一致的ID值。拨码时禁止使用水笔,墨水会腐蚀拨码开关里面的金属片,长期运行后,可能出现ID失效的情况。
(2)如果该网元是网关网元,还需要记录IP、子网掩码、子网号以及路由配置信息,准备好网线,需要严格按照色谱制作,并保证可以正常连接。
(3)从网管中查询原主控板上保留的网元用户信息和各网管终端使用的登陆网元用户信息(用户名和密码),避免更换上新主控板后,因未创建对应的网元用户,导致部分已经登陆的网元用户登陆异常。如新换的主控板没有添加原来客户端上某网元用户,而它又不断尝试去登陆该网元,新装的主控板会上报SECU_ALM告警(安全告警),这个告警属于网元安全管理类告警,应该是登录过程中产生的,原因一般有两个,一是登录网元用户名不正确,或者是网元用户密码不对。
(4)记录旧主控板的版本及序列号前10位数字,新更换的主控板版本和序列号前10位数最好一致。
(5)将该网元的相关配置截图并导出表格或导出脚本文件备用。
(6)保证新主控板的数据库数据为空。最好替换一个新的主控板,如果没有全新的主控板,而此板还有其它网元配置数据的,则开工后可能会下发部分已有的配置影响到正常运行的业务,此时应立即使用Navigator下发初始化配置的命令:cfg-init-all,注意不能再下发校验命令,并且擦除该主控板上的数据库,命令为:dbms-delete-all:drdb/fdb0/fdb1;//3个库需要分别下发命令,单独删除。
(7)上载原主控板数据到网管中,保证网管上的配置数据为最新配置。
(8)戴好防静电手坏,拔出原主控板,并插上新的主控板,注意不要插倒针,同时注意光纤的收、发,切不可接反。
(9)网管计算机连接至主控板的“Ethernet”口;如果新的主控板残存有未知的IP地址等设置,可以从其它网元通过ECC登录到该网元上,在获取相应的通信设置后再连接网管计算机。通过ECC登录新更换的SCC板的网元,必须确保登录到了正确的目标网元。
(10)新换上的主控板主机开工后(能连上网元即为开工或者看主控板闪灯状态),必须立即登录到新主控板,使用“:cfg-get-nestate”查询新SCC上网元状态,正常情况应处于“安装态”。
(11)检查新主控板上的软件版本,确保与原网元上使用的版本一致或符合新功能新特性版本要求。
(12)如果是网关网元,按照原来查询的IP、子网掩码、子网号及路由信息进行设置,设置完成后先备份数据库,再复位主机,并测试网管是否可以正常登录。
(13)登陆root用户,按照记录的网元用户信息,创建相关的网元用户。
(14)下发业务配置数据:如果网管配置正确,则用网管登录到该网元,下发该网元原有的配置,下发完后,检查业务状态,一切正常后在网管上备份网元数据库;如果网管配置不能保证正确,需要命令行下发配置文件,同样需要检查业务状态,正常后用网管重新上载网元数据,并用网管备份网元数据库。
(15)设置网元时间和性能监视起始时间、检查告警和性能自动上报设置是否需要调整、检查复用段参数和协议状态、检查SNCP状态、检查TPS状态等,并尽可能进行倒换测试验证。
(16)以上操作完毕后查看故障告警是否消失,最后挂表监测其中一个2M业务,至少24小时,如误码消失,故障排除,业务恢复。
案例二:某网元处于安装态的故障排查
(一)故障现象
某两纤双向复用段保护环上的节点网元为Metro3000设备,某日主控板上报NESTATE-INSTALL 告警(见下图),所有单板变灰,但网元未显示脱管。
(二)故障原因分析
经询问,网管站和该站均未对此设备进行过任何操作。经分析,判断为该节点主控板上数据被清空, 需对该网元进行数据下载或更换主控板。
(三)故障存在的隐患
该节点落地和穿通的所有业务均运行正常, 但因主控板数据缺失, 存在以下通信隐患:
1.无法查询该节点除 NESTATE-INSTALL告警以外的任何告警;
2.无法查询该节点的性能事件;
3.该节点的公务电话无法拨入、 拨出;
4.无法配置在该节点落地或穿通的业务,创建路径后提示部分激活、产生
TU-AIS告警;
5.环网在该节点无法启动保护倒换协议,断纤时部分业务将中断;
6.该节点设备断电重启后, 无法从主控板读取所需数据, 业务将中断;
7.为避免网管侧数据丢失, 不能对该节点进行任何 “查询”和“上载”操作。
(四)故障排查思路和方法
1.对该节点主控板进行数据下载。数据下裁过程中,该节点落地或穿通的所有业务将中断。如下载失败,将二次进行数据下载。
(1)下载前的准备工作。将该单站的相关配置截图留存或导出表格,并导出脚本文件备用;在网管上,将该网元用户名切换为“root”。
(2)数据下载操作。在网管菜单中,点击“配置”、“网元配置数据管理”,选中该网元,点击右下角“下载”,将网管中的数据下发至该主控板。此时业务将中断,约2-10分钟。如提示下载失败,可二次进行下载;观察主控板
的运行状态。下载结束后,通过网管和观察主控板的指示灯,判断其运行是否正常。
(3)数据下载后的检验工作。
①校对网管与网元的数据一致性 。“网元配置数据管理”界面中,选中该网元,点击右下角“一致性校验”;核对保护子网属性、逻辑系统、时钟、公务、网元时间、性能监视、网元登录等配置。参考已备份好的单站配置截图, 核对各项设置并视情更改。
②创建路径测试。利用路径法分别创建在该站落地、串通的2M业务。
③在网管上核对SDH业务配置并对业务进行测试。参考已备份好的单站业务截图、表格,逐条核对该站的SDH业务配置,尤其是以太网板端口使能状态等,如发现业务配置数据丢失和错误,在网管上进行手工配置和更改。
④进行公务拨打、告警上报、性能查询及断纤倒换测试。与网管站进行公务拨打;通过插拔该站内DDF的2M端口测试该网元告警能否上报到网管站;查询该网元性能参数;在网管站进行保护倒换测试:在 SDH保护子网属性正常时,拔尾测试后复原,并观察10分种至“等待恢复态”结束,查询该站光板的收光功率。
⑤检查必要的网元用户。如有同元用户丢失,需重建,并进行网元用户登录。
2.更换主控板。通过数据下载操作,如主控板上异常告警消失、网元数据恢复、各项测试正常,则故障排除。如下载两次均提示失败,则进行更换主控板操作(操作步骤参考案例一)。更换完新的主控板后,要进行数据下载,方法同上述。若网管上的“NESTATE-INSTALL”等异常告警消失,故障排除。
三、结论
在设备的扩容和维护中,常常需要添加或更换单板,而不正确的操作往往引发通信事故。尤其是主控板的更换较复杂,一定要区分更换前、更换中、更换后的的操作步骤和注意事项。更换前要检查并记录主控板的规格,确认更换前后的
一致性,记录主控板相关配置,准备新板及操作工具,同时检查主控板是否有引出纤缆,纤缆的标签是否完整,对缺少的要及时进行补充。更换中要戴防静电手环,正确插拔单板,如果单板有纤缆引出,应先移去。更换后要重新下发配置数据,设置性能监视,备份数据库,对于有保护的功能单元,检查倒换是否正常,检查单板指示灯闪烁情况,确认是否正常工作,通过网管查询有无异常告警和性能事件,换下的单板放入防静电袋中,贴上维护标签、网元名称及故障现象。
小技巧:在更换主控板时,也可提前配好新的主控板,再替换旧的主控板,省去安装新板下发配置业务的环节,可缩短业务中断时间。方法:搭建相同的环境,用备用同型号设备,确保各单板位置一致,将新主控板插入模拟设备,连上网管,修改ID、IP,创建用户,用单站法逐条配置原主控板上记录的业务,再配置时间同步,公务、时钟、手工修改端口。新主控板配置完毕,替换坏的主控板,后续业务核对、测试倒换方法如前。