2023年12月20日发(作者:辛玉泽)
.
1.1.1 VRRP组状态反复切换
故障处理流程
检查端口状态
互ping功能测试
STP状态检查
检查VRRP报文收发
抓包分析
联系800进一步处理
图1 VRRP组状态反复切换故障处理流程
故障处理步骤
1)步骤1
检查互连端口链路状态是否稳定,端口状态是否频繁UP/DOWN。如果端口状态正常,请转步骤2。
2)步骤2
查看同一VRRP组实地址是否能ping通。如果不能ping通,说明二层不通,需要检查链路状态;如果时通时断,说明可能存在环路,需要进行相关环路检查。如果检查没有问题,请转步骤3。
3)步骤3
使用命令display stp brief查看互连端口的STP状态是否正常。STP状态的反复切换会造成VRRP反复切换,必须保证VRRP协议报文通过的链路STP状态稳定。如果确认两端端口STP状态正常,请转步骤4。
4)步骤4
.
.
打开VRRP调试开关,确定两端的VRRP报文是否能够正常收发。VRRP报文收发正常,请转步骤6。VRRP报文收发异常,请转步骤5。
*0.2100416190 Quidway VRRP/8/DebugState:
Vlan-interface2 | Virtual Router 1 : BACKUP --> MASTER
*0.2100418919 Quidway VRRP/8/DebugState:
Vlan-interface2 | Virtual Router 1 : MASTER --> BACKUP
5)步骤5
通过端口镜像抓包,确定VRRP报文是否已经到达入端口。如果报文没有到达入端口,请检查对端信息。如果报文到达入端口,请转步骤6。
6)步骤6
上述步骤无法定位问题,请参照1.1.2节中步骤三的介绍收集接口板CPU收包信息,并收集信息进一步处理。
1.1.2 启用ping enable之后主机无法ping通VRRP虚地址
故障处理流程
.
.
检查VRRP状态
检查端口配置
检查ARP学习情况
检查端口STP状态
是
两端互ping测试
交换机ping两端
抓包分析
联系800进一步处理
图2 VRRP组不能正常三层转发故障处理流程
故障处理步骤
1)步骤1
使用命令display vrrp查询两边VRRP状态是否正确,是否一主一备,主备状态是否稳定。如果VRRP组状态正常,请转步骤2。
[QUIDWAY-master]display vrrp
Run Method : VIRTUAL-MAC
Virtual Ip Ping : Disable
Interface : Vlan-interface200
VRID : 1 Adver. Timer : 1
.
.
Admin Status : UP State : Master
Config Pri : 110 Run Pri : 110
Preempt Mode : YES Delay Time : 0
Auth Type : NONE
Virtual IP : 200.200.200.200
Virtual MAC : 0000-5e00-0101
Master IP : 200.200.200.1
[QUIDWAY-backup]display vrrp
Run Method : VIRTUAL-MAC
Virtual Ip Ping : Disable
Interface : Vlan-interface200
VRID : 1 Adver. Timer : 1
Admin Status : UP State : Backup
Config Pri : 90 Run Pri : 90
Preempt Mode : YES Delay Time : 0
Auth Type : NONE
Virtual IP : 200.200.200.200
Virtual MAC : 0000-5e00-0101
Master IP : 200.200.200.2
2)步骤2
检查业务经过端口的配置信息,确定端口是否启用DOT1X,ACL规则,端口是否允许VRRP所在VLAN通过。如果配置信息正确,请转步骤3。
3)步骤3
使用display arp查询ARP表项学习情况,检查Master上面是否成功学习到下挂设备的ARP表项,检查路由表项是否正常。当网络拓扑结构发生变化时,ARP表项有可能会学习在错误的端口或者没有及时学习到正确的端口。如果ARP表项或者路由表项不正确,请参照相关模块故障定位过程进行定位分析。如果ARP和路由表正确,请转步骤4。
[QUIDWAY]display arp X.X.X.X
[QUIDWAY]display ip routing-table X.X.X.X
4)步骤4
使用display stp brief检查业务经过端口的STP状态,确定端口STP状态是否正常,且端口STP状态是否稳定。如果端口STP状态正常,请转步骤5。
5)步骤5
使用ping功能,在业务的两端进行互ping,确定是否能够ping通。如果能够ping通,证明三层转发没有问题,需要检查主机发送的业务报文是否正确。如果无法ping通,请转步骤6。
6)步骤6
在确认vrrp ping-enable使能的情况下,在主VRRP上面ping两边的主机(或路由器),确定是否能够ping通。如果两边都能够ping通,则说明QUIDWAY.
.
的硬件转发表项可能存在问题,请直接转步骤8。如果不能ping通,请转步骤7。
7)步骤7
通过端口镜像抓包分析,确定报文是否在交换机被丢弃。如果报文在交换机被丢弃,请转步骤8。如果报文不在交换机丢弃,请检查对端设备。重点关注对端设备是否正确学习到85的VRRP虚MAC地址,是否正确学习到QUIDWAY的虚地址ARP表项。QUIDWAY的VRRP组虚地址MAC比较特殊,为0000-5e00-01XX,前面5个字节固定,后面XX代表VRRP组号。如果对端设备ARP学习错误,需要确认QUIDWAY是否正确发送出源MAC地址是VRRP虚MAC地址的ARP报文。确定QUIDWAY没有发出正确的ARP报文,请转步骤8。
8)步骤8
上述步骤无法定位问题,请参照1.1.2节中步骤三的介绍收集接口板CPU收包信息,并收集信息进一步处理。
1.1.3 控制台上频频给出配置错误的提示
故障处理流程
.
.
检查VRRP状态
检查端口配置
检查ARP学习情况
检查端口STP状态
是
两端互ping测试
交换机ping两端
抓包分析
联系800进一步处理
图3 VRRP组不能正常三层转发故障处理流程
故障处理步骤
1)步骤1
使用命令display vrrp查询两边VRRP状态是否正确,是否一主一备,主备状态是否稳定。如果VRRP组状态正常,请转步骤2。
[QUIDWAY-master]display vrrp
Run Method : VIRTUAL-MAC
Virtual Ip Ping : Disable
Interface : Vlan-interface200
VRID : 1 Adver. Timer : 1
.
.
Admin Status : UP State : Master
Config Pri : 110 Run Pri : 110
Preempt Mode : YES Delay Time : 0
Auth Type : NONE
Virtual IP : 200.200.200.200
Virtual MAC : 0000-5e00-0101
Master IP : 200.200.200.1
[QUIDWAY-backup]display vrrp
Run Method : VIRTUAL-MAC
Virtual Ip Ping : Disable
Interface : Vlan-interface200
VRID : 1 Adver. Timer : 1
Admin Status : UP State : Backup
Config Pri : 90 Run Pri : 90
Preempt Mode : YES Delay Time : 0
Auth Type : NONE
Virtual IP : 200.200.200.200
Virtual MAC : 0000-5e00-0101
Master IP : 200.200.200.2
2)步骤2
检查业务经过端口的配置信息,确定端口是否启用DOT1X,ACL规则,端口是否允许VRRP所在VLAN通过。如果配置信息正确,请转步骤3。
3)步骤3
使用display arp查询ARP表项学习情况,检查Master上面是否成功学习到下挂设备的ARP表项,检查路由表项是否正常。当网络拓扑结构发生变化时,ARP表项有可能会学习在错误的端口或者没有及时学习到正确的端口。如果ARP表项或者路由表项不正确,请参照相关模块故障定位过程进行定位分析。如果ARP和路由表正确,请转步骤4。
[QUIDWAY]display arp X.X.X.X
[QUIDWAY]display ip routing-table X.X.X.X
4)步骤4
使用display stp brief检查业务经过端口的STP状态,确定端口STP状态是否正常,且端口STP状态是否稳定。如果端口STP状态正常,请转步骤5。
5)步骤5
使用ping功能,在业务的两端进行互ping,确定是否能够ping通。如果能够ping通,证明三层转发没有问题,需要检查主机发送的业务报文是否正确。如果无法ping通,请转步骤6。
6)步骤6
在确认vrrp ping-enable使能的情况下,在主VRRP上面ping两边的主机(或路由器),确定是否能够ping通。如果两边都能够ping通,则说明QUIDWAY.
.
的硬件转发表项可能存在问题,请直接转步骤8。如果不能ping通,请转步骤7。
7)步骤7
通过端口镜像抓包分析,确定报文是否在交换机被丢弃。如果报文在交换机被丢弃,请转步骤8。如果报文不在交换机丢弃,请检查对端设备。重点关注对端设备是否正确学习到85的VRRP虚MAC地址,是否正确学习到QUIDWAY的虚地址ARP表项。QUIDWAY的VRRP组虚地址MAC比较特殊,为0000-5e00-01XX,前面5个字节固定,后面XX代表VRRP组号。如果对端设备ARP学习错误,需要确认QUIDWAY是否正确发送出源MAC地址是VRRP虚MAC地址的ARP报文。确定QUIDWAY没有发出正确的ARP报文,请转步骤8。
8)步骤8
上述步骤无法定位问题,请参照1.1.2节中步骤三的介绍收集接口板CPU收包信息,并收集信息进一步处理。
.
2023年12月20日发(作者:辛玉泽)
.
1.1.1 VRRP组状态反复切换
故障处理流程
检查端口状态
互ping功能测试
STP状态检查
检查VRRP报文收发
抓包分析
联系800进一步处理
图1 VRRP组状态反复切换故障处理流程
故障处理步骤
1)步骤1
检查互连端口链路状态是否稳定,端口状态是否频繁UP/DOWN。如果端口状态正常,请转步骤2。
2)步骤2
查看同一VRRP组实地址是否能ping通。如果不能ping通,说明二层不通,需要检查链路状态;如果时通时断,说明可能存在环路,需要进行相关环路检查。如果检查没有问题,请转步骤3。
3)步骤3
使用命令display stp brief查看互连端口的STP状态是否正常。STP状态的反复切换会造成VRRP反复切换,必须保证VRRP协议报文通过的链路STP状态稳定。如果确认两端端口STP状态正常,请转步骤4。
4)步骤4
.
.
打开VRRP调试开关,确定两端的VRRP报文是否能够正常收发。VRRP报文收发正常,请转步骤6。VRRP报文收发异常,请转步骤5。
*0.2100416190 Quidway VRRP/8/DebugState:
Vlan-interface2 | Virtual Router 1 : BACKUP --> MASTER
*0.2100418919 Quidway VRRP/8/DebugState:
Vlan-interface2 | Virtual Router 1 : MASTER --> BACKUP
5)步骤5
通过端口镜像抓包,确定VRRP报文是否已经到达入端口。如果报文没有到达入端口,请检查对端信息。如果报文到达入端口,请转步骤6。
6)步骤6
上述步骤无法定位问题,请参照1.1.2节中步骤三的介绍收集接口板CPU收包信息,并收集信息进一步处理。
1.1.2 启用ping enable之后主机无法ping通VRRP虚地址
故障处理流程
.
.
检查VRRP状态
检查端口配置
检查ARP学习情况
检查端口STP状态
是
两端互ping测试
交换机ping两端
抓包分析
联系800进一步处理
图2 VRRP组不能正常三层转发故障处理流程
故障处理步骤
1)步骤1
使用命令display vrrp查询两边VRRP状态是否正确,是否一主一备,主备状态是否稳定。如果VRRP组状态正常,请转步骤2。
[QUIDWAY-master]display vrrp
Run Method : VIRTUAL-MAC
Virtual Ip Ping : Disable
Interface : Vlan-interface200
VRID : 1 Adver. Timer : 1
.
.
Admin Status : UP State : Master
Config Pri : 110 Run Pri : 110
Preempt Mode : YES Delay Time : 0
Auth Type : NONE
Virtual IP : 200.200.200.200
Virtual MAC : 0000-5e00-0101
Master IP : 200.200.200.1
[QUIDWAY-backup]display vrrp
Run Method : VIRTUAL-MAC
Virtual Ip Ping : Disable
Interface : Vlan-interface200
VRID : 1 Adver. Timer : 1
Admin Status : UP State : Backup
Config Pri : 90 Run Pri : 90
Preempt Mode : YES Delay Time : 0
Auth Type : NONE
Virtual IP : 200.200.200.200
Virtual MAC : 0000-5e00-0101
Master IP : 200.200.200.2
2)步骤2
检查业务经过端口的配置信息,确定端口是否启用DOT1X,ACL规则,端口是否允许VRRP所在VLAN通过。如果配置信息正确,请转步骤3。
3)步骤3
使用display arp查询ARP表项学习情况,检查Master上面是否成功学习到下挂设备的ARP表项,检查路由表项是否正常。当网络拓扑结构发生变化时,ARP表项有可能会学习在错误的端口或者没有及时学习到正确的端口。如果ARP表项或者路由表项不正确,请参照相关模块故障定位过程进行定位分析。如果ARP和路由表正确,请转步骤4。
[QUIDWAY]display arp X.X.X.X
[QUIDWAY]display ip routing-table X.X.X.X
4)步骤4
使用display stp brief检查业务经过端口的STP状态,确定端口STP状态是否正常,且端口STP状态是否稳定。如果端口STP状态正常,请转步骤5。
5)步骤5
使用ping功能,在业务的两端进行互ping,确定是否能够ping通。如果能够ping通,证明三层转发没有问题,需要检查主机发送的业务报文是否正确。如果无法ping通,请转步骤6。
6)步骤6
在确认vrrp ping-enable使能的情况下,在主VRRP上面ping两边的主机(或路由器),确定是否能够ping通。如果两边都能够ping通,则说明QUIDWAY.
.
的硬件转发表项可能存在问题,请直接转步骤8。如果不能ping通,请转步骤7。
7)步骤7
通过端口镜像抓包分析,确定报文是否在交换机被丢弃。如果报文在交换机被丢弃,请转步骤8。如果报文不在交换机丢弃,请检查对端设备。重点关注对端设备是否正确学习到85的VRRP虚MAC地址,是否正确学习到QUIDWAY的虚地址ARP表项。QUIDWAY的VRRP组虚地址MAC比较特殊,为0000-5e00-01XX,前面5个字节固定,后面XX代表VRRP组号。如果对端设备ARP学习错误,需要确认QUIDWAY是否正确发送出源MAC地址是VRRP虚MAC地址的ARP报文。确定QUIDWAY没有发出正确的ARP报文,请转步骤8。
8)步骤8
上述步骤无法定位问题,请参照1.1.2节中步骤三的介绍收集接口板CPU收包信息,并收集信息进一步处理。
1.1.3 控制台上频频给出配置错误的提示
故障处理流程
.
.
检查VRRP状态
检查端口配置
检查ARP学习情况
检查端口STP状态
是
两端互ping测试
交换机ping两端
抓包分析
联系800进一步处理
图3 VRRP组不能正常三层转发故障处理流程
故障处理步骤
1)步骤1
使用命令display vrrp查询两边VRRP状态是否正确,是否一主一备,主备状态是否稳定。如果VRRP组状态正常,请转步骤2。
[QUIDWAY-master]display vrrp
Run Method : VIRTUAL-MAC
Virtual Ip Ping : Disable
Interface : Vlan-interface200
VRID : 1 Adver. Timer : 1
.
.
Admin Status : UP State : Master
Config Pri : 110 Run Pri : 110
Preempt Mode : YES Delay Time : 0
Auth Type : NONE
Virtual IP : 200.200.200.200
Virtual MAC : 0000-5e00-0101
Master IP : 200.200.200.1
[QUIDWAY-backup]display vrrp
Run Method : VIRTUAL-MAC
Virtual Ip Ping : Disable
Interface : Vlan-interface200
VRID : 1 Adver. Timer : 1
Admin Status : UP State : Backup
Config Pri : 90 Run Pri : 90
Preempt Mode : YES Delay Time : 0
Auth Type : NONE
Virtual IP : 200.200.200.200
Virtual MAC : 0000-5e00-0101
Master IP : 200.200.200.2
2)步骤2
检查业务经过端口的配置信息,确定端口是否启用DOT1X,ACL规则,端口是否允许VRRP所在VLAN通过。如果配置信息正确,请转步骤3。
3)步骤3
使用display arp查询ARP表项学习情况,检查Master上面是否成功学习到下挂设备的ARP表项,检查路由表项是否正常。当网络拓扑结构发生变化时,ARP表项有可能会学习在错误的端口或者没有及时学习到正确的端口。如果ARP表项或者路由表项不正确,请参照相关模块故障定位过程进行定位分析。如果ARP和路由表正确,请转步骤4。
[QUIDWAY]display arp X.X.X.X
[QUIDWAY]display ip routing-table X.X.X.X
4)步骤4
使用display stp brief检查业务经过端口的STP状态,确定端口STP状态是否正常,且端口STP状态是否稳定。如果端口STP状态正常,请转步骤5。
5)步骤5
使用ping功能,在业务的两端进行互ping,确定是否能够ping通。如果能够ping通,证明三层转发没有问题,需要检查主机发送的业务报文是否正确。如果无法ping通,请转步骤6。
6)步骤6
在确认vrrp ping-enable使能的情况下,在主VRRP上面ping两边的主机(或路由器),确定是否能够ping通。如果两边都能够ping通,则说明QUIDWAY.
.
的硬件转发表项可能存在问题,请直接转步骤8。如果不能ping通,请转步骤7。
7)步骤7
通过端口镜像抓包分析,确定报文是否在交换机被丢弃。如果报文在交换机被丢弃,请转步骤8。如果报文不在交换机丢弃,请检查对端设备。重点关注对端设备是否正确学习到85的VRRP虚MAC地址,是否正确学习到QUIDWAY的虚地址ARP表项。QUIDWAY的VRRP组虚地址MAC比较特殊,为0000-5e00-01XX,前面5个字节固定,后面XX代表VRRP组号。如果对端设备ARP学习错误,需要确认QUIDWAY是否正确发送出源MAC地址是VRRP虚MAC地址的ARP报文。确定QUIDWAY没有发出正确的ARP报文,请转步骤8。
8)步骤8
上述步骤无法定位问题,请参照1.1.2节中步骤三的介绍收集接口板CPU收包信息,并收集信息进一步处理。
.