扫一扫
关注微信公众号

通过连续观察法排除故障
2007-10-09   网络

[故障现象]

公司有3C16980A(V2.6)、3C16950(V2.4)、3C16950(V2.6)这几台交换机堆叠,最近发现有时直接连接在堆叠交换机上的部分客房机不能联网、网上邻居找不到、通过网络打印机打印缓慢,需重新启动3C16980A才能恢复。询问3Com公司后,答复是堆叠矩阵中的交换机软件的版本不同所致,于是购买两台新的3C16985B(V2.66)替换旧3C16950,达到版本一致后,可新的问题又出现了,只有连接在堆叠矩阵中Unit 3上的终端不能访问网络,重启Unit 3才能恢复。堆叠顺序如下:

3C16980A Unit 1

3C16985B—1 Unit 2

3C16985B—2 Unit 3

3C169850 Unit 4

诊断过程  对公司网络进行了长达一周的监测,发现网络中存在较多的问题,现对发现的问题的问题进行如下分析:

观察方法:通过监控软件和登录交换机查看交换机上的一些信息,并通过ping命令来看交换机的连通状态。

第一次观察:(第一天 上午10:05)

网络结构:堆叠环境中Unitl (3C16980带一四口堆叠模矩阵),Unit 2(3C16985B—1),Unit3(3C16985B-2),Unit 4(3C16950).

在Unit3上交换机分配一IP地址为202.199.100.145,堆叠中Unit 3任一端口连接一台客户机,然后在此客户机上长时间ping任意一台主机的IP地址,一开始为正常,后来屏幕上显示Request timed out,并发现Unit 3自动重启两次,时间间隔在2min内。Unit 3重启后可ping通,但丢包现象严重,丢包率在30%~50%。

在Unit 4中,重复上述操作,无上述现象发生,将OneTouch接到Unit 3上,Unit 3上接PC A(IP为202.199.100.147),Unit 4接PC  B(IP为202.199.100.146)。用OpenTouch对PC B施加背景流量,并且Unit 4中使用PC B(IP为202.199.100.146)ping Uint 3中的PC A(202.199.100.147),所发流量(1518byte/f,700f/s)为8.55Mb/s时,Unit 3工作正常。加大背景流量到9.7Mb/s时丢包现象开始出现。

结论:堆叠中的Unit 3交换机可能存在问题,但是否由于堆叠口有问题引起上述现象,还有待考察。

第二次观察:(第一天 下午2:40)

网络结构:同上

在Unit 3中连接两台电脑,IP分别为202.199.100.146和202.199.100.147.除了使用两台电脑互相ping对方的IP地址外,同时使用这两台PC ping不在Unit 3中连接的任意客户机,发现只有Unit 3中的两台电脑之间的ping包正常,到Unit 3之外的ping包都有丢包。

结论:Unit 3交换机端口间传输正常,可能堆叠口有问题。

第三次观察:(第一天 下午4:00)

网络结构:同上

在Unit 3内连接PC A (IP为202.199.100.146),Unit 2内连接PC B(IP为202.199.100.147),采用发ping包的方法进行测试,PC A与PC B在互相ping对方的同时,ping接在堆叠中的其他Unit上的客户机的IP地址。

结果发现Unit 3中PC A的所有ping操作都有丢包现象发生,而Unit 2中PC B的ping操作中只有在ping Unit 3中的PC A时丢包,其他均正常。

结论:结合观察2综合判断Unit 3交换机工作正常,可能堆叠存在问题。

第四次观察:(第一天  下午4:10)

网络结构:同上

在观察3的基础上,把连接到Unit 3的PC A与连接到Unit 2的PC B互换,进行上述ping包测试,PC B ping其他Unit中的客户机均有丢包,而PC A只有在ping PC B时才有丢现象,ping Unit 1和Unit 4和客户机均正常。

结论:可排除丢包现象是由PC引起的因素。

第五次观察:(第一天 下午4:30)

网络结构:保持原来的Unit1、Unit2、Unit4堆叠状态,把Unit3由原来的堆叠改为级联。把Unit 3交换机由原来的堆叠中断开,级联到Unit2上。

然后进行和第四次观察同样的操作。结果所有的ping操作均正常,无丢包现象发生。

结论:堆叠存在问题,导致ping有丢包现象发生。

第六次观察:(第二天  上午9:10左右)

网络结构:同问题观察 1

在Unit3内连接PC A(IP为202.199.100.147)。Unit4内连接PC (IP为202.199.100.146),两机互相ping的同时,并且ping Unit1、Unit2交换机上的其他客户机。在ping的过程中,大约在16:25的时候忽然发现Unit3中PC B(202.199.100.147)ping不通任何IP地址,而且交换机灯闪动频率变慢。

用Unit4中的PC B(202.199.100.146)登录交换机Web管理页面(HTTP:202.199.100.145),登录失败;Unit3中的PC A(202.199.100.147)可以登录到交换机管理页面(HTTP:202.199.100.145),Web管理页面中只显示Unit3,看不到其他Unit,同时把One Touch接入Unit 3,One Touch可以ping通交换机地址(202.199.100.145),也可以ping通PC A,但ping不通PC B。

结论:说明Unit 3堆叠已失效,与堆叠中的其他交换机无法通讯。

第七次观察:(第二天  下午4:00)

网络结构: 同上

重复观察6的操作,再次出现上述现象,这时重新启动Unit 3 故障依旧。

第八次观察:(第三天  上午10:30)

3C16980 Unit 1

3C16985B—1 Unit3

3C16985B—2 Unit2

3C169850 Unit4

网络结构:把Unit 2和Unit3堆叠线缆互换,网络工作一切正常,将OneTouch接入Unit 2中,使用OneTouch模拟流量,同时Unit 2、Unit3中的电脑互相ping,,当利用率为63%(1518byte/f,5000f/s)时,无丢包现象发生,利用率为75%(1518byte/f,6000f/s)时有个别丢包现象。直到今天,网络工作依旧一切正常。

排除心得

综合以上观察,可以断定是交换机的堆叠有问题,因为把交换机的堆叠调整后,故障再也没有出现,初步断这是交换机的堆叠线缆没插好引想的,把堆叠电缆进行更换插好,网络工作一切正常。

热词搜索:

上一篇:为何在局域网中无法正常使用QQ、ICQ等通信软件?
下一篇:访问局域网中的电脑时,为什么常常被提示要输入用户名和密码?

分享到: 收藏