2024年3月31日发(作者:)

XXXX网络故障分析报告

1:故障描述

1.1故障现象

2030年7月10日之前,局域网内部网络正常,各个部门及服务器之间都能互访。

① 1月15号开始,网络出现时常网络访问偏慢等状态,并且有时出现丢包现象。

②:平均每周出现2到4天间歇性断网现象,断网的时间一般为10秒到40秒之间,然后,

自动恢复,在此期间,一栋楼与二栋楼之间终端无法与服务器及各个设备之间通讯。

1.2网络拓扑图

XXXXX

的网络拓扑如图所示。从图中可知,客户端访问服务器、访问外网的

链路非常简单。

访问服务器:客户端-> 接入交换机 -> 核心3750 -> 服务器群 -> 存储及数据交换.

访问外网 :客户端-> 接入交换机 -> 核心3750 -> 防火墙-> 路由器->外网.

3com2226

3com4924

服务器

客户端访问服务器

2.现场检查及处理方法

2.1现场检查

1.通过检查网络设备配置及网络当前运行状况,发现先运行的配置未曾被修改,检查连

接交换机及连接交换机的光纤及模块,均未发现问题。

2. 7月20日,在与核心交换机连接的服务器上,安装SolarWinds 监控软件,开启核心

交换机3750上SNMP服务。

3.观察防火墙及监控软件,发现防火墙上的流量灯一直处于高流量状态,并且监控软件

中显示,工作日平均每天的流量在300—700G之间,周末为40—80MB左右。

4.经检查,局域网内架构了云计算机服务器。

2.2故障分析

根据网络拓扑及网络故障现象分析,该局域网内出现间歇性的断网,可能由于以下几

个方面:

1.中间那台3750故障.

2.一楼到二楼连接的光纤线路问题.

3. 由于网络内部架设了云服务器,而局域网设备未进行升级,超过该设备的性能瓶颈,

交换机无法在瞬间处理高流量的数据,丢弃数据包,继而出现间歇性的断网

4. 局域网内存在病毒,局域网内各个客户端受到病毒攻击导致出现间歇性的停网.

2.3处理方法

由于网络内部架设了云服务器,并且通过观察流量监控,局域网内每天都会有300G—

700G 的流量经过这台设备,而该台交换机在网络中处于核心,而中间这台核心4924在整

个网络中充当汇聚层,只做二层数据转发的功能,一旦出现问题,继而会导致整个网络的瘫

痪。

9月12号,使用惠普5608xl 、2960交换机替换中间这台3750,共同分担网络

流量。

根据厂商的分析,局域网内架设云服务器,而网络数据会源源不断的直接或者间接的经

过中间核心交换机,转发给防火墙,又经过交换机传送至服务器、外网,核心交换机转发数

据流量过高,超过该交换机的性能,导致断网。

2.4更换之后

替换3750之后,未出现之前现象,经分析、判断:

1.网络流量过大,cpu处理的报文增多,造成cpu过高,console短暂的没有反应也是有

可能的.

2.设备只是做二层转发,网络流量比较大,建议采用性能更高的交换机担任汇聚层交换

机 .

3.网络内部假设云服务器,而硬件未得到及时的升级,流量过高、服务要求过高,都有

可能会造成这种现象.

4.网络内部的流量都流向中间的核心3750,超过核心3750的处理能力,导致短

暂性的丢弃数据包,缓解cpu处理报文的时间,建议更换核心层的3750交换机.

3.更换建议

由于局域网内的服务要求超过核心交换机的性能瓶颈,而局域网内又采用云服务,建议

采用性能更好的交换机做此局域网内的核心层,以满足局域网内服务需求,并对局域网内进

行杀毒处理.

/253/

/About_H3C/Company_Publication/IP_Lh/2011/04/Home/Catalog/201108/7

23246_30008_

/about_h3c/company_publication/ip_lh/2011/04/home/catalog/201

108/723251_30008_

/about_h3c/company_publication/ip_lh/2011/04/home/catalog/201

108/723252_30008_