无标题文档
| 关于我们 | 品牌管理 | 广告服务 | 公关顾问 | 活动服务 | 联系我们 |
站内
您现在的位置: 网络通信中国 >> 技术与应用 >> VoIP技术和标准 >> 高级技术 >> 技术应用正文
基于网络分析的故障检测

[2009-8-20 9:07:41] 关键词: 深海捷,呼叫中心

www.voipchina.cn
摘  要: 在对网络的管理和维护过程中,我们可能经常会遇到网络传输延迟导致上网连接时断时续或者出现上网速度异常缓慢的故障现象,并且,可能是一会正常,一会不正常,对于这类故障,相信是网络管理中比较难于判断和处理的。

  基于网络分析的故障检测

  前言

  在对网络的管理和维护过程中,我们可能经常会遇到网络传输延迟导致上网连接时断时续或者出现上网速度异常缓慢的故障现象,并且,可能是一会正常,一会不正常,对于这类故障,相信是网络管理中比较难于判断和处理的。在对这类故障的处理中,通常的做法首先是采用ping测试,ping网关、DNS或者外网IP的时候,几乎都会出现丢包或较大延迟的现象。那么,我们该如何准确、有效及快速的解决这类网络故障现象?以下是我自己在遇到此类故障时的一些解决方法和一点心得,希望和广大网管共同分享!

  故障回放

  我们单位是一家以机械为主的制造企业,规模不大,局域网的只有近100台计算机,都同时接入到了互联网,网络结构也比较简单,外网进来接的是侠诺路由器,路由器下接的是侠诺三层交换机,在交换机上做了VLAN划分,192.168.0.0/24为服务器群,其中,192.168.0.3同时提供DHCP、DNS以及AD域控服务,其他的VLAN有192.168.10.0/24、192.168.20.0/24等共5个VLAN,局域网网络运行一直比较稳定。由于最近网络做了改造,采用了双WAN口访问,所以重新配置了路由器,网络产生了一些异常故障,具体现象为:某VLAN内的主机突然发生网络传输中断故障,不能连接192.168.0.3服务器,但是一段时间后(几分钟或几小时)又自动恢复正常,产生这种故障的主机不确定是某一台,偶尔是这台,偶尔又是另外一台,在故障发生的时候,ping服务器192.168.0.3,均能够ping通IP地址,但却不能ping通域名,检查DNS服务器,未发现任何错误。

  故障排查

  经过分析,初步认为该故障多半与广播风暴、网络病毒攻击等因素有关。为了进一步查找和定位故障原因,于是将笔记本连接到交换机上镜像端口,并运行科来网络分析系统来捕获网络的数据包通讯,希望能够借此快速的查明原因。
     大约2分钟后,停止捕获,现在对捕获的数据包进行详细的分析,具体分析如下:
首先,通过科来的概要统计来看,网络的流量、广播流量、数据包大小分布以及TCP连接的信息均没有发现异常,随后,在诊断视图下看到,发生的网络事件全是ICMP主机重定向,达到了1771次,如下图1:


  查看这个事件的参考信息:“路由器向源主机发送一个主机重定向报文通知源主机有一条到达目的主机的更好的路由”。因此,从诊断视图的ICMP主机重定向,我们得到了一个重要的提示:网络中可能存在环路。再来到数据包视图,可以详细的查看到产生该问题的原因。打开数据包视图,数据包的概要统计如下图2所示:

  
 
  选择第1和第2个数据包,其详细的解码如下图3所示:

  从该数据包的解码中,可以看出,这是一个ICMP重定向数据包,大概的意思是:路由器192.168.0.10告诉192.168.0.3应该去访问192.168.0.254,这才是一个更好的路径。查看该ICMP数据包携带的数据,这个数据包是由192.168.21.172在访问192.168.0.3时造成的。
继续往下看,这是第3个数据包的详细解码,只有一个字段发生了变化,就是生存时间(TTL),我们都知道,一个IP数据包每经过一个路由,其TTL就会减1,当TTL为0时还没有到达目的主机,则该数据包将被丢弃,从下图4看到,该数据包的TTL值从第1个数据包的12变成了第3个数据包的10,已经呈递减的趋势。图4:

  继续看第4、第5以及后面的数据包,TTL值一直在递减,直到第13、14个数据包时,TTL值为0,显示超时。所以,从第1个数据包到第14个包,ICMP数据包里面的IP报头的TTL值不断递减,直到TTL超时,因此,明显是网络中产生了环路才会造成这种现象。而从数据包地址来看,产生ICMP重定向的地址全是192.168.21网段的主机IP,可能是在抓包的同时,正好是这个网段的主机与192.168.0.3通讯时产生了该事件。
至此,通过对科来网络通讯分析系统捕获的数据通讯分析,我们已经可以确定,前面出现的故障现象肯定是有环路引起的,而结合前面配置路由表信息,终于找到了原因所在:原来是在配置路由表的时候,考虑不周到,由于在路由器添加了路由条目:192.168.0.0/16 下一条 0.254 ,而在254上的路由条目却没找到21网段的匹配项,于是发给默认路由192.168.0.10,而默认路由又去查找下一跳:192.168.0.254,从而造成了环路。重新配置路由表后,改问题得到解决。

     其实,造成网络数据丢包现象的因素有很多,除了路由环路外,蠕虫病毒造成的攻击行为:如ICMP扫描攻击、TCP扫描攻击等都会造成类似的问题,在遇到这些问题时,如果采用常规的一些解决方法,可能会消耗太多的时间与精力,通过网络分析的检测手段,往往能够起到事半功倍的效果。所以,如果大家以后遇到类似的网络故障时,不妨使用网络分析的检测手段,一定能够快速的解决故障,希望这篇文章能给大家带来一些启发。

  科来咨询热线:400—6869—069

  科来网络通讯分析系统技术交流版免费下载:
  http://www.colasoft.com.cn/download/capsa.php

《中国IP融合通信应用案例大全》——免费征稿通知!

项目需求信息登记表(对此感兴趣请留言)
*姓 名: 采购 代理 合作 咨询
*电 话: 联系厂商 联系经销商
*EMail:
传 真:
*手 机:
*公 司:
职 务:
城 市:    
[责任编辑:荔枝]   来源:网络通信中国网   进入论坛   

网络通信中国服务中心                   ·全国贵宾服务专线:4006 312 213

我要投放广告:网络通信中国目前是中国最大的信息通信媒体平台垂直IP通信门户站点     查看案例
我要参加活动:我们将针对发展趋势热点与行业应用全年10多场次会议供您选择        我要参加
我要稿件营销:我们拥有上千家媒体资源,可以为企业提供全方位公关顾问服务        查看案例
我要设计创意:企业VI视觉识别、活动展会创意设计、企业宣传册设计制作          查看案例
我要翻译服务:企业新闻稿、产品手册中英文互译以及活动现场中英文口译          查看案例
我要采购产品:全球最大IP语音产品分销平台www.ebuyvoip.com协助您产品销售      查看案例
我要咨询专家:拥有通信界、政府信息化、企业信息化、行业信息化权威专家及学者资源为您提供专家营销
评论主题:基于网络分析的故障检测发表评论:(Html:禁止,UBB:允许)【查看关于本文所有评论】
笔名
请您注意:遵守国家有关法律、法规,尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任。拥有管理笔名和留言的一切权利。
通信图片
 

NGN QoS 探讨

IP数据报的分片与重组…

基于3GPP R7 HSPA的Vo…

浅谈用Asterisk构建企…
请填写E-mail   详细订阅    电子杂志回顾
《中国IP融合通信应用案例大全》——免费征稿通知!
Copyright©2003-2009 网络通信中国(原VoIP中国) 版权所有
全国服务电话:010-69397252  4006-312-213
京ICP证05067673号