
作者: 孙飞燕
摘要: 对于负责维护重要任务的网络管理员来说,在网络环境出现故障时及时定位和解决故障并快速恢复网络运行非常重要. 本文探讨了通过OS1分层结构系统进行网络故障检测的常用方法和步骤.
关键字: 网络故障OSl分层解决方案恢复

随着社会越来越依赖于信息资源,作为用于传输信息的网络,其可靠性,稳定性和安全性也变得越来越重要. 当网络出现故障时,这意味着该网络在一定时间内无法使用. 在某些情况下,这也意味着灾难的来临和巨大的经济损失. 对于负责维护重要任务的网络管理员,当网络环境中发生故障时,应及时定位并解决故障. 快速恢复网络运行非常重要. 诊断网络故障的过程应从沿着OSI七层模型的物理层开始. 首先检查物理层,然后检查数据链路层,依此类推,尝试确定通信失败的故障点,直到系统通信正常为止. 网络诊断可以使用各种工具,包括LAN或WAN分析器,路由器诊断命令,网络管理工具以及其他故障排除工具. 我们通常使用一个或多个命令来收集相应的信息,在给定的情况下,确定要使用哪个命令来获取所需的信息.
1. 网络故障分级诊断技术
(1)物理层和诊断: 物理层是OS1层次结构系统中最基本的层. 它建立在通信媒体的基础上,实现了系统与通信媒体的物理接口. 它们之间的透明传输为建立,维护和拆除计算机与网络之间的物理连接提供了服务. 物理层的故障主要表现在设备的物理连接方式是否正确. 连接电缆是否正确;调制解调器,CSU / DSU和其他设备的配置和操作是否正确. 确定路由器端口物理连接是否完好的最佳方法是使用show interface命令检查每个端口的状态,解释屏幕输出信息以及查看端口状态,协议建立状态和EIA状态.

(2)数据链路层及其诊断: 数据链路层的主要任务是使网络层能够在不了解物理层特性的情况下获得可靠的传输. 数据链路层用于通过链路层打包,解包数据,错误检测和某些纠正功能,以及协调共享媒体. 在数据链路层交换数据之前,该协议专注于形成帧和同步设备. 为了发现并消除数据链路层故障,需要检查路由器的配置,并检查共享同一数据链路层的连接端口的封装. 每对接口必须与与其通信的其他设备具有相同的封装. 通过查看路由器的配置来检查路由器的封装,或者使用show命令查看相应接口的封装.
(3)网络层及其诊断: 网络层提供了在网络层建立,维护和释放连接的方法,包括路由,流控制网络故障排除方法,传输确认,中断,错误和故障恢复. 解决网络层问题的基本方法是遵循从源到目的地的路径,检查路由器路由表,并检查路由器接口的IP地址. 如果路由未出现在路由表中,则应检查以确定是否已输入适当的静态路由,默认路由或动态路由. 然后,手动配置一些丢失的路由,或者消除动态路由过程中的某些故障,包括RIP或IGRP路由协议故障. 例如,对于IGRP路由信息,仅在具有相同自治系统编号(AS)的系统之间交换数据,并检查由路由器配置的自治系统编号的匹配情况.
2. 网络故障检测中常用的方法和步骤

步骤1: 全面收集信息并分析故障现象. 请操作员描述正常操作期间的情况并演示故障. 如果可能,请亲自核实问题. 看看是否缺少正常功能,或者是否有异常反应?在发生故障之前,检查节点或网络是否已更改. 运营商通常不理解更改与网络无关的内容可能会导致失败,例如重新安装软件和安装新的适配器卡.
第2步: 找到故障范围. 确认故障后,收集所有可能的信息并进行分析. 将故障范围缩小到网段或节点. 根据所做的分析,确定故障是与网段有关还是仅限于节点. 缩小故障范围是解决方案的开始. 确定故障是否仅限于节点或网络设备. 如果故障影响多个节点,请尝试减少总线拓扑中的网段,或尝试以最小的环形或星形拓扑重建网络以进行故障诊断.
第3步: 故障隔离. 如果故障影响整个网络段,请通过减少可能的故障源来隔离故障. 除两个节点外,断开所有其他节点的连接. 如果两个节点可以正常通信,请添加其他节点. 如果两个节点无法通信,则必须检查物理层的相关部分,例如电缆的连接器,电缆本身或与其连接的集线器和网卡. 其次,如果故障可以隔离到某个节点,则可以更换网卡,使用性能良好的网卡驱动程序,但不要使用该节点的现有网络软件或配置文件,也可以不使用新电缆连接到网络. 如果网络连接没有问题,则检查仅一个应用程序是否存在问题. 使用相同的驱动器或文件系统来运行其他应用程序. 将配置与其他节点进行比较,然后试用该应用程序(也不要使用现有的软件或配置文件). 如果只有一个用户有问题,请检查涉及该节点的网络安全系统. 检查是否更改了网络安全系统以影响用户.

第4步: 解决问题. 一旦确定了故障源,就可以更容易地确定故障类型. 对于网络硬件设备,最方便的措施是简单地更换它,然后对损坏的部分进行修复. 对于软件故障. 重新安装有问题的软件,删除可能有问题的文件网络故障排除方法,并确保您拥有所有必需的文件.
步骤5: 检查故障是否消除. 要求操作员测试故障是否仍然存在,这可以确保消除了整个故障. 只是简单地要求用户以正常方式操作相关的网络设备,同时要求用户快速执行其他几种正常操作. 有时在一个地方解决问题会在其他地方导致问题;有时问题可以解决,但可能掩盖其他故障.
在排除网络故障时,以下提示很有用: ①不要忽略明显的事情. 松散的网络电缆是非常普遍的问题. 检查插头,连接器,电缆,集线器和开关. 小事情会引起大问题. ②大多数问题是由人为因素(错误)引起的. 通过提供网络配置和功能信息或提供该领域的培训,可以消除大多数错误. ③注意解决问题的方法. 每次测试期间收集的信息均应用于指导测试. 如果不能保证选择的原始测试环境,则不应基于主观假设将其转移到另一个测试环境. ④应该敞开心mind,保持灵活. 不要认为问题的根源太多,也不要认为在应用程序级别发现的问题不是由下一级别引起的. 有些人总是认为网络有故障,而另一些人总是认为远程存在问题. 有些人非常确定自己知道问题的原因,所以他们不在乎测试的结果. 不要重复这些错误,不要测试所有可能的情况,并根据测试结果决定采取的措施.
简而言之,网络故障诊断基于对网络原理,网络配置和网络操作的了解. 从故障现象开始,使用网络诊断工具获取诊断信息,确定网络故障点,查找问题根源,消除故障并恢复网络的正常运行.
参考文献:
[1]蔡立军. 计算机网络安全技术. 中国水利水电出版社,2005.
[2]周凯. 广域网技术的应用. 重庆大学出版社,2005.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-222835-1.html
IT产业产生之前