
传输网络是网络通信的基础,并为各种通信服务提供了传输通道. 传输网络的质量对未来的业务发展有着深远的影响. 本文主要介绍如何测量传输网络的可用性以及如何提高传输网络的可用性.
I. 网络可用性指标的定义
平均故障间隔时间: MTBF(平均故障间隔时间),即系统在指定条件下和指定时间内的累计运行时间与故障次数之比.
平均维修时间: MTTR(平均维修时间),即在指定条件下和指定时间内,产品处于任何指定的维护级别,总维修时间与该级别的已维修产品的比率总数的失败.
可用性: (可用性)是指可修复产品在指定条件和时间内保持其指定功能的能力. 它全面反映了可靠性和可维护性. 计算方法: 产品的工作时间与工作时间和工作时间之比. 例如: A = MTBF /(MTBF + MTTR).
年度停机时间: DT(停机时间),在一年之内,该产品由于故障维护而无法运行的总时间. 停机时间与可用性之间的转换关系: 年度停机时间=(1-A)×8760×60(分钟).
通常指产品的可用性,包括可靠性和可维护性. 可靠性通过MTBF度量,可修复性通过MTTR度量,可用性通过可用性A度量.
第二,网络可用性的相关因素分析
评估和建设高可用性网络是一项庞大的系统项目,需要对设备可靠性,网络媒体可靠性,网络拓扑,设备运行环境,管理和服务进行全面分析和改进. 通常可靠性分析,确定网络模型后,影响整个网络可用性的几个主要因素如图1所示.
网络可靠性的影响因素大致可分为:
(1)传输介质因素: 光纤,光纤连接器,电缆等;

(2)设备因素: 硬件板故障,软件故障等;
(3)网络设计因素: 总体网络规划,网络解决方案等;
(4)电网和运行环境因素: 电网可用性,设备运行环境等;
(5)备件,维护和服务因素: 备件策略,操作员培训,网络维护,客户服务;
(6)其他不可抗力因素: 地震,战争,洪水等.
三,网络可用性的提高
通过前面的简短介绍,我们可以看到影响网络可用性的因素很多,因此在实际分析中,我们应该从多个方面入手,掌握最重要的因素,并在网络可用性和建设成本之间找到平衡.
1. 提高传输介质的可靠性
对于端到端电路,传输介质对可用性的影响最大. 传输介质包括光纤,光纤连接器,电缆,电缆连接器和其他传输线.
实际上,传输介质(尤其是光纤)的可靠性远远低于设备的可靠性. 通常认为,光纤故障率与传输距离成正比. GR-418标准提供的光纤可靠性指标为400 FITs / km,相当于每285 km的年平均故障率. 根据在互联网上公布的外国运营商的数据,2003年的光纤故障率为422 FITs / km,平均光纤修复时间为13小时. 可以看出,光纤的故障率高,维护时间长. 在传输介质中,除了光纤之外,光纤连接器也容易失效,并且由于连接器松动,灰尘和连接错误,光纤连接经常失败.
与光纤相比,电缆和电缆连接器比光纤指示器差,并且更容易受到人类的影响. 电缆通常集中在传输网络的服务登陆侧,但是随着光端换机和路由器的出现,传输电缆的数量逐渐减少. 一些咨询公司和运营商的统计数据表明,对于端到端电路,光纤故障通常占网络故障的很大一部分,其中大多数超过整个网络故障的50%,有的甚至超过80%. %以上. 因此,提高网络可用性的首要考虑是提高传输介质的基本可靠性.

以下是改善光纤和其他传输介质的一些建议:
(1)减少光纤和连接器的故障,并控制采购质量;
(2)减少光缆保护的盲点,例如采取保护措施,例如在接入层形成环路,并在建筑物管道中进行双重布线;
(3)控制人为因素导致的传输介质故障(例如挖掘和其他人为损坏);
(4)局内采取了各种控制措施: 有效保护室内光缆,正确识别光缆/光缆,改善插拔光纤/光缆的标准化,合理部署室内尾纤;
(5)建立快速维护响应团队,以减少光纤故障后的维修时间.
2. 提高设备的基本可靠性
除光纤外,设备也是影响网络基本可靠性的主要因素. 设备的硬件和软件都可能发生故障. 对于不同的通信设备,硬件和软件故障的比例是不同的. 一般来说,传输设备的硬件故障率高于软件故障率,而路由器设备的软件故障率高于硬件故障率. 根据GR-418提供的数据,传输设备的软硬件故障率为1: 3.
硬件故障与许多因素有关,最重要的是设备的基本故障. 可以根据相应的标准(GJB299,TR-332)根据温度,静电影响,环境等估算设备故障率. 除了设备的基本故障外,还有其他间接影响设备故障的原因,例如硬件设计,制造,过程,环境,EMC等.
软件故障是由于软件设计过于复杂,对异常情况的考虑不完善以及软件错误引起的. 通常,通过CMM流程的质量控制以及软件可靠性的测量,分析和测试来确保软件可靠性. 除单板故障外,软件故障还可能导致系统或整个网络故障. 此外,软件故障通常会产生很大的影响,而且故障很难定位.
由于上述因素的影响,设备制造商需要在设备生产过程中通过各种设计过程,质量保证过程,闭环和其他措施来确保设备的可靠性. 华为提高设备可靠性的主要保障措施主要体现在: 通过全面的集成产品开发流程确保设备软硬件设计的可靠性;通过系统可靠性设计并充分考虑网络解决方案来优化系统结构;通过全面的采购控制,设计规范和其他规范,以确保设备的可靠性和应用;提供闭环问题处理和跟踪流程,以确保及时解决和跟踪问题;通过FIT测试可靠性分析,老化测试,环境测试,HALT测试等确保设备可靠性;在设计中全面考虑故障检测,隔离和恢复的设计,以提高设备的故障管理能力;通过CMM流程确保软件开发规范,并通过软件测量,分析和FIT测试确保软件可靠性;考虑支持计划的升级,补丁,扩展和其他功能的设备;对关键组件采用1 +1保护,以提高设备的可靠性,例如交叉板1 +1,电源访问模块1 +1等. 因此,设备制造商的实际研发能力和完善的可靠性保证过程也应运营商在购买设备时要考虑的重要因素.

四,优化网络拓扑
随着客户需求的变化,传输技术的发展以及市场竞争的加剧,传输网络将从SDH逐步发展为ASON,网络保护将从1 +1保护逐步发展为MESH网络保护. 到那时,网络设计已不再像将几个简单的设备连接在一起形成一个网络那样简单,而是需要根据实际的网络结构和当前状态提供一种低成本,高可用性和高利用率的解决方案.
由于光纤介质的故障在整个网络中影响最大,因此,首先应对光纤传输距离较长的网络(例如MSP,SNCP,MESH等)进行网络保护. 除了保护光纤免于故障之外,还必须考虑在具有高功率损耗潜力的站点上增加节点保护. 对于具有高可靠性要求的网络,可以考虑MESH网络保护. 以下提供了几种联网方法来增强网络可用性.
(1)增强网络保护功能,以减少光纤和节点故障的影响;
(2)在重要业务节点之间使用1 + 1 MSP链保护;
(3)采用小环加小环组网的方法代替大环网,以减少光纤故障的影响;
(4)减少传输路径的长度和传输节点的数量,并用大容量设备代替背对背交换.
简而言之,网络设计需要对网络的运行环境,网络定位和不同的客户需求进行全面分析,以提供满足客户需求的解决方案.
五,改善电网设备运行环境
环境因素的影响包括很多方面,最重要的是电网的环境因素. 这一点在中国尤为严重. 一些运营商的统计数据表明,在某些供电条件较差的本地网络中(例如,使用农村电力且计算机房中没有电池),断电占所有事故的50%以上,而某些地区甚至更多高. 而且,电网故障通常会导致整个设备断电,甚至导致整个站点或机房中所有设备的故障. 除了直接导致网络节点故障的电网事故外,还有其他直接导致设备故障的原因,例如火灾,地震,台风,洪水和其他不可抗拒的因素.
其他环境因素通常是指环境温度,湿度,盐雾,灰尘等. 这些因素将间接并逐渐影响设备的可靠性,例如缩短设备的使用寿命,从而导致设备的增加故障率,并加速设备腐蚀.

以下是针对环境因素提供的改进方法:
(1)通过为设备配备备用电源,例如电池,石油发动机等,以减少由于设备电源故障而导致的节点故障;
(2)通过优化网络方法(例如添加备份节点),不应将相互备份的重要站点放置在同一计算机房中,等等;
(3)为重要节点提供空调环境;
(4)通过环境转变来减少高温高湿,盐雾粉尘和腐蚀性气体对设备的影响.
六. 提高备件,维护和服务水平
构建网络时,必须配备相应的备件. 备件的质量和备件策略直接影响最终板故障后的维修时间. 备件越靠近故障点,故障的维修时间越短,网络的可用性就越高. 但是,如果备件库存太大,则会增加库存成本. 需要根据实际情况确定备件的更换率,周转时间,备件成本等因素,综合分析确定备件策略.
异常的维护操作是导致设备故障的主要原因. 异常的维护操作包括因不正确的操作程序而导致的直接事故,由于维护人员未及时维护而导致的事故以及因转换和扩展而导致的业务中断.
服务水平是反映设备供应商全面功能的重要因素. 服务质量直接影响网络的可靠运行. 例如,定期检查设备,快速响应用户需求,快速定位和及时处理设备问题以及定期进行培训和与客户沟通都可以间接提高网络可用性.
以下是备件,维护,服务等方面的改进措施.
(1)优化维护系统,建立快速响应的维护团队,并减少业务中断时间. 包括设备和传输介质的维护;
(2)通过改善维护团队的分布和技术水平,增加维护人员的技术和过程培训,从而减少操作事故并减少故障定位时间;
(3)制定完整的备件策略以减少备件的响应时间;
(4)购买设备时要考虑设备制造商提供的服务水平;
(5)增加计划维护并减少潜在故障的发生.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-220434-1.html
可采取撞击战术对付美军舰的风声起了作用
请答复