重庆电力公司信息网系统维护案例
2004-08-09       中国计算机报
打印自: 安恒公司
地址: HTTP://tftpd.anheng.com.cn/news/article.php?articleid=365
重庆电力公司信息网系统维护案例

 
Fluke ONAS网络分析方案

传统的网络维护工具不能提供最优的网络透视

传统的工具包只包括网络管理软件和协议分析仪。网络管理软件为基于路由的网络而设计,他们除了提供低级的交换网段的信息之外,主要是关注两个路由网络之间的连接问题。但一旦出现故障,NMS未必可以提供足够的数据和报警(很多情况下未必适合故障诊断检测,但对网络运行监控依然有用)。协议分析仪是为共享介质的网络设计的,包括整个冲突域的问题。但是当遇到了交换网络的时候,协议分析仪无法跨越交换机端口对每个网段进行实时监控。导致其功能大大受到影响。

创新的网络维护工具包

当代网络维护工具包应该包括三部分网络分析技术:

1.数据捕捉 (协议捕捉和分析)

  • 提供对数据包的捕获,解码和专家分析
  • 对应用问题提供本质上的分析

2.统计分析 (RMON 探头和软件)

  • 搜集和分析监测期间的网络应用信息
  • 对用户的应用、网络的通讯状况、各网络的流量状况等进行实时监控和报警
  • 提供趋势、报警和生成报告文档

3.网络搜寻(现网管系统对交换网络不够深入)

  • 提供目录、映射和路径分析
  • 提供交换式和带路由的网络、用户和安全性等方面的信息
  • 对网络设备的更改进行记录和报警

组合和集成这三种网络分析技术造就了OptiView网络综合协议分析仪的超级能力。

ONAS测试方案在重庆电力公司的部署

1)中心局域网维护PSVS

2)分局局域网维护WGA或1T(硬件)、AGENT(软件)

3)广域网维护OPV-WAN

4)其部署方案如图

重庆市电力公司2004年信息网络拓扑图

福禄克公司网络的集中统一管理,主要是通过OptiView Console控制台软件(OVC)实现的。该控制软件是福禄克公司提倡的全面集成、全面控制的网络超级透视(SuperVision)的核心。OptiView Console控制台软件将任一连接在网络中的OptiView集成式网络分析仪、分布式分析仪、广域网分析仪和其它网络监测解决方案的结果集成在一起,以独立、完整的方式来透视用户的网络。全面实时地透视整个企业网的动态、提供拓扑变化、错误和告警的信息。

ONAS测试管理方案是全局规划、分布实施的网络分析解决方案,由于OPV硬件的测试是全自动完成的,也提供了网管人员远程登录操作的能力,所以OPV最好安装在省局的核心交换设备上。OPV-CONSOLE/AGENT的部署是整个网络分析方案中最为关键的,重庆电力公司将CONSOLE-VIEW安装在网管机上和需要进行网络管理分析的工程师的笔记本中,他们可以在网络中任何位置快速的通过CONSOLE-VIE调用任意一个AGENT来做全网性能分析和管理。AGENT可以是硬件,如WGA、1T,也可以是FLUKE提供的免费的AGENT软件,PE可以安装在网管中心的网管机器和每个工程师的笔记本上,用做详细的协议分析和应用分析。AGENT作为本地或者远程的数据采集器,可以安装在各个县局。

电力公司的网管机可以作为整个分布式网络分析系统的监控中心,网管可以根据需求随时调用本地或者分局的任意AGENT或者是市公司的OPV-INA,分析和读取该网络的运行数据,数据采集设备在本地进行实时监控,从IP设备的运行,到交换机、路由器等支持SNMP设备的端口的追踪记录,到本地SNMP TRAP、RMON EVENT。

ONAS方案在重庆电力公司的应用

管理及故障诊断方法

1、重庆电力公司网络管理层面剖析:

基础运行管理层面:基于电力系统网络运行的特点,网络基础设施运行管理的基本内容为: (1)实时监控各部门及县网络基础设施的运行状况;(2)实现全局故障、运行状况的展示、分析报告;(3)收集并建立市局中心网络运行性能指标及其设备配置信息;(4)可实现对远程网络状况的快速分析和管理; (5)建立市中心网络基础运行基准统计报告;(6)提供满足从业务角度分析网络状况的能力。

设备的管理层面:主要的功能是面向重庆包括各分局网络的网络设备,例如路由器、交换机、服务器等核心设备的配置、管理、端口运行监测和实时数据的分析。

协议管理层面:通过协议管理功能,我们的网管应该了解到本网络在运行的时候,各种协议的分布情况,网络中哪些协议是关键的、必须的,哪些协议可以通过网络人员对应用的调整优化其带宽占用率,以及每种应用的最优化调整。更为关键的是通过对协议的深层分析,可以判定网络上的各类应用层的性能:例如应用响应反馈时间、HTTP的应用延迟时间等等。

流量监测层面:主要的功能是面向链路,面向网络的传输,实时监测整个网络上各个网段的实时的带宽占用率,以及广播、组播、错误、碰撞等数据帧所占用的网络带宽,还可实现对各分局到市之间的ATM线路的实时监测、触发报警、智能监管等功能。我们建议每个网络管理人员一定要建立自己所管理的网段的流量基准图,因为只有掌握了网络的基准流量,才有依据来判断是否有突发流量产生。

用户管理层面:用户管理往往是网络管理人员最为头疼的管理工作,我们也发现在实际网络测试的过程中,60%的故障是由于用户的非法操作,越权限操作或者是无意识的大流量应用所造成的。在用户管理层面我们关心的是用户的状态、应用以及流量情况,能够实时管理到用户的IP、MAC、GATEWAY、DNS等信息,并且对于所有的变更和错误进行统计记录和报警,这样的管理应该针对每个网管自己所负责的权限,并且将市及各县的关键设备(路由器、交换机、服务器等)实时监控起来。

网络故障诊断层面:故障诊断和快速定位功能是FLUKE网络分析方案的最大价值之一,FLUKE方案设计的出发点就是简单,快速,准确,并且提供用户故障诊断的方法和手段。可以检测物理线路、常见网络故障、应用系统故障、故障设备的端口定位。

2、重庆市电力公司管理配置说明:

需要市局将需要管理的交换机的SNMP的READ ONLY功能打开,若有支持RMON的模块,请将RMON设置ENABLE,并且将SNMP和RMON的通讯字在INA和CONSOLE-SERVICE MANAGER中添加进去。

在CONSOLE的TRENDING功能中选择该设备,勾选需要做历史流量统计的端口。CONSOLE会自动对所有需要TRENGDING的端口进行历史流量统计(利用率、广播、错误、碰撞),并给出统计曲线(1小时、3小时、6小时、12小时、24小时、7天)。

在CONSOLE-VIEW中安装并找到各个VLAN以及分局所安装的AGENT,设置好报警阀值和错误报警类型等参数,可以实现在市电力公司对全市及各县网络性能的管理和监控。

3、基层单位管理配置说明:

WGA(分布式网络分析仪)、1T(网络故障一点通)为配给各分局的一线网络维护与故障诊断工具,用于解决各县局及其下属单位网络一线维护和网络故障诊断的需求,并向上级单位提供数据,1T可作为支持SNMP的数据采集设备,WGA则增加了RMONⅠ、RMONⅡ的数据设备,并可将所捕获的数据包传往中心。

希望FLUKE 的网络分析方案能让用户的网络管理工作变得更加得心应手,也希望FLUKE能让用户看清楚自己的网络结构和状况。在网络管理、维护、故障诊断、应用分析等各相关方面成为用户首选的最佳工具。

 

责任编辑: admin