1、绪论
1.1 课题的背景及意义
以北京局铁路供电调度台远动运用维护为例,问题主要表现在以下三点:
1、运维单位较多,责任难以划分。北京局牵引供电远动系统由局供电调度使用,系统维护是由远动班和厂家共同维护,通道是由通信段进行维护,而终端则是由各个供电段的变电值班员进行维护。一旦出现故障,故障责任难以划分,容易出现相互推脱的情况,耽误故障处理。


2、设备节点众多,故障点难以查找。牵引供电系统从调度端、通道到终端,交换机、路由器、服务器、防火墙等网络设备众多,一旦出现故障,故障点难以查找。
3、设备操作方式不同。远动系统中网络设备、服务器、系统设备都来自不同的生产厂商,每个品牌都提供一套管理接口及和管理方式是不太现实的,命令行、操作界面等不一样都将使远动系统、网络管理变得越来越复杂。
4、运维人员计算机水平有待提高。远动系统的应用维护人员多为牵引供电的专业技术人员,计算机水平有限,面对庞大的远动系统出现的问题难以掌控。
......
......
1.2 课题的研究内容
系统将 SNMP 引入牵引供电系统信息设备的维护工作当中,建立牵引供电远动系统信息设备监控系统。系统将实现交换机、路由器、服务器等网络设备的状态进行监控。可对其每个端口的流量、端口数据包数、错误信息、内存、运行状态等各个方面进行监控,并可根据需要设定系统的报警策略。
1、收集进期远动系统维护及故障处理的各种数据,分析所要监控的各项指标;
2、根据故障资料分析,重点列出所监控的方面并分析其故障阀值;
3、根据计算阀值建立轮巡和报警机制;
4、根据 SNMP 协议特点建立、开发牵引供电远动系统信息设备监控系统,完善数据库并实现其功能;
5、根据系统的开发过程及设计理念,撰写论文。
......
......
2、SNMP 网络管理体系结构
2.1 SNMP 基本介绍
随着网络规模的不断增大,网络设备的数量成倍增长,且随着远动程序的不断复杂,不同设备不同厂家的标准和要求也不一样,随着网络的管理变得越来越复杂,SNMP 利用信息库标准来解决问题,它覆盖了协议、服务和管理并且提供了监管计算机系统和网络的方法。SNMP 的前身为网关监控协议(SGMP),最早开始于 20 世纪 70 年代,随后,在逐渐完善的过程中加入了符合 Internet 定义的 SMI 和 MIB 体系结构。SNMP 属 TCP/IP 家族的第七层应用层协议,使用面向无连接的数据传输模式,资源占用量较小,可应用范围较小,且被各大互联网设备厂家所支持,成功应用于路由器、交换机、服务器、工作站、打印机和各种软件服务也都提供了对 SNMP 的支持,使 SNMP 成为了实际应用中网络管理的标准。
......
......
2.2 网络管理系统架构
1、网络工作站(NMS,Network Manager Station)
NMS 是整个网络中的实际管理者,其功能是利用 SNMP 协议对整个网络中的各种交换设备、信息系统和设备进行管理和监视,并且使其进程与被各种被管理的进程信息进行交互。NMS 可以是某个设备中执行管理功能的一个应用程序,也可以是专门用来进行网络、系统管理的一台服务器。NMS 向客户端的 Agent 发出请求,请求中包含了查询、修改各种具体的参数值。与此同时,NMS 还可以接收来自于客户端 Agent 的主动发送的 Trap 信息,这样一来,系统就获取了被管理设备(系统设备、网络设备)当前的各种状态。NMS 上所承载的网管软件一般可以以图表直观的向网络管理员显示各种数据,并可以对其中的一些网络事件和状态进行智能分析。
2、网管代理(Agent)
Agent 是网络设备中的一个应用模块,是运行在被管设备上的代理软件。他的作用是维护被管理设备的信息数据,同时响应 NMS 的请求,并把管理数据收集起来汇报给发送请求的 NMS,其中包括系统参数,网络状态等各种信息,此外,当设备发生故障或其它事件时,Agent 还有主动发现被管设备的异常情况并向 NMS 报告的功能。
3、管理信息库(MIB,Management Information Base)
MIB 是由被管对象及其属性组成的虚拟数据库,网络管理者可以通过代理软件对 MIB进行管理。其具体情况将在本文的 2.3.2 节进行具体阐述。SNMP 协议是基于 ISO 第七层的协议,用到的传输层服务却是无连接的 UDP 协议,所以 SNMP 的网络资源占有量降低,减轻了网络负担,但其中仍有不到达等不确定性,因此由轮巡机制和事件驱动机制两种机制来保证其正确性。
......
......
3、远动信息设备监测系统设计研究......................................... 10
3.1 电气化铁路远动系统.................................................. 10
3.1.1 电气化铁路远动系统概况............................................ 10
3.1.2 系统构成.......................................................... 10
4、远动信息设备监控系统功能.............................................. 19
4.1 设备管理........................................................... 19
4.1.1 对象自动发现.................................................... 19
4.1.2 设备的查询...................................................... 19
5、结束语............................................................ 31
4、远动信息设备监控系统功能
4.1 设备管理
4.1.1 对象自动发现
远动信息设备监测系统通过 SNMP 和内部 Agent 接口自动发现在远动系统内开放了SNMP 接口或者安装了 Agent 的管理对象(如调度机、路由器,交换机,服务器,复示机、中间件等)。并通过图形的方式自动生成 IP 拓扑视图,根据其发现的设备类型,通过 SMNP Get 方式,或代理方式采集被监测网络节点的配置信息。系统将在“设备视图”中创建相应的自动发现设备对象。这些设备对象同时成为“设备管理”的对象。在执行自动发现操作时,维护人员可以根据管理的需要确定资源发现的范围,如指定远动系统内相关的 IP 网段或者一个具体的变电所 IP 地址,从而提高自动发现过程的效率,实现有目标的管理。
4.1.2 设备的查询
管理系统提供丰富的设备查询角度。可以按照远动系统中的设备的类型、设备名称、系统关键字等不同方式从系统中查询任意被管理对象,能够满足调度人员,远动维护人员,厂家等不同管理者的需要。同时可以查询各类监测对象的汇总信息。能够被系统自动发现的信息除了 IP,操作系统,设备型号,软硬件配置列表等基本信息外,还能够自动扫描节点上的可监测项目,包括接口、系统设备、应用服务器、数据库、Web 服务等,并自动创建默认的监测系统,自动开始监测其状态或性能数据。
系统提供两种视图来监测资源,一种是列表视图,列出资源的基本信息、可用性以及常用指标的当前数据值;另一种是图形视图,通过监测资源的多个常用指标的性能监测图来直观的把握资源的可用性和效能。调度人员可以通过对设备的远动分类进行归纳,灵活分组。远动信息设备监测系统提供丰富的设备查询角度。可以按照设备的类型、设备名称、关键字等不同方式从系统中查询任意被管理对象,能够满足不同管理者的需要。同时可以查询各类监测对象的汇总信息。
调度人员系统架构中从网络、系统、应用到远动的每个环节,每个节点、每个应用的性能好坏都直接影响到网络和远动的正常运行。所以,采集孤立系统元素的数据并不是远动信息设备监测系统的目的,而是保障远动系统的可用性。正是基于前面介绍的远动信息设备监测系统丰富灵活的监测系统机制,使得远动信息设备监测系统能够集成包括网络、系统、应用到远动的各个层次的完整系统架构管理。而正是设备具备这样的统一性和完整性,才可能全面综合的分析各个在远动整个系统中的各种元素的可用性和性能数据,并最终通过 SLA 机制和远动视图科学的映射出调度人员远动的可用性和健康性。
......
......
5、结束语
本文主要完成了以下工作:
1、着重研究了 SNMP 简单网络管理协议的体系架构基础和其结构组成。包括管理信息结构、管理信息库,SNMP 版本以及 SNMP 的消息格式。
2、在 SNMP 协议的基础之上提出了基于 SNMP 的远动信息设备监测系统的总体架构图和设计方法,并讨论了架构图的 MIB 结构模块、分析模块、以及 SNMP 和 WEB 前台表现设计和实现。
3、设计了远动信息设备监控系统的技术设计和软件结构及实现功能。着重在软件结构和功能实现上为系统更好的服务于铁路远动 SCADA 系统功能上进行了叙述。
4、该系统能有效的对远动信息设备进行状态监测、数据统计,对信息设备的故障状态进行准确定位,并将故障信息以多种形式进行报警,能将设备状态、性能以及故障做综合分析,以辅助维修。
远动信息设备监测系统开发完成后,现已投入到远动的管理维护的工作中去,给远动系统的维护方式带来了改变。远动维护人员根据系统监控屏幕上出现的各种设备问题,如果不能直接解决问题,就及时和厂家、通信部门以及使用的调度部门做好沟通,相对于从前的出了问题再解决的方式,加快了问题处理的速度,也不用再进行故障定位,故障类型判断等繁琐的工作。接下来的工作中,我们将在现有的系统功能上,增加一些冗余和大规模集群的功能以更好的适应远动系统的不断发展。
......
参考文献(略)
......
参考文献(略)