扫一扫
关注微信公众号

浅析电力企业信息系统运维综合监管平台设计
2010-04-23   网络

 随着国家电网公司信息化SGl86工程建设、应用的不断深入,信息系统已经融入到了电网企业生产经营的各个部分,信息化工作不再仅仅是生产经营的支撑活动,而已经成为生产经营环节不可缺少的组成部分。成为保障企业安全生产的重要因素。信息系统运维工作作为企业信息化工作的主要组成部分,肩负着保障信息系统安全、可靠运行,确保信息系统在企业生产经营发挥重要作用的重大使命。建设。安全稳定、架构合理、功能完备,标准规范”的信息系统运维综合监管平台,将有力地提高运维服务的工作效率和质量。

  1、建设需求

  国家电网公司SGl86工程建设内容全面覆盖了电网企业信息化工作内容,具体对系统运维工作而言,内容可以主要概括为4方面:一体化企业级信息集成平台、业务应用、桌面终端管理和信息安全管理。针对运维工作内容,信息系统运维综合监管平台建设需求大体来说,可包括以下几部分。

  1.1运行监控管理

  (1)一体化平台:一是硬件设备的监控,包括查看设备的配置数据和实时性能数据;根据设备的当前性能数据值判断运行状况,符合告警规则就发出告警;记录设备的历史变更情况和历史性能数据,形成历史库。二是平台软件的监管,主要是由软件提供的接口获得软件当前运行情况;三是网络监控,主要包括查看网络当前的通断情况、链路当前负载、流量等数据;记录历史流量数据,形成历史库。

  (2)业务应用:一是通过统一的接口和规范监测、统计和分析业务系统的运行数据,二是对业务系统故障产生的原因进行快速,准确定位;

  (3)桌面终端:一是针对桌面用户不同岗位的特点,建立桌面管理规范和标准,二是和资产管理以及IP管理相结合,对桌面进行全面管控;

  (4)统一、集中展现:一是原有的系统运维工具局限于各自所管对象的监控和管理,缺乏灵活性,统一、集中的展现界面应该在原有展现模式的基础上更加宏观的展现信息,能够从不同切面、视角展现;二是展现需要考虑业务和分析管理的角度,三是展现要直观,通过图表等各种方式提供从细致到宏观数据的支持,同时具备精细化的图档管理。

  1.2流程规范固化

  (1)体现分级运维,分级负责,“谁运行谁负责”的管理思路,适应“两级三线”的运行维护体系。

  (2)结合国家电网公司“两级三线”运行维护体系梳理工作流程,根据实际工作要求,通过统一的流程引擎为日常运维工作提供快速、方便、规范的流程,

  (3)建立一体化运维系统知识库,通过知识库的积累,为操作层和管理层提供问题分析的依据。

  1.3辅助分析决策

  (1)适应管理工作对分析需求的不断变化,提供强有力的决策依据。在原始数据的基础上,提供灵活的、不固定的分析手段和功能,对数据进行深入、全面、细致的挖掘分析,

  (2)提供对各种监管对象的监控指标,用于指导产品选型和采购;

  (3)提供自动化的指标和报表数据统计;

  (4)提供统一、完备的IT资产管理;

  (5)通过对历史数据进行趋势分析,做到提前预警;

  (6)提供对整体的安全事件的分析和安全风险的管理。

  1.4一体化集成整合

  信息系统运维综合监管平台的建设要突出“一体化”,加强原有系统模块的关联度,把原有割裂的东西整合起来,在原有系统功能的基础上,着重考虑跨系统、跨模块的关联、分析、统计。

 2、建设原则

  2.1充分利用国家电网公司IT服务管理咨询成果

  2007年,国家电网公司开展了IT服务管理统一咨询工作,参考ITIL模型和服务管理最佳实践,对信息系统运维建设中相关角色职责、业务流程和考核机制的建设进行了明确和规范。运维综合监管平台建设要充分利用咨询成果,综合考虑并完成平台建设。

  2.2借鉴SCADA/电网管理监控系统的成功经验

  通过长期积累与发展,SCADA/电网管理监控系统已建立了一整套成熟,完善的体系架构:毫秒级的数据采集;包括实时数据库、历史数据库在内的基于CIM/CIS的数据集成总线.;专用的工具层提供图形平台支撑上层应用与展现。在运维综合监管平台设计中要充分借鉴SCADA/电网管理监控系统的成功经验,改革IT监管现有的体系结构,达到实时管理、精益管理的目标。

  2.3充分利用现有产品及技术

  在信息运维领域,已有大量的指导理论以及适用于不同管理域的各种产品,运维综合监管平台设计不但要汲取现有的技术与经验,而且要兼顾公司内各级运维建设已有部分系统实际,因此要充分利用现有产品及技术,在现有产品与技术的基础上,创新构建一体化信息系统运维综合监管平台。

  2.4统一规划,分步实施

  坚持统一规划,明确发展方向和思路,实施对整体架构和数据模型的统一管控。不可能一蹴而就,必须循序渐进,遵循分阶段迭代实施的原则。

  2.5业务支撑优先

  无论平台功能如何划分及部署,平台建设的最终目的是如何最有效的实现业务价值,支撑业务的发展,增收节支。

  2.6投资保护的原则

  在满足业务支撑原则的前提下,需要充分考虑保护已有投资,尽量避免重复建设,要考虑管理系统开发及运维的综合成本。

3、建设目标

  信息系统运维综合监管平台的总体目标是建立一个稳定、高效、灵活的信息系统运行和维护管理体系,为国家电网公司业务应用正常运行提供有力的支撑,提高信息系统运行效率,提高服务质量,降低运营的成本,为实现国家电网公司的战略目标提供坚实的基础支撑。具体包括4方面。

  (1)实时管理。主要包括实时掌握运行情况。及时发现故障与异常,并迅速定位,尽快解决,及时发现入侵、病毒等安全问题及安全隐患,并迅速响应;通过运行分析,调整运行策略,提高系统运行效率,通过安全分析,调整安全策略,提高系统安全性。

  (2)闭环管理。主要包括通过流程保证故障,异常、隐患由合适的入采用合适的方式闭环处理;促进巡检、变更的工作标准化、规范化;通过流程运行的考核数据,促进运维质量和运维效率的提高。

  (3)精益管理。主要包括通过丰富完善的信息图档资料,为运行维护工作提供直观准确基础数据;避免维护工作中的疏漏而带来的人力、资金浪费,分析信息基础设施的运行负荷,制定合理的资源调配方案。

  (4)战略管理。主要包括优化现有的信息基础设施的运行性能;提升系统安全性,降低安全风险;预测并计划信息基础设施的需求;考核并不断提升服务水平。

  4、系统架构

  信息系统运维综合监管平台总体架构如图1所示。

  运营监管系统架构

  系统总体架构分为3层和1个库:数据采集分析处理层、协同调度层、应用展示层与统一信息库。

  数据采集分析层:数据采集层是对所有IT资源对象根据管理策略对运行状态情况(KPI)、资源配置数据、资产数据、安全数据等进行采集,分析处理,并将数据进行转发和存储。数据采集分析处理层对IT基础设施的监控范畴主要包括网络监控、主机监控、数据库监控、中间件监控和通用应用监控等进行供事件、故障报警的采集及分析,以及对信息系统软硬件主要指标的采集及分析。为协同调度层提供服务与支撑,是构建协同调度层的先决条件与基础。其目标是从多角度采集公司信息业务应用的运行数据,通过分析处理评估运行的状态和质量,发现故障和潜在问题并发出告警,保障公司信息业务应用的持续稳定运行。配置数据采集是对于IT资源对象的配置情况进行主动的采集,为后续的配置管理流程、资产管理提供数据,建立基线。同时通过数据的比对或者审计,发现配置变动。

  协同调度层:数据处理层把分析完的数据上传到协同调度运维流程,运维流程进行派单和处理,并提供资产、知识库,文档管理。建立在统一的流程引擎上。

  统一信息库:统一管理信息库是整个平台的核心数据结构和存储,为其他应用、展示模块通过统一的数据总线接口提供统一、完整、准确的数据。

  应用展示层:统一的应用,管理与展示界面,建立在统一的图形平台上。

5、五个“一”技术路线

  5.1一次采集

  现有的网管、安管、桌面管理等系统为实现对网络、系统、应用,安全设备与桌面等IT资源的管理,需要采集IT资源的告警、性能、配置、安全数据。多种系统的数据采集存在同一资源的同种数据会被多次采集的现象:一方面同一数据多次存储,数据冗余且可能存在一致性差异;另一方面,多次数据采集对被管资源可能造成性能影响。因此一体化信息系统监管平台对数据的采集为一次采集,变告警、性能、配置、安全事件、漏洞、资产数据的重复采集为一次采集,多次使用。

  5.2一个流程引擎

  现有的IT服务管理,安全管理、桌面管理都有流程功能,分别建立在不同的流程引擎上,通过统一流程引擎,支持IT服务管理系统流程,并支撑网管,安管、桌面管理中的所有工单流程运转。

  5.3一个管理信息库

  现有各系统的数据分别存放,存在数据冗余,由于数据采集与维护策略不同,可能存在数据不一致。为提供统一、完整、准确的数据,需要构建统一管理信息库作为系统的核心数据结构和存储,为其他应用、展示模块通过统一的数据总线接口。管理信息库中的数据包括资源数据、工单、操作、视图、故障,性能、原始数据及知识库。

  5.4一个图形平台

  为达到实时管理与精细管理的目标,同时借鉴SCADA/电网管理监控系统的成功经验,需要构建一个图形平台,支撑统一的应用与展现界面、综合的实时监管、工单与维护作业以及统计分析。

  5.5一次用户认证

  在企业一体化平台统一身份认证的总体框架下,对安全运维管理的要求将大大超过手工管理网管、流程和安管等跨异构系统的能力。管理上的复杂性还会导致出错机会和安全风险的增加。比如,内外运维人员的快速流转导致系统中大量存在孤立的账号,并且这些孤立的账号具有有效的权限,使运维管理系统暴露在内部和外部攻击之下。因此需要账号管理集中化,使公司能够从一个或几个集中点,控制用户对所有管理系统的访问。整合各模块的用户管理,提供统一的用户管理与认证。

  6、建设路径

  电网企业运维综合监管平台建设可根据各单位系统运维需要,“有重点、分阶段”展开。这里一般性建设路径建议。

  (1)第1阶段:实现实时监管与部分流程及图形化展现。本阶段数据采集分析层主要实现告警、性能、配置、安全事件、漏洞扫描和资产等数据的采集、数据过滤、数据安全、数据审计、实时故障告警分析、安全风险告警分析和性能数据处理;协同调度层实现服务台、事件、变更和巡检流程;统一信息库实现全部功能;应用展示层实现运维管理图形展示。

  (2)第2阶段:实现全部流程与大部展现。数据采集分析层主要实现资产数据跟踪;协同调度层实现问题、配置和调度流程;应用展示层实现运维管理仪表盘展示、运维管理统一报表、业务影响分析、安全影响分析、绩效考核、合规管理和文档资料管理。

  (3)第3阶段:实现资源战略规划。应用展示层实现故障反演、趋势预警,决策分析和可用性管理。

  (4)第4阶段:实现运维自动化。

  7、结语

  信息系统运维综合监管平台建设作为电网企业信息系统运维体系的重要组成部分,在企业信息运行维护工作中发挥着越来越大的作用。通过平台建设.应用的不断深入,一方面降低了运维人员的工作量,提高了运维人员快速处理问题的能力,另一方面,提高了企业信息运维工作的效率和质量,为全面提高企业客户服务满意率打下坚实基础。

热词搜索:

上一篇:IT运维在信息化建设中的作用
下一篇:IT运维管理市场在两到三年间会有很大发展

分享到: 收藏