部门运维管理综合解决方案

IT部门运维管理综合解决方案 2 目录 运维管理的解决方案 3 IT的环境越来越复杂 IT运维的难度也越来越大 4 降低IT成本如何提升员工 资产 项目和活动的产出 提升服务质量如何满足您的企业对IT服务性能的要求 控制风险如何定义和控制风险 提升系统可靠性 增加对业务的影响如何确保您的IT投资和运营决策与业务优先级要求相吻合 提供可视性如何清晰掌握IT中的成本和活动 业务对IT的期望也越来越高 5 运维管理 治 管 监 控 的整体工具框架 事件管理 问题管理 变更管理 6 目录 运维管理的解决方案 7 主要功能和特点包括 从多种IT资源中获取实时可用性和性能数据开箱即用阀值监控以自动生成告警事件 Situation 事件报告和自动响应预定义的告警事件 Eventreporting 借助于浏览器的管理界面自定义的管理逻辑视图历史数据存储以用于统计报表和回顾 系统和应用监控的基石 IBMTivoliMonitoring体系架构 系统监控架构及部署方式 分支机构 数据中心 监控架构 服务器操作系统数据库中间件及应用 服务器操作系统数据库中间件及应用 被管系统 被管系统 TEPS TEMS TDW TEMS 用户界面 Agent based Agent less Agent based Agent less TEMS TEPS TivoliEnterprisePortalServerTEMS TivoliEnterpriseManagementServerTDW TivoliDataWarehouse 典型架构设计 系统和应用监控范围 平台 数据库 应用 商业集成 Web架构 通信 协作 LotusDominoExchange Unix Windows Linux OS 400 DB2 Z Distributed Oracle Inix SAPMySAP SiebelTuxedo WebSphereMQ WebSphereMQIntegrator WebSphere Z Distributed IIS iPlanet Apache WebLogic SQL NET CICS IMS z OS Sybase Citrix VMWare WebServices Cluster s IBMTivoli监控程序支持您的整个IT环境 并且可以快速实施 实现价值 40个以上用于修正的定制包示例 CiscoWorksS1Tuxedoetc OPAL最佳实践库 UniversalAgent 通用服务代理 URL SNMP File Socket ODBC API SyslogProbe SyslogDaemon 11 管理门户 TivoliEnterprisePortal IntelligentLinking PersonalizedViews EasytouseBrowsercontrols Persistentcustomizedworkspacesforfutureuse 从单一界面管理IT资源和应用 管理报警条件 设置阀值 MultiplethresholdslinkedbyBooleanlogicfordeterminingcomplexproblemsAllowsforanautomated reflexactioninresponsetoviolation 13 自动化处理流程 定义逻辑视图 15 历史数据采集分析 RealTimeData 所有数据 包括实时数据和历史数据 都可以从TivoliEnterprisePortal中展示 TivoliDataWarehouse2 1汇集和剪除数据 使长期数据的管理更简单 并且提供对DB2 MSSQL和Oracle的支持 实时数据 短期历史数据 长期历史数据 RDB TivoliEnterprisePortal 操作系统监控 CPU处理器内存使用情况磁盘性能进程监控文件系统监控RPC调用的性能情况日志文件用户访问情况服务器网络使用情况 磁盘资源监控 操作系统监控 进程监控 网卡监控 增强的IBMSystemp AIX主机监控 ITMSystemEditionforSystemp更轻量级的Systemp监控可视化管理Systemp系统可用性和健康状态虚拟资源到物理资源的映射全面的Systemp性能监控可视化管理Systemp系统性能历史数据收集客户化定制视图 Situation和Workflow与IBMDirectorSystem无缝集成 数据库监控 应用服务器运行状态监控 指示应用服务器的总体健康状态 包括CPU使用率 内存堆分配 换页率 垃圾回收率 池大小 线程池使用率等 应用服务器健康状态监控 JMSsummarybyapp server HTTPSessionandWebContainerperapp server Top5delaysandcompletionratesperapplication 内存垃圾回收效率分析 垃圾回收效率会对应用服务器性能产生重大影响 包括其发生频率 回收时间等 因为在垃圾回收执行期间 其他进程不能活动 ITM工作视图能够展示细节的GC行为和全面的GC效率分析 最近的GC具体性能分析 回收频率 GC sperMinute 最近的JVM堆使用趋势 GC消耗时间 响应时间监控 Web应用监控 交易响应时间监控 Client响应时间监控 初始目标 当前状态 专家建议 采取措施解决问题 专家建议提供了问题和推荐恢复措施的详细描述使IT操作可以解决已知的错误 并且使主题专家抽出时间进行更多的附加值活动可以通过定制来获得本地的专家知识 或者与使用说明书相链接 专家建议减少了问题解决方案的时间 成本 扩展机制UniversalAgent UniversalAgent为ITM提供了极大的扩展能力 25 目录 运维管理的解决方案 网络监控 Netcool 1网管软件 保障网络的最佳健康状况和不间断的运行 保障至关重要的依靠网络连接的业务和服务IDC针对Netcool的报告 每年节省运维费用 58 7M 65days收回软件投资成本服务可用性达99 99 减少内部downtime64 减少外部downtime72 降低故障修复时间64 提高IT有效性18 提高操作员生产力22 事件管理 业务的优化 网络智能化管理先进的相关性 服务管理 业务影响分析 全面的网络监控 网管的网管 Probes 200 ATMForumMIBRFC1695forATMswitchesATMForumPNNI SinglePier MIBATMForumILMIMIBATMForumLANEClientMIBFrameRelayMIBRFC1315FDDIMIBRFC1512 ADCMetricaNPRAirspanSitespanAlcatel1000E10 OCB 283Alcatel5620LogfileAlcatel5620NMCORBAAlcatel5620SAMAlcatelAWSAlcatelDSCDexperClass5VoiceSwitchAlcatelMT20AlcatelNMC1300AlcatelOMC R 3GPP AlcatelOMC R Q3Interface AlcatelOMC R TerminalServerConnection AlcatelOMC SAlcatelOS OSAlcatelS12AlcatelSMC1360 EnterpriseSNMPEMSProbeEricsson3GPP OSS RC RANOS CNOS EricssonACP1000EricssonAXE10perClass5VoiceSwitchEricssonBNSIEricssonMD110EricssonRANOS 3GPP EricssonXmate Lucent5ESS Class5VoiceSwitchLucentAgileATMLucentECPLucentITM NM OMSLucentITM SCLucentJMTE CORBA LucentNaviscoreLucentNFMLucentOMC CORBA LucentOTAF SDHLRLucentWavestarSNMS VendorAlliances 25 AlcatelMotorolaSiemensEricssonTellabsMarconiLucentNokiaHuaweiFujitsuCienaCiscoJuniperCheckpointCramerMetasolvSAPXteraVoyence BridgeMIBRFC1493MIB IIRFC1213 2096RMONMIBsOSPFMIBBGPMIBifStackMIBVRRPMIB 31differentCiscoMIBs includingMPLSVPNs 21NortelMIBs6differentExtremeNetworksMIBs incVLANs JuniperMPLSVPNsupport SNMPsupport 175MIBs including 优秀的网络运维平台是整个网管系统成功的技术基础高性能的核心满足大型网络管理性能要求体系结构能够适合大型网络管理的结构要求实现运维流程 提供足够的灵活性 TNM网络管理运维平台 呈现评估 信息综合分析处理 全面信息采集 实时监控界面 Precision 自动化处理 Actions Triggers 相关性分析 事件自动处理 报表 统计分析报告 设备告警 设备告警 性能和流量监控 拓扑发现故障点定位 G 网络连通性 网络管理基本包 二 三层拓朴管理 可选项 客户自有数据库和报表系统 TNM深入的网络监控和信息采集 TNM事件采集特点Netcool探针 集成网元等各种管理信息NetcoolSyslogProbe提供对CiscoSyslog几千行规则 Syslog信息详细的分类 解释和严重性判断 不仅仅只是简单的数行字串匹配对其他厂商Syslog处理规则全球用户信息处理经验的大量累积对原始信息的丰富 以实现更灵活和方便的信息过滤 分析和丰富自动的存储转发功能 状态采集 事件采集 自动拓扑 端到端性能和服务质量监控 网络事件类型和来源 SyslogTrapICMPSNMP 路由器 交换机路由器 交换机线路和设备连通性路由器 交换机 Voice Security DatacenterApps DataCenterServers Wireless Optical Routers Switches VPNs 端到端服务管理 现成的处理规则大大减少实施和维护的工作网络实时综合监控 显示运维关注的主要实时信息 可以根据用户的需求进行调整 广域网实时监控 广域网视角显示关注的节点 线路的状态信息 局域网实时监控 局域网视角 按照局域网核心路由器 核心交换机 楼层交换机进行分类 监控参数按照设备故障事件 包括各类syslog告警事件 设备性能事件 包括各类SNMP采集的性能事件 线路事件 包括设备端口事件 网络设备性能 网络流量 动态拓扑图 物理网络连接和逻辑分区视图MPLSVPN和VLAN等逻辑视图查看网络设备的配置信息直接查看网络设备的事件网络拓扑和事件 网络拓扑视图 丰富的应用协议级性能管理 InternetServiceMonitoring ISM 支持绝大部分应用协议级性能监控 可以帮助用户对HTTP HTTPS FTP DNS 邮件等企业级服务提供性能检测 举例说明 针对HTTP监控 ISM提供如下丰富的性能KPI StatusLookupTimeConnectTimeDownloadTimeResponseTimeBytesPerSecBytesTransferred 网络设备的配置信息管理 事件分类视图 事件分类监控视图 包括 10分钟内故障事件告警 严重级别故障事件告警 性能类事件告警 连通性事件告警 配置类的故障信息等等 将事件按照最佳实践的分类方式进行显示 方便运