《精编》网管产品简要介绍

7 网管产品 7.1 备份网管与网元数据不一致下载后业务中断 【现象描述】 某干线工程,覆盖了多个城市,组网如下图所示。采用了OptiX iManager RMS网管进行管理,全网分别在3个城市设置了网管(RMS-1、RMS-2、RMS-3),其中RMS-1为中心网管,进行业务配置与电路管理,而RMS-2、RMS-3为备份网管。

【故障现象】 某日17时30分网上部分2M业务出现了TU-AIS告警,业务中断。经核实,出现中断的业务都为RMS-1最近新增加的业务,并且这些中断的业务均与NE-M号站有关。

【故障分析及排除】 用RMS-1网管查询NE-M号站的配置,发现这些出现告警的业务配置已丢失。在RMS-2网管上检查网管的操作日志,发现17时30分前后RMS-2网管对NE-M号站执行过业务配置的操作。

初步判断是由于RMS-2网管执行的业务配置下发导致新增配置丢失,引起了业务的中断。经过了解,RMS-1网管增加完配置后,没有要求RMS-2和RMS-3网管上载配置进行刷新,导致RMS-2将原有配置下发后导致了业务的中断。

业务配置都是由于中心RMS-1网管完成的,RMS-1网管上的业务配置是最新的配置。RMS-2、RMS-3网管在异地,并且网管操作人员没有更新过数据,其网管配置数据是20多天前的配置数据。在事故发生时,又由于RMS-2网管操作人员的误操作,在业务配置窗口误按了“激活全部”,对NE-M号站业务进行了全量下发,由于此时通过RMS-2网管下发网元的业务并不是最新业务,导致NE-M号站网元侧的最新配置业务丢失,致使新增业务中断。

【结论和建议】 1、在多网管情况下要让备份网管起作用,应该定期进行数据同步操作,本案例中RMS-2、RMS-3网管就应该将每天将对全网网元业务进行一次查询作为一项日常操作来执行。

2、“激活全部”操作是个危险操作,需要强调不要随意使用此操作,对业务要按增量的方式进行增加和删除。在进行业务操作时选中待激活业务,按“激活”就可以进行业务增量添加,不会对已配置业务带来影响。

3、要注意网络的安全管理,制定有效的维护制度, 加强密码管理,设置相应权限的网管用户,做维护时以维护权限用户登录,做网络监控时以监视权限用户登录。平时进行网管监控时应使用“监视级别”的身份登录,避免不必要的误操作。

4、OptiX系统提供了完善的网络安全管理,可以通过设置网元用户的级别和网管用户的级别进行操作权限的控制。如,可以只给RMS-2和RMS-3网管分别分配只有监视级别或维护级别的网元用户,在这种情况下,即使RMS-2网管以配置级别的网管用户进行业务配置,但由于网元用户操作权限的限制,RMS-2网管也不能对网元进行实际的业务配置。

7.2 在T2000网管侧删除保护子网的正确方法 【系统概述】 根据业务配置需要,需要在网管侧删除保护子网。

【故障现象】 在OptiX iManager T2000网管平台保护子网拓扑视图中选中某保护子网,点击鼠标右键,在弹出菜单中选择“删除保护子网”,网管出现告警“删除保护子网会严重影响业务”,确定之后再次提示“删除保护子网属于危险操作”。

【故障分析及排除】 删除保护子网的方法有两个,如果按照上述故障现象中描述的方法直接删除保护子网,系统将默认删除网元侧的保护子网,属于业务调测时的使用方法;
在上业务后,禁止此操作。如果在上业务后只是想在网管侧删除数据,可参照下面的步骤进行 1、在主拓扑图中选择[传送工作台/传送网络保护管理],进入传送网络保护子网管理视图,此时主拓扑图上多了[保护子网]菜单项;

2、选择[保护子网/保护搜索],进入保护搜索向导;

3、在“现有子网一致性确认”中显示出现有子网的名称、状态和类型;

4、选中要删除的子网,然后按鼠标右键,出现一个弹出菜单,包括“从网络层删除”、“从网元侧删除”两项;

5、如果要删除网管侧的保护子网,选择“从网络层删除”。完成后,左边管理视图中相应保护子网的拓扑会消失,仅留下网元的拓扑。

【结论和建议】 建议网管用户在操作时密切关注系统提示,T2000网管一般对危险操作都有两次提示;
对不熟悉的操作,请先阅读网管操作指导书或者咨询专家。

7.3 OptiX iManager T2000工作站网管打印机安装方法 【系统概述】 某局使用OptiX iManager T2000 工作站网管,安装了HP 5000打印机。

【故障现象】 点击报表打印按纽,打印机没有响应。点击Solaris 平台上的打印机管理图标,显示打印机未安装。

安装完打印机以后,点击打印,仍然无响应,查询打印机通信信息,显示“Communication connect error”。

【故障分析及排除】 从上面的显示信息看,故障为打印机安装和连接错误,造成打印机安装不成功和不能正常通信。

1、首先用连接电缆将打印机连接到工作站的并行口上,并行口标志为“//”。

2、以超级用户(root)身份登录。

3、用iManager T2000安装光谍进行安装,T2000安装光谍中带有打印机安装程序把安装光谍插入光区中,在工作站上打开一个终端。用“ cd /cdrom/cdrom0”切换到T2000安装目录,运行“sh ./install.sh”开始安装,选择不安装sybase和T2000直接跳到“安装打印机”,然后按照步骤安装就可以了。

4、如果不使用安装光谍,直接利用Solari操作系统也可以安装在超级用户终端下输入“admintool”命令,系统弹出管理工具窗口,在窗口中点击“浏览”菜单,点击“打印机”,在打印机配置窗口中,点击“编辑”“增加”“本地打印机”,选择打印机端口选择“其它”,路径改为“/dev/ecpp0”,注意有的可能是“/dev/bpp0”或者“/dev/lp”;
打印机为默认打印机或者直接选择HP打印机;
其它选项为默认。然后点击确定,完成打印机安装。

5、再进行报表打印,打印成功。

【结论和建议】 安装打印机前,首先连接好打印机,工作站与打印机的正确连接方法为首先确认选择哪一种接口,在工作站上有并口和串口两种,并口的标志为“//”,其路径为“/dev/ecpp0”;
串口的标志为“A”或者“B”,其路径为“/dev/term/a“或者“/dev/term/b”。

iManager T2000安装程序中默认选择并口。建议使用T2000光谍中的安装程序进行安装,以减少设置的烦琐。

7.4 MFC42.DLL版本问题导致网管运行时出现非法操作 【系统概述】 NES4.3.1.8启动时正常,但有时在上载网元数据的过程中,系统弹出窗口报告程序有非法操作,提示关闭应用程序。

【故障现象】 在提示信息中包含这样的内容“TASK在01676c371351的模块MFC42.DLL中导致无效页错误”。网管软件无法正常使用。

【故障分析及排除】 借助Win98自带的工具“系统文件检查器”(C\windows\system\sfc.),扫描改动过的系统文件,发现MFC42.DLL(位于C\windows\system)的版本有改动,还原为原来的版本后,故障消失,网管恢复正常。

这里问题处理的关键为,拷贝一个能使网管正常运行的MFC42.DLL文件(可以从其它正常运行的计算机中复制)于C\windows\system目录下,替换有问题的MFC42.DLL。在Windows的图形界面下,系统可能会提示MFC42.DLL正在被使用,无法覆盖,解决的办法为重启系统,进入DOS命令行,在命令行方式执行相应的操作。

【结论和建议】 在Windows系统安装好之后,最好先运行一次“系统文件检查器”(C\WINDOWS\SYSTEM\SFC.),保存原始的系统文件版本信息。以后如果出现因系统文件版本变更引起的问题,借助该工具可以方便地校验出并且还原。

7.5 由于设置了单用户登录而造成其他用户无法登录 【系统概述】 iManager T2000网管,网管服务器运行正常。网管设置了多个不同级别的用户。

【故障现象】 在网管中用“admin”用户增加了“test1”操作员级别的用户;
但是在一段时间后,发现用“test1”用户不能登录网管,只能用“admin”登录;

【故障分析及排除】 故障分析 1、是不是“test1”用户的期限已到经查询“test1”设置为“永不过期”,并且密码永久有效;

2、用“admin”用户登录,再新建一个新的“test2”用户,退出客户端用“test2”用户也不能登录;

3、是不是在“admin”登录时设置了单用户登录经过查询,发现维护人员在调测时为了不让别人操作网管,设置了单用户登录模式,维护完后没有更改过来。

故障排除 用“admin”用户登录网管,进入“设置”菜单,点击“启用多用户模式”,然后点击“退出”,再用“test1”用户登录,一切正常。

【结论和建议】 T2000网管提供单用户操作和多用户操作两种模式。当设置成单用户时,只能使用管理员用户名“admin”登录;
当设置成多用户操作时,可以用所有已创建用户登录。设置为单用户主要是为了独立配置管理需要,但在设置成单用户时,所有正在操作的其它用户均被中断退出。

建议管理员在设置单用户模式时,提前通知其它用户,以免影响其它用户的操作。另外在维护前做一些设置时,一定要在做完维护后立即恢复这些设置。

7.6 如何解决因停电而导致的系统文件受损的问题 【系统概述】 某局使用RMS网管,操作系统版本是Solaris 2.5.1、网管软件版本是RMS 4728。

【故障现象】 正常使用过程中突然掉电,导致部分文件损坏而不能正常启动网管。

【故障分析及排除】 有时会出现因停电而导致系统异常关闭的情况,此时,在Solaris环境下,若文件系统(file system)是Asynchronous形式的,那么这种情况就很容易给该文件系统带来致命的损害。在Unix环境下,出现这种问题时,一般都会在系统重新启动时检查一下文件系统,但有时损害程度极为严重时,这种检查也无法修复,甚至要丢弃文件系统。

若不能够正确处理,有时会把本可以恢复的一些珍贵资料丢失,因此在这里想介绍几种降低损害程度的方法

下面我们分步骤来看一下实际处理这种情况的方法。

[第1步]重新启动系统 在Solaris环境下,因为文件系统是Asynchronous形式的,所以在重新启动系统时,一定要synchronize(同步)disk(磁盘)。为此在shell下键入sync命令即可。

在Solaris环境下重新启动的命令如下 reboot[Enter]或shutdown -r1[Enter](1分钟后重新启动系统) [第2步]single mode(单模)启动系统 在Solaris环境下 启动时,一般键入[stop]A便可进入PROM mode。此时,再输入下面这行命令。

boot -s [第3步]进入系统后再执行fsck命令 执行下面的命令来检查所有文件系统 [1] 在Solaris环境下 [2] fsck[Enter] 若只想查看某特定部分,在检查完/etc/vfstab下的文件系统之后,依照下表执行fsck命令即可。这里以查看下面的文件系统为例 device device mount FS fsck mount mount to mount to fsck point type pass at boot options /dev/dsk/c1d0s2 /dev/rdsk/c1d0s2 /usr ufs 1 yes - fd - /dev/fd fd - no - /proc - /proc proc - no - /dev/dsk/c0t3d0s1 -