IT运维管理,创造商业价值!
中国IT运维网首页 | 资讯中心 | 运维管理 | 信息安全 | CIO视界 | 云计算 | 最佳案例 | 运维资源 | 专题策划 | 知识库 | 论坛

经验分享:网络管理员要避免的9大昏招

2008年04月08日
IT168/

  对于网络管理员来说,如何规避最容易出现的错误呢?现在让我们来看一些IT专业人员们最常见的错事,这些错误将直接导致网络一片混乱,以及如何避免自己产生类似的错误。

  1:没有一个全面的备份/灾难恢复计划

     并不是做备份有多么困难。问题是很多时候你会因为忙乱而忘记了他们。因为大多数的系统管理员往往一天下来都忙得头昏脑涨,而备份看起来是件浪费时间,毫无意义的工作——直到你真正需要它们之前。

     显然,你需要备份企业的重要数据。我不是暗示大多数管理员们没有适当的备份策略。但是这些备份策略中,有很多策略十年来从未改变过。你按照规定的时间间隔,用磁带备份了指定的重要文件,然后你就把它抛在脑后了。你没有考虑过评估与校正备份策略,甚至你都没有定期测试备份磁带,以确认你的数据的确被正确备份下来了。

     直到某一天你不得不这么做(磁带系统毁坏了,甚至更惨——你遭遇了一次灾难性的数据损失,现在你不得不使用备份来恢复) 至于灾难恢复,拥有一个完善考虑过的灾难恢复计划往往更糟。也许,在你的抽屉里就躺着一份写好的商务持续性计划,但是它真的是最新的吗?它的确考虑到了你的所有设备和人员吗?所有重要的人员都了解该计划吗?(举个例子,也许在计划完成之后,又有新人被提升到了关键的位置上。)这个计划已经覆盖了所有的重要因素吗?包括如何尽可能迅速的发现问题,如何提醒相关人员,如何隔离被影响的系统,以及如何修复和恢复生产?

  2: 忽视警报信号

     UPS已经显示了一周的警报,提醒你是时候更换这老古董了。邮件服务器突然每天都会重起好几次。用户投诉他们的网页连接会突然神秘中断几分钟而后再恢复正常。不过所有的一切似乎都还在正常运转,所以你稍稍推迟了检查问题的时间……直到某一天,你刚上班,网络就瘫痪了。 正如对待我们自己的身体健康状况一样,你应当及早留心网络故障的早期危险信号,并在问题变得严重之前及早将它揪出来。

  3: 从不记录变动情况

     当你对服务器的设置作过变动之后,应当花点时间把它记录下来。当物理损坏的灾难发生时,或者你的操作系统损坏以致你不得不从头开始重做系统时,你会很高兴你事先做了这个工作。

     甚至有时候,情况根本没刚才说的发生灾难这么糟——你只是刚刚对服务器的设置作了变更,但是看起来它并没按照你的预期方式进行工作,而不巧的是此时你却又忘记了原来的设置是什么。 的确,做记录花了你一点时间。但是就像备份一样,它值得你花这些时间。

  4: 从不在LOG记录上浪费空间

  节省磁盘空间的一个方法是放弃使用LOG记录功能,或者设置你的LOG记录文件每增长到一个很小的数值后就覆盖旧文件。但是实际问题是磁盘空间其实相对便宜,但是相对于没有了LOG文件后,你抓耳挠腮去查找问题所在并试图解决问题所花费的数小时而言,无论是从金钱还是你所遭受的挫折,所节省的空间都实在没有多大价值。 某些软件默认状态下,没有自动打开他们的LOG记录功能。但是如果你想在问题出现后的众多悲痛中解救自己的话,记住这个原理:“任何可以被记录的东西都应该被记录下来”。

发表评论请到:http://bbs.cnitom.com

相关阅读

图文热点

如何在交付周期中保护Web应用程序安全性
如何在交付周期中保护Web应用程序安全性Web应用程序是当今多数企业应用的前沿阵地。Web应用程序在一个复杂的混合性架构中...
微软加强Hotmail安全 加密通信介入
微软加强Hotmail安全 加密通信介入微软周一表示,他们计划在Hotmail中部署增强后的安全功能,确保攻击者无法实现非...

本类热点