扫一扫
关注微信公众号

企业为什么需要灾难恢复?
2009-04-21   IT专家网

企业为什么需要灾难恢复?这个问题要是搁在几年前,也许会被人笑话,但是经历去年的大地震后,也促使大家去思考灾难与灾难恢复了。大家也看到了灾难恢复在关键时刻所能发挥的作用和价值。这里谈谈什么是灾难?企业又为什么需要灾难恢复?希望能够给你的企业在灾难恢复方面提供一些有用的建议和帮助。

  灾难恢复的价值

  在谈什么是灾难及灾难的种类之前,我想先谈谈灾难恢复的价值。作为个体,我们每个人可能都会购买这样、那样的保险,比如说为了车的安全,给车买保险;为了房子的安全,给房子买保险;为了自己的各方面;购买养老保险、安全保险等等……诸如此类都是为了让自己在遇到突发事情(通常都不是什么好事儿)的时候能够把自己的损失减少到最低。同理,灾难恢复就如同企业日常业务的保险;一个企业如果具有一份保险的话,那么面对突发事件将比别的企业有更强抵御风险的能力。同时,企业不仅仅只需要这份保险,还需要的是一份更加完善、更加适合自身的保险;这就是灾难恢复的价值。

  什么是灾难?

  灾难的定义很多种,这里只讨论针对企业IT的灾难。从企业的角度来看,灾难是指对企业产生灾害性影响的事情,并且严重影响到企业日常业务的正常运营;这种事情是无法预料的、出于意外的。说的再通俗一点,就是点背儿;企业要是遇到地震、暴风雨、海啸、火山爆发,那就只能埋怨天公不作美了;如果遇到一些其他的人物事故,那就要好好反思反思了。下面将要讨论的是灾难的种类。

  灾难的种类

  “多灾多难”这个词语就能够体现出灾难种类的繁多来,灾难有多种形式,而且危害程度不同,从地震、暴风雨这些自然灾害到不满员工的蓄意谋害,异或是黑客的故意破坏,总之是你能想到的全有,不能想到的也可能会发生。各种危害对企业的上海程度也不尽相同。一些可能被看做是一场大灾难,而另外一些可能就是一些小麻烦了。但是通过上面所说的定义,所有灾难,无论大小,都会对企业的日常业务产生影响。

  企业面临的灾难主要有以下几种:

  人为事故。任何企业都可能会受到很多潜在灾难的威胁。其中有一些可能是由于直接的人为原因。企业员工使用企业的资源,获得和操纵有价值的数据,这些数据是工作中时时会用到的,因为很多人都会使用公司电脑保存文件,并且他们尝尝认为使用数据并保证数据随时可用是理所当然的,那么这些数据就会受到来自那些能够获取它们的员工所产生的人为事故的威胁(无论是那些合法获取的人还是恶意获取的人)。一旦事故发生,将造成不可估量的后果,最典型的就是:机密邮件的泄露,邮件的外泄可能会对公司业务造成严重的影响。

  潜在的事故包括文件和记录级别的数据删除、数据损坏或者数据泄露。这些损失很隐蔽,跟其他威胁相比更加难发现,并且是相当长的时间内不会引起注意。这种特征给灾难恢复增加了很大的难度,比如有些数据一不小心删除的话,如果马上请求恢复,也许能够得到妥善处理,如果这些数据长时间没有被报告,那么将给灾难恢复带来很大的麻烦。

  设备失效。设备失效定义比较广,应该说所有服务于企业业务的设备都属于这个范畴。比如说电力设备,如果电力设备突然失效,那么企业依靠计算机的那部分业务首当其冲受到影响,业务控制,ERP、数据处理等诸多问题都会受到影响,电力设备的失效对企业来说绝对是头疼的事情。还比如说软硬件的失效,比如说关键设备(服务器、存储设备)的突然失效,那将会对企业关键业务造成严重的影响;还有员工工作的PC或者笔记本出现的硬件故障,也会对员工工作造成一定的影响;还有一些关键业务软件也可能会遇到失效的时候;设备的失效对企业造成的影响范围很大。

  自然灾害。自然灾难应该是最好理解的灾难了。所有大自然界对企业业务造成影响的自然现象都属于这个范畴,比如说:地震、暴雨、飓风、海啸、火山爆发等等,大自然的力量不可阻挡,当然这种灾难属于小概率事件,但是破坏性也是惊人的。应对这种灾难,也是需要企业在灾难恢复方面最多工作的。

  蓄意破坏行为。蓄意破坏行为应该是对企业业务破坏很大的一种行为;通常人为事故、设备失效、自然灾害可能都或多或少存在一些无意的因素。但是蓄意破坏行为则是带有非常明确的目的性,它的目的就是为了破坏企业的关键业务,从而让企业的关键业务陷入瘫痪。比如说去年英国的银行卡信息被盗事件。对于那些蓄意搞破坏的人来说,入侵的概率及产生的危害将会是永无休止的;从纵火、破坏公司各种设备到入侵企业的网络系统,通过黑客行为或者传播病毒,让企业业务系统陷入瘫痪等等。

  大概罗列了灾难的一些种类,接下来该谈的就是如何去预防和应对这些灾难了,也就是该谈谈灾难恢复了。

  什么是灾难恢复?

  简单的讲灾难恢复就是为了保持业务连续性的一部分,其主要负责的是在灾难或者紧急事件发生的情况下如何保证业务的持续进行。或者说灾难恢复是指一个公司从灾难中恢复重新开始正常运营的能力。

  在遭遇到一场大灾难的时候,业务恢复的首要目标就是保证机构最低限度的服务水平。同时在尽可能短的时间内使得公司恢复正常运营也是尤为重要的。这就意味着在灾难恢复的过程中需要采用交叉的手段:一方面对于重要的功能和流程需要及早修复,同时也需要完成所有流程和功能的修复。灾难恢复计划的制定过程需要公司内部多个职能部门的关键人员共同协商挖成。(接下来的文章会谈到如何制定灾难恢复计划)

  谈了很多灾难和灾难恢复的概念,最后为了能够加强各位对灾难恢复领域的重视,引用在备份领域经常提到的墨菲定律:“墨菲定律(Murphy’s Law)缘于美国一位名叫墨菲的上尉。他认为他的某位同事是个倒霉蛋,不经意说了句笑话:“如果一件事情有可能被弄糟,让他去做就一定会弄糟。”这句话迅速流传。经过多年,这一“定律”逐渐进入习语范畴,其内涵被赋予无穷的创意,出现了众多的变体,“如果坏事有可能发生,不管这种可能性多么小,它总会发生,并引起最大可能的损失”、“If anything can go wrong, it will.(会出错的,终将会出错)”、“笑一笑,明天未必比今天好。”“东西越好,越不中用”、“别试图教猪唱歌,这样不但不会有结果,还会惹猪不高兴!”#p#分页标题#e#

  根据“墨菲定律”:

  一、任何事都没有表面看起来那么简单;

  二、所有的事都会比你预计的时间长;

  三、会出错的事总会出错;

  四,如果你担心某种情况发生,那么它就更有可能发生。

  我们都有这样的体会,如果在街上准备拦一辆车去赴一个时间紧迫的约会,你会发现街上所有的出租车不是有客就是根本不搭理你,而当你不需要租车的时候,却发现有很多空车在你周围游弋,只待你的一扬手,车随时就停在你的面前。如果一个月前在浴室打碎镜子,尽管仔细检查和冲刷,也不敢光着脚走路,等过了一段时间确定没有危险了,不幸的事还是照样发生,你还是被碎玻璃扎了脚。如果你把一片干面包掉在你的新地毯上,它两面都可能着地。但你把一片一面涂有果酱的面包掉在新地毯上,常常是有果酱的那面朝下。

  墨菲定律告诉我们,容易犯错误是人类与生俱来的弱点,不论科技多发达,事故都会发生。而且我们解决问题的手段越高明,面临的麻烦就越严重。所以,我们在事前应该是尽可能想得周到、全面一些,如果真的发生不幸或者损失,就笑着应对吧,关键在于总结所犯的错误,而不是企图掩盖它。

  2003年美国“哥伦比亚”号航天飞机即将返回地面时,在美国得克萨斯州中部地区上空解体,机上6名美国宇航员以及首位进入太空的以色列宇航员拉蒙全部遇难。“哥伦比亚”号航天飞机失事也印证了墨菲定律。如此复杂的系统是一定要出事的,不是今天,就是明天,合情合理。一次事故之后,人们总是要积极寻找事故原因,以防止下一次事故,这是人的一般理性都能够理解的,否则,或者从此放弃航天事业,或者听任下一次事故再次发生,这都不是一个国家能够接受的结果。

  人永远也不可能成为上帝,当你妄自尊大时,“墨菲定律”会叫你知道厉害;相反,如果你承认自己的无知,“墨菲定律”会帮助你做得更严密些。

  这其实是概率在起作用,人算不如天算,如老话说的“上的山多终遇虎”。还有“祸不单行”。如彩票,连着几期没大奖,最后必定滚出一个千万大奖来,灾祸发生的概率虽然也很小,但累积到一定程度,也会从最薄弱环节爆发。所以关键是要平时清扫死角,消除不安全隐患,降低事故概率。

  实际上,你越是怕什么,就越来什么。”

  由此得出的教训是:如果做某项工作有多种方法,而其中有一种方法将导致事故,那么一定有人会按这种方法去做,而且往往将会以最坏的结果出现。

  那么企业为什么需要灾难恢复?因为企业要做好最坏的打算,做到未雨绸缪!这样才能在灾难面前立于不败之地。

热词搜索:

上一篇:用一个案例讲解SQL Server数据库恢复
下一篇:让SQL Server的移动变得简单

分享到: 收藏