扫一扫
关注微信公众号

导致云计算部署失败的十大“罪魁”
2010-08-02   网络

每一个云计算供应商,从谷歌到Rackspace,从亚马逊到Salesforce.com,都曾经遇到过断电的困扰。当这些断电情况突发时,怀疑论者们就开始质疑云计算的可行性。

与任何一个乐于投资于云的人谈谈吧,你不需要花太长时间就能理解这些断电事件仅仅是云事业中的一项成本而已。可是,那又如何?

断电现象几乎会发生在我们所消费的每一项服务中。今天,即便iPhone 4有着惊人的掉话率,苹果公司仍在享受着创记录的利润。然而,那些质疑智能手机或者iPhone还有Apple的可行性的言论又在哪儿呢?

这些发生在数据中心里的断电事件随处可见。那些质疑内部IT部门可行性的言论呢?你上一次断电时什么时候?你是否质疑过国家电网的可行性?

你可以采取很多措施来应对断电情况的发生——使用备用发电机(在云环境下,备份数据),但是这些措施并不能解决根本问题。停电是服务商的问题,而不是你的问题。

与其它常见的故障一样,用户在决定成功或者失败的时候扮演着更为积极的角色。以下列举出一些企业们引进云计算的时候出现的最常见的错误。

1. 没有清晰地定义“成功”这一概念

很多公司都视云计算为今天包治百病的良药。底线存在问题?引进云。难以保证远程员工的生产性?相信云。是否越来越多的员工在家里工作?也许云可以帮忙。

“制定不切实际的期望值是企业出现云计算问题的头号原因,”ISACA(国际信息系统审计与控制协会)副主席Robert Stroud说。

“很多企业都认为他们只需要向云供应商提出自己的要求,然后,一切就将像童话故事里一般自己完美地运作。”

如果那是你在家里设置了一个新的应用程序,你还会那样天真么?如果你没有制定具体实际的目标,那么,当云计算辜负了你的期望的时候千万不要感到惊讶。

2. 落后的计算概念

今年年初,Heroku因为亚马逊EC2的断电而彻底傻了眼。Heroku为Ruby on Rail提供了亚马逊托管的云部署平台。当天气因素导致断电,Heroku亲眼目睹了它的整个架构伴随着平台上四万多个应用程序在一瞬间灰飞烟灭的过程。

事实上该公司早就为排除故障和冗余做了自己所能想到的一切。但是他们没有意识到的是,自己把所有的一切都托管给了一个单一的亚马逊“可用区域”。

事后,亚马逊与Heroku通力合作,很快就追回了他们的平台,但是通过这次事故却可以看出计算理念的落后可能破坏云计算所作出的努力。故障转移、备份、和信息冗余比较容易在计算世界中进行虚拟化。如果你对现场进行了备份,那么你就能一直保持良好的状态。

“云计算中的稳定性是复杂的,这是我们吸取的教训之一,”Heroku的首席执行官Byron Sebastian说,“云架构是一个完整的解决方案,这是一个云计算的谎言。就像任何其它IT系统一样,在云中你同样需要附加软件。”

因此,为了给用户提供诸如先进的故障转移、负载平衡和信息冗余等服务,Heroku扩大了自己的平台,所有的一切都为云托管的应用程序量身定制。

3. 不能坚持让服务供应商负责

Heroku是幸运的。在他们面对困难的时候,亚马逊及时向他们伸出了援助之手。其他人可能就没有这么幸运了。浏览一下主要的云计算平台用户论坛,你就会发现大量不满的宣泄。

“某某厂商丢失了我所有的数据但是却对此置之不理!”像这样的抱怨不计其数。(这种抱怨的言论后面通常添加了很多感叹号。)当然其中不乏一些自己把事情搞砸了却想找人发泄不满的人,也有一些心理不平衡的疯子,但是确实有不少合理的抱怨。

有些人屏蔽了关于其他用户对于服务厂商的抱怨记录,我与这些人中的很多人谈过,但是很少有人会对这些由用户服务所产生的争论进行讨论。

Novell的商业服务管理解决方案市场部经理Michele Hudnall给我发邮件的时候强调了清晰定义服务水平协议(SLA)的重要性。Hudnall提醒说,必须小心缺乏服务水平协议、模糊定义服务水平协议和那些整体服务管理不佳的情况。

在关键业务出现问题的时候,哪怕只是在很短的时间内,企业就可能失去1%到2%的收入。当发生这种情况的时候,坚持要求服务供应商负起责任非常重要。这可能意味着需要就你的合同和服务水平协议中的赔偿条款和补救措施进行重新谈判。

Gartner最近起草了一份云供应商应该履行的消费者权益清单。其中包括服务水平协议中解决负债、补救措施、业务指标等条款;影响用户业务流程的服务项目的改变的告知权;了解系统技术限制的权利等等。

4. 你自己未能负起责任

即便你拥有一个具体的服务水平协议,也不意味着在出现问题的时候就可以摆脱困境。举例来说,如果你在云中存储了敏感客户数据,之后这些数据遭到别人的破坏,这将引发什么?难道你真的认为仅仅用服务水平协议就可以解决问题了吗?谁将为你的客户负责?没错,必须是你。

本月早些时候一个AT&T的安全漏洞泄露了超过十万iPad用户的邮件地址。大多用户都把矛头指向了苹果公司,但其实问题出在AT&T的云服务上。

这只是一个小小的漏洞。毕竟,大多数人的邮箱地址已经被大量的垃圾邮件入侵过很多次。然而,如果泄露的内容是信用卡或者是其它个人信息,苹果将面临的问题就不像iPhone 4遇到的天线问题那么微不足道了。

“你永远不可能摆脱责任,”Stroud说。“云供应商可能是你的信息托管载体,但实际情况是,如果出现任何差错,名誉扫地的将会是你。”

5. 缺乏对供应商的仔细调研

几乎每个服务厂商、托管公司和互联网服务提供商都标榜自己是“云供应商”。然而,并非所有的云供应商都一模一样。虽然对谷歌、亚马逊和IBM下注似乎在近几年内相当安全,但是你也不能就此认为所有的云计算创始公司都拥有相同的服务水准。

如果你的云供应商出现问题了怎么办?去年云巨头Coghead的崩盘让所有人看到了忽略供应商调查会冒多大的风险。Coghead依靠低廉的价格来 拉拢客户。然后当出现财务问题并且不能筹集更多的风险资本的时候,它做出了这样的决定,让客户们在短短几周的时间内将其数据撤离该公司的系统。

其实事情可能会更糟。如果你的云供应商在没有预先通知的情况下直接倒闭了呢?如果发生其他更不好的意外呢?

6. 对于服务供应链了解甚少

即便你的云供应商的名誉十分可靠,你是否确信他们提供的服务同样可靠?云供应商越来越喜欢将自己的服务外包给第三方。了解整个服务供应链对于准确判断你将签约的服务的可行性十分重要。

如果你正在面对一个大型云供应商,你的手上至少需要有一个他们的把柄,这样,负面信息可以激励他们去解决问题。至于较小的厂商,就需要你自己来把握了。

7. 忽视管理和监控应用程序

很多企业都错误地认为管理和性能问题将在实现云以后消失。“对于传统的应用程序,你将花费80%时间和资源在管理和监控上,”Sebastians称,“云能够有效地节省这部分时间和资源,但是不能将它们降低为零。”

如果你的应用程序表现不佳,你的客户将不会责怪云供应商,而会指责你。“你的应用程序里将会出现错误,这是不可避免的,”Sebastian说,“有了正确的性能管理和监控工具,你将会在一切成为灾难之前拥有更多的机会来发现这些错误。”

8. 对财务现实的无知

很多企业引进云是因为它比设置内部IT部门廉价。一般情况确实如此,但是即便是云服务更便宜,企业也应该看到它昂贵的本质。

为什么这么说呢?

“我们对于今天在各种技术上的花费知之甚少,”Stroud说。

这也不完全是你的错误。IT系统的财务透视确实是一个棘手的问题。许多经费并不透明。谁消耗了什么?谁支付什么?谁可以消耗多少?对于许多IT部门而言,这些问题的答案可能十分模糊。伴随着云的发展,这些问题的答案将变得更加不明朗。

9. 不了解云在法律上的繁琐程度

当你外包计算资源的时候,你的业务即便再小也可能会冒一定的的法律风险。你可能需要遵守不同司法管辖区的法律,你也可能会面临不同的法律责任,这取决于你的数据到底在哪儿。

据Gartner称,“服务供应商对于他们将数据存放在哪个司法管辖区和他们的用户必须遵循的各种法律规定的解释并不明了。”

遵守行业规范也是件比较麻烦的事情。即使云服务能够限制风险并且在技术上使你的兼容性更强,你也需要一段艰难的时间来证明这一点。

10. 对云计算的误解

最后,云部署失败的最大原因是因为企业们并不了解云的本质。许多公司发愁的问题其实并不是他们自己数据中心里存在的问题。断电、安全漏洞和兼容性问题是全体IT界需要面临的挑战,而不单单是云。

事实上云所解决的问题比它制造的问题要多的多。云可以减少你的IT管理和维护麻烦,可以让你把注意力从IT转移到核心业务上去。对于云的误解是一个巨大的错误。

热词搜索:

上一篇:经验分享:服务器整合如何少犯错?
下一篇:微软Windows7全球市场份额超Vista

分享到: 收藏