关于避免数据中心停机和实现数据中心的可靠性企业需要了解的事 - 数据中心

　　安全研究机构波洛蒙研究所的一项研究表明，数据中心中断造成的平均损失从2010年至今已经增长了61%。但这些只是平均值。不同企业的实际情况的现实差别很大。

　　例如苹果应用商店发生12小时的停机事件使他们损失了2500万美元;达美航空公司运营中心的5小时停电事件导致2000架航班取消，估计损失1.5亿美元;而一次14小时的中断使Facebook公司损失了9000万美元。

　　最容易受到数据中心中断影响的行业(例如银行和金融、政府、医疗保健、制造、媒体和通信、零售以及运输/公用事业)平均每小时停机带来的损失超过500万美元。而这些行业组织都是财力雄厚的大公司，在财务上能够承受这样的损失。

　　小型企业的平均损失较少，每分钟137至427美元。但是，虽然规模较小的企业可能面临较小的损失，但这些损失可能会对他们的收入产生更大的影响。

　　波洛蒙研究所指出，收入损失并不是最大的风险，实际上排在第二位。最大的损失是声誉受损和客户流失。

　　防止中断和面向未来的数据中心

　　造成数据中心业务中断的三个主要原因是：

　　(1)停电(33%)

　　(2)网络故障(30%)

　　(3)软件错误(28%)

　　人们无法防止雷击或其他意外天气事件，例如德克萨斯州电网在去年冬天发生的情况。但是可以通过合作伙伴和部署冗余的可持续电力系统，最大限度地减少或消除停电面临的风险。

　　由于一些恶意软件/勒索软件给电网带来的风险、电价上涨的可能性很大以及气候变化引发的越来越不稳定的天气事件。如果可能的话，需要实现地理上多样化，高度稳健和冗余备用能源系统对避免数据中心故障很有帮助。

　　备用系统还应包括用于冷却系统、数据和整个设施的备用能源(如有可能，地理位置应该实现多样化)。

　　具有完全冗余、地理位置多样化、镜像系统的数据中心通常比没有冗余系统的数据中心经历的停机次数少三分之一。

　　对潜在的弱点和故障进行规划和持续测试也是一个必不可少的持续过程。不久前，在系统的日常物理维护期间发生了GitHub中断。而解决物理问题只花了几分钟，但数据可能需要24小时才能正确同步。

　　数据中心需要在其流程中融入灵活性，使他们能够进行调整，以快速轻松地增加容量或调动资源以满足不断变化的需求，而且在增加灵活性的同时应避免增加复杂性。寻找可以自动更改以响应数据中心环境中的差异的解决方案，以帮助企业实时识别和解决问题。

　　拥有能够适应数据中心当前状况的灵活解决方案将最终帮助企业提供所需的持续性能和可靠性。数据中心的未来发展还在于它们能够为客户提供更快的服务。

　　使用虚拟化环境可以轻松实现快速配置存储资源、推送更新、执行代码以及运行应用程序和主机的能力。虚拟化支持广泛的用例，例如边缘计算、虚拟桌面基础设施和测试环境。

　　借助Hyper-V或VMware等工具，企业可以增强其数据中心的能力，使其能够提供未来客户所需的速度。

　　数据中心应该采取强有力的安全措施来保护其所有通信和数据的隐私和完整性。这需要一种全面的安全方法，能够通过在每一步实施控制来降低风险。

　　数据中心应该采用“互操作性”来保持他们的选择开放，这样他们就可以在新技术和融合基础设施可用时整合它们。专注于不会让企业无法创新的解决方案对于保持数据中心环境的最新状态至关重要。

　　数据中心应该鼓励载波光纤的多样性。鼓励尽可能多的光纤服务提供商进入数据中心，并为客户提供灵活性，这将极大地改进他们的冗余选项，以在客户网络和不断变化的需求中保持高可用性。

　　总而言之，基础设施冗余、不断测试潜在故障、灵活性、速度、强大的安全措施和互操作性是数据中心面向未来的关键。

　　如果采用这些标准，利用最新的数据中心趋势，这样能够指导企业做出正确的决策。

关于避免数据中心停机和实现数据中心的可靠性企业需要了解的事
2021-11-26 企业网D1Net