案例研究:数据中心扩张的新业务模式
2015-09-14 机房360 编辑:litao984lt
各大主要的互联网企业,包括谷歌和亚马逊都已经研发和设计了他们自己的数据中心设备。他们开发了定制化的网络和软件解决方案,以满足他们特定的业务需求。其他企业包括Netflix和Shutterfly则采用了不同的方法,他们采用了半定制化的存储硬件。由于存储和带宽的需求加速,这些“超大规模”的数据中心均走在了数据中心业界采用不同的商业模式的前沿。这些变化包括以非传统的方式与新的企业合作,以满足他们升级大型机架式系统所涉及的复杂的管理和后勤工作的需求。超大规模并不一定意味着非常大的数据中心,但其架构却能够实现规模的快速缩放,或在不改变硬件和网络基础设施的前提下的扩展。
较之设计和构建一处新的数据中心而言,扩展现有的数据中心基础设施是一项不同的挑战。对现有数据中心的扩展必须是在保证其24/7全天候正常运营的前提下,硬件的扩展需要无缝发生,而不中断业务。为了处理增加容量的挑战,一些更先进的数据中心的架构是基于一种“组合式”的方法。其优点是能够按比例,实时进行规模化扩展,而不改变存储或存储服务器的元素。使用这种方法,扩大现有基础设施的带宽或存储容量更多的是由数据中心的运营业务,供应链,测试工程和后勤挑战,而非设计或架构决策而推动的。然而,正如下文的案例中所介绍的情况那样,实时增加数据中心的容量具有其自身的复杂问题,需要高度的运算精度来维持现有基础设施的24/7全天候不间断运营。
案例:升级数据中心容量
升级一家公司的数据中心容量需要大型机架系统的无缝安装,确保24/7全天候不间断的正常运行。附加的硬件不能是新的或定制化的设计。在该案例中,其扩展项目将基于数据中心现有的硬件,借助该公司自己拥有和经营的数据中心所开发的软件图像。这家企业选择的一家更为传统的合作伙伴是一家电子合约制造商。该合约制造商新美亚公司(Sanmina),在存储和存储服务器整合以及系统设计方面具备相当的经验。而该数据中心运营商部分的受益是显著的成本节约,以及获得一家大型合约制造商遍布欧洲和亚洲的设施。
该系统的建立和安装,必须以确保该公司现有数据中心基础设施的持续运作为前提,往往在一个短的安装窗口。该公司每季度都需要增加几百台新的数据中心机架。该项目需要精确和有效的规划,以及每季度对其完美的执行。
这项计划主要是按如下四大步骤执行的:
开发一款模块和高度可扩展的测试系统
实施有效的制造流程
创建自定义的供应链管理流程
设计一个灵活的物流系统
模块化和高度可扩展的测试系统
在数据中心基础设施中,开发一款模块化和高度可扩展的测试系统,大量的机架可以并行测试是必不可少的。这是可能的,因为该合约制造商拥有大型的生产设施,且具有广泛的测试专业知识。定制化软件图像生成和Nagios管理软件可用来实现自动化的流程。此外,通过与该数据中心企业的一致沟通,提供实时的测试状态,提高了产品的部署。其结果是实现了更快的项目启动,且测试过程的可信度较高。
高效的制造工艺
新美亚公司充分利用了其在复杂计算和通信硬件方面的BTO/CTO(构建和配置命令)方面的经验,优化了机架系统季度生产紧密的日程安排。设计出一套高效的电源和空调系统,以适应72台机架同时供电的峰值要求。这种方法使所有机架能够并行测试,降低了整个系统的测试时间。在系统中针对每台机架进行配置和安置的过程中进行开发。其指定了相关机架在数据中心的确切位置,并启用了高效和及时的安装。此外,供应商在生产和测试的集成设施的过程中也一直在现场,以确保故障组件能够立即更换。
定制化的供应链管理流程
想要在短时间内实施组装,测试和交付的管理,必须实施一套定制化的供应链解决方案。这包括跨三个不同的时间区域采用灵活的工具来管理项目。实施组件交付的详细跟踪,以保证按时到货。每日供应链状态更新监测,以确定潜在的交付问题。预测更换零件的有效方法,使他们能够在新版本发布的第一时间作为组件进行购买。这种方法适应很短的服务器组件的生命周期,消除了部分组件变得过时的风险,并尽量减少潜在的多余材料。
灵活的物流系统
物流系统是专门为这家数据中心客户设计的。其包括在一年中的不同季节时期,甚至极端气候条件下确保运输系统的能力。通过精心挑选货运商,以确保空气悬挂减震系统和湿度控制。这样做对于消除由于极端温度和湿度所造成的故障危险是必要的。每个箱子均进行了详细的标识。这个过程有助于顺利在四小时内将特定机架安置到数据中心指定交付的楼层位置。严格四小时的限制是为了保证数据中心冗余系统的不间断服务。可重复使用的机架包装设计和测试为机架提供强有力的保护。此包装设计也有助于非常高效的递送,同时消除了针对特殊的设备和工具拆包,和在数据中心装卸卸载系统的需要。
通过设施的开发,流程和工具的配置和测试,72台系统实现了并行运行,新美亚公司每个季度都能够在两个星期内提供200个系统。最重要的是,该数据中心企业降低了故障率,并优化了整个系统的成本。扩大了机架系统的测试覆盖率,在全面的旧设备淘汰过程中,显著降低了设备的早期故障,消除所有的故障事件,降低了总成本。
以上均是数据中心扩展采用一种新的业务模式所带来的好处。尤其重要的是由这家合约制造商所带来的脚本测试、系统测试开发和物流方面的经验。该合约制造商的专业知识及遍布全球的设备,使得这家数据中心企业实现了全新的商业模式,并大大降低了成本。而随着IT产业的成熟和发展,这个模型有可能被证明针对其他高速增长的数据中心和云计算的部署亦是非常有效的。