数据中心带外管理解决方案
2009-08-07 IT168
带外管理为企业提供极具成本效益、安全和有效的解决方案,可确保满足持续服务供应所必需的高水平 IT 基础设施性能,并作为实现削减成本和改善生产力的企业长期迫切需要的途径。
如果 IT 资产断开网络连接,系统管理应用软件就会警告管理员资产不再可用;但由于这些应用软件依赖网络基础设施进行资产管理,因而无法提供有关问题的具体详情,而只会提示资产已断开连接。因此,恢复资产网络连接的传统方法要求技术人员必须亲临资产现场,不论资产是位于数据中心还是远程站点。具体而言,技术人员必须通过“急救车”或便携式电脑查看问题设备,实际接通该资产,诊断问题并最终恢复 IT 资产的网络连接。此过程成本昂贵且相当耗时,形成所谓的“本地 IT 管理”。
通过使用带外管理工具可实现远程 IT 管理。这些工具可提供安全的备用路径,远程访问、监控和管理整个网络基础设施内的 IT 资产。如果 IT 资产出现故障,带外管理工具可通过远程控制方式将该资产重新连接到网络基础设施,从而在最短的时间内恢复使用。带外管理工具可最大程度地减少对本地管理和站点访问的需要,从而大幅减少使 IT 资产恢复连接所需的时间和运营成本。
解决方案
Avocent的带外管理解决方案是一个两层架构的管理系统,在接入层面上使用Avocent的ACS(advanced console server)提供对网元设备console端口的IP连接,在管理层面上采用Avocent的DSView3管理软件提供带外管理的平台服务。DSView3与ACS使用独立的IP网络作为传输链路。
以DSView3为核心的带外管理平台提供运维人员可以对各个网元设备进行配置、检测和恢复等操作。DSView3带外网管平台可以将所有网元设备console端口的系统日志信息统一收集并保存,其中亦包括了管理员对console端口进行的配置操作过程。DSView3带外网管平台允许按设备组或用户组设置访问权限与操作权限,从而以简单的形式反映运维程序中的责任分工。
通过DSView3提供的WEB界面对电信网络上的网元设备进行管理。在日常维护工作中,管理员从DSView3系统的IP链路进入网元设备console端口完成设备配置。当发生设备故障时,管理员可通过DSView3平台提供的带外通道从console端口对设备进行恢复操作。
情况分析
数据中心的设备或服务器出现故障。但网络基础设施仍在运行。管理员可得用带外管理工具和网络基础设施访问 IT 资产、诊断问题并在需要的情况下重启设备的电源(关闭电源,然后打开)。几分钟内,资产将恢复网络连接,从而借助系统管理应用软件将该资产重新投入生产。在本案例中的优点包括降低人工成本、提高生产力和降低风险。
连接一组服务器的网络交换机出现故障,无法连接至网络。在此情况下,仍可通过网络基础设施为交换机提供带外管理连接。系统管理应用软件将警告管理员,交换机已断开网络连接。通过使用带外管理工具远程访问交换机,管理员可诊断问题并将交换机及其连接的所有资产重新连接到网络基础设施。
为整个站点提供网络和互联网访问的路由器出现故障。此路由器为所有连接到网络的 IT 资产和所有带外管理工具提供网络基础设施连接。由于带外管理工具无法通过网络基础设施访问,因此管理员使用拨号连接进行访问。然后,管理员可以使用带外管理工具通过串行端口连接至路由器,以便快速诊断问题。最后,管理员排除了故障并将路由器及其所有资产重新连接至网络。以前,这种问题可能需要技术人员亲临现场花费几个小时,现在只需要几分钟。
带外管理工具
DSView3管理软件――为不同的带外管理工具(如串行控制台服务器、KVM 交换机、电源管理设备和服务处理器管理器)提供统一的访问、变更管理和配置管理。它还可为这些带外工具提供相应功能,以便统一管理其所连接的各种 IT 资产。另外,该管理软件可提供满足大型企业需求所需的可扩展性。
串行控制台服务器――实现对若干服务器及其他网络 IT 资产(路由器、交换机、电缆、防火墙等)的串行管理端口的远程访问,而不论网络连接断开与否。
KVM 交换机或 KVM over IP 交换――通过键盘、视频和鼠标端口访问服务器,以便为管理员提供亲临现场一样的访问功能。
智能配电设备 (IPDU)――提供打开和关闭远程设备电源的功能以实现操作控制或软件/硬件故障恢复。
服务处理器管理器――提供对计算机主板内嵌的服务处理器进行统一、集中访问的功能。上述管理器可独立于主 CPU 运行,确保管理员可以访问、监控和管理服务器的硬件部件。服务处理器管理器还可允许管理员重启服务器,而不论主处理器或操作系统是否运行。智能平台管理界面 (IPMI)、HP Integrated Lights Out (iLO) 和 Sun Advanced Lights Out Management (ALOM) 均为成熟的服务处理器技术。
方案优势
⊙真正实现无人化运营,并实现多个数据中心之间的集中自动化管理;
⊙能够快速、自动的从系统错误中恢复过来,最大程度上降低网络停机和运营成本;
⊙实现网络管理系统之间的无缝整合,实现对各种应用程序和基础设施错误的完全远程管理;
⊙IT基础设施管理系统的每一个组成部分,都与整个机构的安全构架一致,并兼容系统的各种安全策略与执行机制;
背景连接:
带外管理:意指在不通过现有的网络连接而具有的远程访问网络硬件(如服务器、路由器、交换机等)的能力。它直接建立一条连接途径,连通的是设备的管理端口,实际上充当了一种“后门”的角色,为IT专家们配置、寻错和重启设备提供方便。
带内管理:被广泛应用于执行常规性的管理任务,并用来监测各种网络错误和程序错误――非硬件错误或操作系统错误。带内管理的工具以数据网络的畅通为前提,从而保证其管理信息的正常传输。
带内管理与带外管理均为管理的两种不同方式,但带内管理太过依赖网络本身,它并不是监测通信的唯一方法。当服务器或网络设备故障时,或者网络连接丢失时,被管理设备与管理工作站之间的信息传输就会随之中断,带内管理就失去了作用。所以在这种情况下采用带外管理,无疑是一种“双保险”措施。