除ECC与热备份之外的服务器内存功能前沿技术
2014-02-26 来源:TechTarget中国 编辑:唐琼瑶
内存容量与可靠性对于成功整合与工作负载完整性非常关键。新技术可增强内存弹性,不仅仅是错误校正码ECC与内存热备份。
on-server内存的重要性更改着服务器设计与配置,可调节更多内存与更高的内存性能。这意味着变革服务器处理内存错误与可靠性的方式。
如果我们的数据中心都整合到虚拟服务器里,那么on-server内存功能的重要性又体现在哪里?
随着虚拟化渗透到更多数据中心中,几乎没有什么硬件平台能够支撑那么大量的工作负载。
内存容量与可靠性对于成功整合与工作负载完整性非常关键。相应地,任何服务器故障的影响对服务器上运行的工作负载数量而加倍。例如,如果一台服务器运行十个工作负载,结果遭遇内存故障就会导致系统崩溃或重启,那么所有十个工作负载都受到波及。
新技术可增强内存弹性,不仅仅是错误校正码ECC与内存热备份。这些发展解决了长期的可纠正错误,并告知管理员系统存在的慢性内存故障。在故障发生之前,服务器管理员能够检测并替换有问题的组件。
错误阀值允许双列直插内存模块DIMM可矫正错误的位置与频率——这可通过ECC捕获并修复,使用串行检测错误日志与其他DIMM功能。
如果已实施ECC,系统可以检测并从多位错误中恢复。对于高级ECC,数据字段可以在独立的ECC DIMM之间分开,这通常意味着使用相同的容量与级别部署匹配的DIMM。在服务器中应该安装偶数DIMM。
当服务器识别到慢性问题,当可矫正的错误超过了设定阀值,该错误报告警告系统管理工具为预先更换打上DIMM标签。有些服务器做得更好,可将整个内存页有效移除。DIMM的其余部分仍在使用,或者内存交换将操作转移到一个空闲模块上。