与RISC争雄 Nehalem-EX催生八路X86市场产品服务
如果说2010年X86服务器市场最大的看点是什么?无疑是四路以上的企业级服务器。在这个领域,我们会迎来一个堪称革命性的全新平台:英特尔八核Nehalem-EX(至强7500)。3月底,该平台就将正式发布,以取代2008年9月发布的六核至强7400系列(代号Dunnington)。
3月3日,英特尔在北京举办了智能计算媒体鉴证会。英特尔(中国)有限公司服务器产品事业部产品经理顾凡谈到,Nehalem-EX最大的看点并不只是高达3倍的性能提升,而是在可靠性和可扩展性方面的增强,这些改进使得Nehalem-EX会催生一个全新的八路及八路以上X86服务器市场,并将在数据库、ERP等关键业务领域和大规模虚拟化整合领域冲击传统RISC阵营。
据了解,以六核至强7400相比,虽然仍然使用45纳米工艺,但Nehalem-EX的架构发生了重大变革,包括:1)使用QPI总线,取代前端总线架构,最多拥有4条QPI Link;2)集成DDR3内存控制器,有4个内存通道接口,通过设置外置缓冲芯片,每处理器还可最多支持16条内存;3)拥有8个内核;4)采用超线程技术,每CPU可实现16个线程并行;5)23亿个晶体管,L3缓存由16MB提升到24MB。光看这些规格数据就让人咋舌,据称其数据库性能最高可以达到3倍。
不过,在这次沟通会上,顾凡没有谈更多的性能测试数据,而是重点阐述了Nehalem-EX在可扩展性和RAS(可靠性、可用性和可服务性)特性方面的表现。由于这类高端服务器主要面向银行、电信等行业的ERP、数据库、大规模虚拟化整合等应用,并要吸引传统小型机用户,其可扩展性和可用性比性能更为关键。
22项RAS特性 让X86系统更可靠
确实如此,对于那些想从小型机转向X86开放平台的用户来说,性能往往不是问题,考虑更多的是X86服务器能否达到小机那样的稳定性和安全性。
对此,顾凡谈到,至强7500整个平台中的RAS功能将有20多条。这些特性技术集中解决三个方面的问题:一是数据保护,可以诊断哪些数据出错,利用一些CRC、ECC校验来纠正错误,如果不能纠正,可以把这些坏的数据进行隔离,以保证不影响其他数据,避免系统的重启和宕机。二是高可用设计,包括QPI Link之间的互备和热切换,内存和CPU的热切换、故障预警机制等等,以保证系统的高可用。三是降低系统计划内的宕机时间,包括系统分区管理技术、CPU和内存的热添加和热删除等。具体如下表所示:
至强7500的22项RAS功能
|
|
数据保护技术
|
Parity checking and ECC
Memory Themal Throttling
Memory demand & patrol scrubbing
Corrupt data containment
QPI viral mode
QPI rolling CRC
|
高可用技术
|
Intel SMI Lane Failover
Intel SMI Clock Fail Over
Intel SMI & QPI Packet Retry
QPI Clock Fail Over
QPI Self-Healing
SDDC plus random bit error recovery
Memory Mirroring
Memory DIMM and Rank Spaning
Dynamic CPU and memory migration
MCA-recovery with OS support
|
减少计划宕机时间
|
Static system partitioning
MCA error logging(CMCI) with OS predictive failure analysis
Physical Memory Board Hot Add/remove
Dynamic/OS Memory On-lining(capacity change)
Physical CPU Board Hot Add/remove
OS CPU on-lining(capacity change)
|
顾凡认为,至强7500已经拥有X86系统里最高级别的RAS特性,而且与小型机、大型机相比,差距也已经不大。
在操作系统和虚拟化方面,目前Novell、Redhat、微软和VMware都已经做好准备,为至强7500中的高级RAS特性提供支持,以保证可以将这些功能提供给上层的应用软件使用。比如,今天,很多用户还只是在服务器上做一些前端应用的虚拟化整合,但在至强7500平台上,由于更高的RAS特性,可以做更高端、更核心的应用整合。