从幼稚到成熟 龙芯服务器产业化风雨8年
2010-04-27 IT168网站 编辑:洪钊峰
【IT168 专稿】日前,基于中国自主知识产权CPU设计的龙芯服务器引发业界关注。4月17日,由中国科学技术大学和深圳大学联合研制的,基于新一代龙芯3A四核处理器的万亿次高性能计算机系统KD-60通过专家鉴定;4月23日,曙光公司高调宣布推出基于龙芯3A的刀片服务器CB50-A,并公布了未来基于龙芯CPU的产品路线图和一揽子计划。
为方便大家对龙芯服务器产业化历程有一个清楚的认识,IT168服务器频道梳理了过去8年来,龙芯CPU在服务器、高性能计算机等企业级IT产品领域里的重要事件。正如龙芯总设计师胡伟武在曙光龙芯刀片服务器发布现场所言,“我最早认为龙芯是一个项目,后来认为这是一个产品,现在才发现龙芯其实是一个产业链。”风雨八年,龙芯之路,并不平坦!
龙腾服务器:基于龙芯1号
2001年10月,中科院计算所研制成功我国第一款通用CPU——“龙芯1号”。2002年9月曙光推出了完全自主知识产权的"龙腾"服务器,采用了"龙芯-1"CPU、曙光和中科院计算所联合研发的服务器专用主板以及曙光LINUX操作系统,这是国内第一台完全实现自有产权的服务器产品。
据了解,当时龙腾服务器的CPU主频只相当于英特尔奔腾2的水平,性能较弱,适用于对计算能力要求不高的一些低端应用领域,如VOD点播系统,另外一个重要领域就是对安全性要求非常敏感的领域,如在政府、军队、安全等领域引起了普遍关注。今天回过头来看,龙腾服务器有很强的象征意义,市场化以失败告终,曙光此后数年内也没有再更新或发布新的龙芯服务器,但该产品无疑开启了国产服务器全自主化、产业化的道路。
龙芯高性能计算机:基于龙芯2F和龙芯3A
2007年12月,首台采用国产高性能通用处理器芯片“龙芯2F”和其他国产器件、设备和技术的万亿次高性能计算机“KD-50-I”在中国科学技术大学研制成功。“KD-50-I”万亿次计算机采用单一机柜,集成了336颗“龙芯2F”处理器,理论峰值计算能力达到1万亿次/秒。“KD-50-I”采用了高密度节点设计技术,在高度不到4厘米的1U标准机箱内部紧密部署了12个处理单元,组成1U12P高密度节点结构,硬件系统采用龙芯2F处理器、华为千兆以太网交换机及曙光服务器前置机等,系统软件以开源软件为主,具有兼容性强、易维护、易升级、易使用等特点。
2009年是龙芯的转折年,龙芯3A、龙芯2F3、龙芯2号抗辐照SOC流片成功;龙芯2G和龙芯3A+完成流片;龙芯南桥、龙芯2G+和龙芯3B即将完成设计;龙芯2H和龙芯3C的设计也开始部署。在全面掌握65nm工艺的产品设计技术后龙芯开始32nm工艺的设计。龙芯3号在服务器、高性能计算机等领域的市场推广和应用研发也在快速发展。
2010年4月,中国科学技术大学和深圳大学联合研制成功基于新一代龙芯3A处理器的万亿次高性能计算机系统KD-60。KD-60在18U高的机柜中集成了80余颗“龙芯3A”四核处理器,理论峰值计算能力达到每秒1万亿次。与龙芯2F相比,龙芯3号制程工艺从90纳米变成了65纳米,主频1GHz,晶体管数量从4700万个变成了4.25亿个,从单核直接进入了四核(龙芯3A)和8核(龙芯3B)设计。与KD-50-I相比,KD-60体积减小了三分之二,相当于家用洗衣机的大小,整机功耗只有2381瓦,降低了56%。
KD-60系统硬件由10个1U计算节点(部署2块主板,共8个处理单元和1个监控单元)、1个2U服务节点和显示终端、2个1U的48端口千兆以太网交换机组成;系统软件仍然以开源软件为主,其中包括针对龙芯3A处理器体系结构专门优化的GotoBLAS 2数学函数库,以及自主研发的图形化系统监控软件 KD-60 Monitor 1.0。
据介绍,龙芯高性能计算机主要适合于高性能计算教学和创新型人才培养,可应用于有大规模科学与工程计算需求的相关学科研究,以及军事科学、国家安全和国民经济建设等诸多方面。
龙芯刀片服务器:基于龙芯3A
如果说中科大的龙芯高性能计算系统很大程度上仅局限于科研领域,那曙光新一代的龙芯服务器开始让龙芯3号走向产业化。
2010年4月,曙光高调发布新一代龙芯服务器:基于龙芯3A的刀片服务器CB50-A,可安装在曙光TC2600刀片机箱中。该产品同时采用红旗Redflag linux操作系统,兼容主流linux应用软件,是一款从刀片服务器硬件、底层软件、处理器到操作系统完全国产化的划时代服务器和高性能计算平台。
CB50-A采用双处理器架构,共有8个处理器核心,峰值性能达32Gflops,支持最大64GB内存,单刀片功耗不超过110W。CB50-A有很好的通用性,X86架构下具有源代码的信息服务和科学计算应用能够通过交叉编译的方式平滑的移植到龙芯刀片上。在一个42U高的机柜中,可安装6台TC2600,每个TC2600支持10片双路CB50-A,累计每个机柜最多拥有120个龙芯3A四核处理器,480个处理器核心,最大处理能力1920Gflops,最大功率不超过8KW,具有很高的计算密度和能效比。
曙光TC2600刀片服务器机箱
据介绍,目前曙光公司已经在龙芯刀片服务器上成功移植和优化了Apache、气象预报领域的MM5、生命科学领域的BLAST等10多个具有重要影响的行业应用软件,并与红旗linux操作系统、人大金仓数据库、天融信网络安全系统和织女星云计算软件等相关上下游产业链结成紧密协作。曙光总裁历军表示,龙芯刀片服务器和机群主要针对科研、机关、军队、公安系统、信息服务领域、石油气象等领域,预计2010年龙芯刀片的销量将达到3000片,到2014年达到2万片的规模。
未来的龙芯服务器和龙芯超级计算机
2009年,中科院计算所已经明确了龙芯系列处理器的定位,其中龙芯1号CPU及其IP主要面向嵌入式应用,龙芯2号CPU及其IP面向高端嵌入式和桌面应用,龙芯3号多核CPU面向服务器和高性能机应用。据规划,龙芯3号将有多个版本:已经发布的四核龙芯3A,后续将推出的八核龙芯3B及16核龙芯3C等。
曙光计划今年中推出的下一代千万亿次超级计算机曙光6000,将使用部分龙芯3A来构建。另外,下半年曙光将推出基于龙芯处理器的Twins高密度刀片,双路和Twins机架服务器等,今年底明年初还会推出四路SMP刀片和四路SMP机架服务器,以及为特殊单位定制的保密服务器等。