换个维度看中国超算 软件或成瓶颈前沿技术

2012-04-25    来源:比特网    
超算硬件以居世界前列 2012年4月19日,由科技部、教育部、超级计算机大会组委会、国际高性能计算咨询委员会以及浪潮集团共同举办的首届中国大学生超级计算机竞赛正式结束。在决

  超算硬件以居世界前列

  2012年4月19日,由科技部、教育部、超级计算机大会组委会、国际高性能计算咨询委员会以及浪潮集团共同举办的首届中国大学生超级计算机竞赛正式结束。在决赛中,清华大学以及国防科技大学在27支队伍的激烈角逐中最终获胜,并获得了参加6月份德国国际大学生超算总决赛的资格。

  随着国产超算“天河1A”在2010年获得TOP500超算排行榜第一名之后,超算再次走进了普罗大众的视野;而之前人们对超算的印象还停留在1983年亿次超算——“银河”的水平上。

  我们必须承认,经过将近30年的努力,我国超算事业取得了从亿次到百亿亿次的长足发展,在世界超算排行中也占据了重要的一席。

  软件应用成难题

  但另一方面,超算软件的发展却一直没有像超算硬件那样一帆风顺。

  超级计算机与其他计算机硬件一样,其计算能力完全是为软件和应用而服务的,只有适合大规模并行计算的软件才能让超算爆发出真正的实力。而在这方面,我国目前的“软”实力尚不能满足需要。

  在天河1A的老家,国家超级计算天津中心,主任刘光明在接受采访时表示:天河1A作为全球的顶级超算,其在功能和性能上已经达到了一流水平。但现在急需解决的是超算软件问题。

  据悉,虽然天河1A在性能上已经足够强悍,但从建成到现在的2年时间里,基于天河1A的5个应用平台仅为300多个重点客户提供过计算服务,平均每个平台只服务了60个左右的用户,这与其计算能力显然是不对称的。只能服务与少数用户的大型平台,其成本也肯定是高昂的。

  由于我国超算目前缺乏成熟和高效的应用软件以及了解应用和并行软件技术的人才,很多需要高性能计算的企业只能采取与超算中心合作开发的方式来使用超级计算机,而这显然会给企业增加不必要的成本并降低超算在实际运行当中的盈利能力。

  另一方面,天河1A超级计算机虽然拥有超过百亿亿次的计算能力,但我国目前还没有能将这些计算能力统一调度和应用的系统。实际上,天河1A目前只能将计算能力分成数个小平台来供给不同的用户使用。也就是说实际上我们花了更多的钱和时间建造了一台整合数个中小型超算的系统。如果没有统一的调度和使用能力,那么这样的系统从任何一个角度来说都是不够划算的,这就是我国超算目前面临的现状。

  左右开弓的中国拳法

  从目前的情况来看,各国和各大厂商都在超算所使用的并行计算软件领域采取了与大学合作的发展方式。

  以显卡和并行计算厂商NVIDIA为例,其先后与全球百余所大学以及厂商合作,开办了专门的软件并行计算编程课程,并与其他厂商合作推出了数量众多的支持并行计算的软件。而有了这些作为支持,很多超算也开始采用其硬件作为基础计算平台。

  显然,NVIDIA的运作方式产生了一个良性发展的生态环境。通过在教育方面的资金、技术投入换取了硬件销售额的提升以及一个全新市场的主导权。

  不过好在,我国已经开始着手解决这一问题。前面提到的大学生超算竞赛显然就是培养超算软件人才的一个好方法。有了核心硬件厂商的持续投入和大学良好的教育环境,超算软件的发展将在未来有所成就。但这显然只能从长远的战略角度解决超算软件发展的问题。

  而在解决超算软件的燃眉之急方面,我国最近同样动作频繁。日前,中国国家超级计算天津中心、天津大学,联合欧盟五国共同参与的中欧超级计算战略合作项目,23日在天津启动。

  该项目将基于“天河一号”千万亿次异构超级计算平台,开展大规模应用研究和测试,探讨未来超级计算机研制和应用技术趋势。项目组成员由中国、英国、保加利亚、挪威、西班牙、瑞士等国专家组成。

  从此次合作来看,引入外国优秀软件团队和技术人员解决以天河1A为代表的我国超算软件问题是一种快速而有效的方式。而在这种合作当中,中国显然也可以迅速培养出一批具备水平的超算软件编程人员,以解目前超算软件应用的燃眉之急。

  自主培养加中外合作是目前我国解决超算领域软件应用问题的一套组合拳。既解决目前面临的实际应用问题,又不忘长远的发展。而下一步,如何让超算成长为类似云计算的企业服务平台,让任何有高性能计算需求的企业都可以“既来之,则用之”将成为我国也是全球未来超算发展的重点。

1
3