神刀安全网

“神威太湖之光”到底有多强?

据新华社6月20日消息,新一期全球超级计算机500强榜单20日公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数首次超过美国,名列第一(中国有167台HPC入围TOP500,美国是165台)。

自“天河二号”荣登TOP500榜首并6度蝉联桂冠以来,一直有社会舆论攻击“天河二号”使用美国Intel的CPU,因而不具备技术含量,甚至有媒体引用所谓业内人士声称“只要把足够多的手机芯片连接起来,性能轻松超越天河二号”,一言蔽之,就是“天河二号”是组装货,中国并不掌握超算核心技术。

这种论调正确与否暂且不论,本次“神威太湖之光”采用了全自主技术则是对上述舆论的有力回击,不仅实现了在超算领域彻底扭转在技术和信息安全上受制于人的局面,还使美国对中国四家超算中心禁售Intel至强PHI计算卡成为笑柄,再次在信息技术领域实现了“凡是买不到的,中国人自己都能做出来”。

“神威太湖之光”到底有多强?

一台超算由什么组成

先来分析此前的一种论调:超算的全部技术都在CPU吗?

超算系统可以分为软件系统和硬件系统两部分。

超级计算机硬件系统主要由高速运算系统、高速互连通信网络系统、存储系统、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。具体来说:

高速运算系统负责逻辑复杂的调度和串行任务和并行度高的任务,可以是采用同构计算(纯CPU组成计算节点),也可以采用异构计算(CPU+加速器组成计算节点);

高速互连通信网络由infiniband、高速以太网、自定制互联机制构成,将所有计算节点连接起来,使其成为一个整体;

存储系统由内存和外存组成,负责数据交换和储存;

维护监控系统保障超算不死机、不出错,毕竟每隔几秒出一次错,死一次机,这种足以让超算的使用者精神崩溃;

电源系统包装能源供应;

冷却系统帮助超算降温,防止出现超算过热而造成的不良后果;

结构组装设计是将上述系统装载到一起,在保障性能和稳定性的基础上,实现机柜体积最小。

“神威太湖之光”到底有多强?

运算系统机舱内部

超级计算机软件系统主要包括操作系统、编译系统、并行程序开发环境、科学计算可视化系统等四个重要组成部分。具体来说:

操作系统系统主要包括对同构技术或异构协同支持,高效能支撑扩张,基础服务内核,全局并行文件系统;

编译系统的功能是支持C、C++、Fortran77/90/95等编程语言,支持OpenCL、OpenMP、MPI等并行编程语言,支持编译优化;

并行程序开发环境的功能是提供程序接口,支持应用程序的调试和性能分析;

科学计算可视化系统由海量数据服务模块、并行绘制与显示模块和可视化映射与操作模块组成。

因此,运算系统、存储系统、互联系统、操作系统、基础库、应用软件,以及监系统控、冷却系统、电源系统等都是超算的重要组成部分。因此,一些人称因国产超算使用美国Intel的CPU,因而不具备技术含量,将CPU等同于超算的全部技术的说法显然是非常不科学的。

超算不是简单堆砌CPU

有媒体引用所谓业内人士声称,“把足够多的手机芯片连起来就能超越天河2号。”但实际上,这个说法也是值得商榷的。

因为堆CPU也是一个技术活,体系结构设计的不好,高速互联网络做的不行,系统软件做的不好,储存列阵做的不行,即使堆再多的CPU,超算的性能也上不去。简单粗暴的堆砌CPU根本不可能制造出一台超级计算机,更不要说是能与天河2号相匹敌的超算。

另外,哪怕掌握了正确的堆砌CPU的方法,也不是单凭靠堆CPU数量就能获得一台能与天河2号相匹敌的超算。原因何在? 因为超算建设不是简单的搭积木式的堆砌CPU——即便堆砌了海量的计算卡,但受制于其他方面,比如高速互联网的技术水平,也会导致无法到达理论计算性能。

具体来说,高速互联网络的难点在于超算的计算节点之间传输的数据量巨大,延迟要求严格,当互联网络效率不足,就会导致数据拥堵,大幅降低超算整机系统效率。而超算的计算节点越多,对互联网络的要求也就越高。因此,即使想通过堆砌CPU来提升运算能力,也会受限制互联网络的性能,造成这种做法并不能无节制的提升超算的性能——受制于诸如互联网络以及其他方面的瓶颈,整机效率被拉低,导致实际性能并没有因为堆砌了更多的CPU而有所提高。

另外,堆砌过多的CPU还存在功耗过大、机箱体积过大等问题,非常不利于日后的运营维护和使用,在超算市场基本不具备市场竞争力。 正是因为高速互联网络的重要性, 相对于在2015年才对中国四家超算中心禁售Intel计算卡,高速互联网络却早就被美国列入技术封锁的名单。

在软件系统方面,控制少量计算节点和控制大量计算节点对软件系统的要求近乎于天差地别。软件系统必须保证每个超算计算节点的性能被发挥到最大才能充分挖掘出硬件上的潜力,否则,就会影响超算的整机效率。

另外,TOP500头几名的计算节点大多在数千近万,甚至一万个以上,某几个计算节点损坏,并需要更新是常有的事。当计算节点损坏时,软件系统必须做到部分节点损坏时不会发生死机、报错等情况,不影响计算任务的持续。

因此,如果没有一个好的体系结构,那么CPU的性能将无法全部发挥出来,而且堆砌的CPU数量越多,整个系统就越复杂,对高速互联网络、存储列阵、监控系统、冷却系统和软件方面的要求也就越高,整机效率的提升也就越难。而体系结构设计能力水平不够高的情况下,单纯堆砌CPU数量,反而会降低整机效率,无法提升整机性能。

“神威太湖之光”牛在哪里

“神威太湖之光”到底有多强?

TOP10新排名

“神威太湖之光”刷新TOP500排行榜,依靠的是其强悍的双精浮点性能——其高达125PFlops双精浮点峰值和93PFlops稳定性能让世人惊叹。其实,除了拥有举世无双的双精浮点性能之外,“神威太湖之光”还拥有整机效率高,整机功耗低、性能功耗比高,整机体积小等一系列优点。

转载本站任何文章请注明:转载至神刀安全网,谢谢神刀安全网 » “神威太湖之光”到底有多强?

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址