如何看待天河二号超算使用国产Matrix-2000加速卡升级?
上周TOP500公布了2018年上半年的超算500强名单,美国的Summit超算如愿以偿夺得了第一,为美国人赢回了丢失已久的TOP500冠军,而且一举包揽了TOP3中的第一、第三。中国最强超算神威·太湖之光名列第二,这两年来并没有升级,但是第四名的天河2A超算实际上已经今非昔比,它曾经是TOP500六连冠,但之前使用的是英特尔加速卡,在被美国禁止出口之后,广州超算中心使用国产Matrix-2000加速卡升级了天河2A超算,性能从549PFLOPS提升到了979PFLOPS。
天河2号是位于中国广州超算中心的一台超算,它使用了Intel至强E5-2692 12核处理器及Xeon Phi 31S1P加速卡,总计拥有312万个核心,整机功率也达到了17808千瓦。理论性能依然是549PFLOPS(千万亿次),Linpack峰值性能3386PTFLOPS,从2013年6月份到2016年6月份它的性能都没有变化,连任了六次TOP500冠军。
天河2号原本有后期升级的,但是2015年美国政府颁布禁令,严禁英特尔等公司向中国四家超算中心出口高性能计算芯片,这样使用英特尔Xeon Phi加速卡的天河2号就不能再使用美国公司的高性能芯片了。
2017年9月份广州超算中心宣布年底前升级天河2号超算系统,使用国产加速器Matrix 2000取代原本的英特尔Xeon Phi加速器,升级后的天河2号被称为天河2A,之前的海内外报道中也使用过天河2A这个称呼,不过它真正的升级还是去年底,这才是名副其实的天河2A,浮点性能从之前的549PFLOPS提升到了9497PFLOPS。
从升级后的情况来看,天河2A不只是用国产加速器取代英特尔加速器那么简单,网络结构也从原来的10Gbps升级到了14Gbps,延迟从157us降至1us,内存容量从14PB升级到了34PB,存储容量从124PB升级到了19PB,带宽翻倍到1TB/s,而功耗则从178MW降至169MW,能效大幅提升。
天河2A升级的关键就是上面这个Matrix 2000加速器,它使用的是国产芯片,架构、来源一如既往地神秘,毕竟跟国防科大有关,网上能找到这个资料说这个芯片是天津迈创公司出品,每个加速卡使用了4颗Matrix 2000芯片,每个Matrix 2000由128个内核组成,频率12GHz,每周期能执行16个双精度运算,处理器峰值性能为245TFLOPS。
Matrix 2000处理器的众核架构让人联想到了太湖之光使用的申威处理器,不过后者是基于Alpha架构魔改的,Matrix 2000架构不确定不是ARM,考虑到国防科大之前公布的处理器路线图,整数架构应该是ARM,但是矢量单元依然是国内魔改,官方资料里提到过这是自定义的256bit VFU矢量单元。
另外,Matrix 2000处理器的TDP功耗为240W,封装面积66x66mm,制程工艺未知,但是从发布时间来看,大概还是28nm节点生产的,
这件事情对于中国来说可以称得上是因祸得福:正是因为美国的封锁,导致了国产自主研发的加速器芯片强势崛起,反而是现在的英特尔受到了更大的影响。
2015年,美国商务部发布了一份公告,限制英特尔公司向国家超级计算广州中心、长沙中心、天津中心和国防 科技 大学四家单位出售“至强Xeon”处理器芯片。当时,我们的天河2号超级计算机用的就是英特尔的Xeon Phi加速卡,正准备升级的计划受到了阻碍。
然而限售令公布后,天河2号系统主任设计师、国防科大教授卢宇彤曾回应,“按照原定计划,天河二号拟在今年进行升级。尽管此次美方对天河二号升级所需英特尔Xeon处理器的进行限售,对原定升级计划有一定影响, 但我们早有准备,绝不会影响天河2号从55PFLOPS升级到100PFLOPS的既定目标 。
果不其然,在之后不久国防科大就公布了自主研发的中国计算加速卡Matrix-2000,它采用了通用计算数字信号处理器(GPDSP)的方案,不仅完全替代了英特尔的Xeon Phi加速卡,升级后的“天河2A”超算在性能提升到100P的同时,功耗几乎没有增加!
而对于英特尔来说,没有了中国这个肯花钱投资超算的大国,Xeon Phi加速卡的命运也不可避免地走向了衰败。天河2号曾投资30亿元,用了32万块Xeon处理器和48万块Xeon Phi加速卡,而后来3倍性能的神威-太湖之光才花了18亿,最主要的原因是采用了自主的申威260众核处理器,可想而知天河2号曾为英特尔创造了多少利润。
就在前不久的7月23日,英特尔宣布停产8款Xeon Phi 7200处理器,意味着该产品线正逐步被放弃。英特尔也曾计划使用10nm工艺制造代号Kinight Hill的新一代Xeon Phi,但由于市场需求不振最终放弃了这个计划。
对于我们来说,这是卧薪尝胆摆脱「卡脖子」的一个经典案例;而对于美国来说,这是不是叫做搬起石头砸自己的脚?
操作系统为中国自主研发的麒麟Linux。
银河麒麟20操作系统完全版共包括实时版、安全版、服务器版三个版本,简化版是由于服务器版简化而成的。经过权威机构进行了源码级鉴定表明,银河麒麟安全操作系统主要分为三层:最底层是自己加的“既不像内核,也不像虚拟机”的东西(从银河麒麟开发手册上看主要为保证安全性、实时性等方面的任务,可自由替换加载。),上面是 FreeBSD 的内核,最上面是 Linux 兼容库。开放给公众使用的系统不包括最底层的东西。完全版的银河麒麟是内核态多线程的。
详见 !!!
速度第一效率落后
天河二号的实用性、效率难令人满意。 ,2014年6月公布的世界超算500强天河二号计算效率为617%,效率排名第一的IBM nx360M4效率高达998%,速度排名第四的日本k计算机以932%效率排名效率第十八。
高性能处理器缺少
2015年4月9日,美国商务部发布报告,决定拒绝英特尔公司向中国的国家超级计算广州中心出售至强芯片用于天河二号系统升级的申请。国家超级计算长沙中心、广州中心、天津中心和国防科技大学四家国家超算中心被列入出口管制名单。
0条评论