神威蓝光计算机的国产CPU
神威1600
在中国的3台千万亿次超级计算机系统当中,虽然“神威蓝光”并不是性能最好的但是却有非同寻常的意思,它是国内首台采用国产自主CPU的千万亿次超级计算机系统。
千万亿次高效能计算机
国内超级计算机排名第一的天河1号已经尝试着试用国产CPU,天河1号采用了国防科大研制的飞腾-1000处理器,但并不是完全采用。而神威蓝光则是跨时代的全部采用国产CPU。
早在2009年,中国工程院院士、国家并行计算机工程技术研究中心主任金怡濂就说,中国完全有能力采用国产CPU(中央处理器)芯片,在短期内完成国家千万亿次巨型计算机的研制任务。本次的神威蓝光恰好是其预言的印证。
在国产处理器三大系列当中,国防科大的飞腾系列、中科院计算所的龙芯系列都在此前有过风光无限。本次轮到江南计算所得神威系列。
神威1600处理器是江南计算所研制神威系列第三代处理器,是江南计算所与高效能服务器和存储技术国家重点实验室合作的项目。在高效能服务器和存储技术国家重点实验室官方网站上我们可以找到有关神威SW-3众核处理器的项目。
作为首台全部采用中国国产CPU构建的千万亿次超级计算机系统,其对于我国超级计算机领域来说可以称得上是一座里程碑。济南超算中心(神威蓝光超级计算系统)的建设成功,实现了国家大型关键信息基础设施核心技术的自主可控目标。据了解,神威蓝光前期主要会应用在海洋科学、新药研制、气象预报、金融分析、工业仿真等领域中的一些重点课题领域,并保证应用稳定运行。
至强融核Xeon Phi,采用MIC(Intel Many Integerated Core)架构
美国SC12大会上,英特尔正式发布了至强融核Xeon Phi,采用MIC(Intel Many Integerated Core)架构,用于高性能并行计算。MIC基于X86架构,支持多种并行模型,OpenMP、pThread、OpenCL、MPI等并行编程语言,采用C、C++和Fortran三种语言进行软件移植开发,特点以编程简单(引语方式)著称,工具链丰富。
MIC基于X86架构,是众核协处理器,MIC为Xeon Phi产品的架构总称,Xeon Phi的第一代产品的架构代号为“Knights Corner”。Knights Corner采用Intel 2012开始使用的3D“三门”晶体管技术,使用22nm工艺制造,MIC卡含有50个以上的核,每个核可以支持4个线程,双精性能超过1TFlops,含有512bit的向量宽度,支持8个双通道GDDR内存控制器,内存大小为6GB或8GB。
MIC卡图解
MIC卡通过PCI-E连接到主板上,通过一个8PIN和一个6PIN电源线供电,功耗在225-300W。
如今,苹果等计算厂商在手机领域异军突起,手机厂商诺基亚进军上网本市场,网络厂商思科以“加利福尼亚项目”进入服务器市场,电信运营商中国移动对云计算兴趣浓厚。透过这些看似扑朔迷离的“越界”现象,我们触摸到的是基于计算的产业融合的脉动。
在英特尔中国研究院举办的开放日上,中国计算机报记者独家采访了英特尔高级副总裁兼CTO贾斯汀,探究产业融合的源头――芯片厂商的所作所为。
融合时代已经来临
记者:你的前任帕特•基辛格在去年英特尔成立40周年仪式上的演讲中,把IAEverywhere(无处不在的英特尔架构)作为计算的未来四大趋势之一。无处不在意味着计算将延伸到包括通信与消费电子在内的广阔领域,这是否标志着融合时代的到来
贾斯汀:我在今年9月举办的英特尔信息技术峰会(IDF)上说过,像电视和互联网这样的融合已经成为过去。我们正在进入一个新时代――无处不在的信息、访问和新闻,以及获取这些信息的能力。我们需要能够在任何设备上随时随地提供这种体验。我们想的是如何让信息跟着用户,不管使用什么设备,周围环境如何,以及如何使用信息。这是问题的核心。
记者:的确,用户的需求已经超越了融合,但无论是从技术架构还是产品而论,产业界是否已经做好了充分的准备
贾斯汀:我想,消费者和终端用户不关心IA Everywhere。英特尔遇到的压力是关联性的――各种不同的情况和所有这些不同的体验都与英特尔相关。我们的产品过去主要是注重于PC领域。我们正在做的就是把英特尔架构扩展到PC领域之外,进入电视和移动等领域。在汽车、网络等很多领域,用户都看不到计算机的身影,看不到Intel Inside这个标志。但在这些领域,英特尔都将扮演重要角色。
记者:IAEverywhere的边界在哪里
贾斯汀:边界取决于我们的想象力。当2004到2005年间我们考虑开发凌动处理器时,当时任何人都想象不到它对英特尔业务带来的巨大影响。大多数人只是担心,它会不会蚕食笔记本电脑市场。事实上,凌动不仅推动了上网本这种新机型的出现,而且让我们发现IA架构能够用于之前没有想象到的广泛领域。我想说的是,我们往往受自己思维的限制,而凌动确实扩展了我们的思维。
记者:那么,IA架构是否将渗透到包括通信及嵌入式在内的所有领域
贾斯汀:你可以这样预期。我们常把凌动处理器称作“我的新IA”,它是一个非常小的处理器。当然,我们也在研究如何把它用于更高性能的领域。从中或许可以看到融合的含义。对于英特尔来说,这意味着整个信息行业能够在英特尔架构上融合。
记者:如今,低功耗已经不仅仅是嵌入式系统的标志,进而成为整个计算行业追求的目标,超低功耗的凌动处理器还应该有哪些应用前景
贾斯汀:目前,我们的研发投入主要还是在传统市场。在融合时代,或许应当改变这种状况。我想,凌动带来的低端市场应当得到更高的投入,我们已经在讨论这个问题。
或许几年后,当凌动服务器首次出现时,每个人都很吃惊:什么凌动服务器当然,英特尔服务器部门可能会不太高兴。但行业会做出自己的选择,而我们必须对此作出响应。我们从来没有对开发基于凌动的服务器产品感到无所谓。
SoC:融合时代的基石
记者:如果说我们曾经“间接地”从性能上或者说从制程技术进步带来的晶体管开关速度的提高上感受摩尔定律的神奇,那么,我们将会直接地从功能上或者说从SoC(片上系统)上感受并体验摩尔定律的魅力,因为晶体管集成度在没有达到一定规模前,SoC便无从谈起。你认为是这样吗
贾斯汀:在晶体管制造工艺上的投资让我们继续受益匪浅,但由于散热的原因,时钟速度并没有大幅提升。我想,大多数晶体管投入将用于提供片上系统的丰富功能。但其中一些投资将用于制造基于多核的更强大芯片,而不是速度更快的单个核心。单个核心受到很大的限制。在这种情况下,我们加大投入制造多核处理器。我想,摩尔定律的延续在很大程度上取决于片上系统的超大规模集成,而不是推动原始性能的提升。
记者:手机是否应该是计算与通信融合后SoC的用武之地呢
贾斯汀:我们正在首次利用32纳米技术开发SoC制程技术,我们将在一个季度内推出首个SoC产品,它具备你刚才所说的集成通信与计算的能力。实际上,英特尔实验室正在与技术制造商合作,在32nm SoC制程上验证所有射频电路,目标是在同一个芯片上集成通信和计算功能。
记者:未来,SoC能够改变HPC(高性能计算机)这一当今的庞然大物吗
贾斯汀:18个月前,我们开展了一个针对HPC的SoC研究项目。我们认为,大幅降低HPC浮点运算功耗的唯一方式,就是继续在单个芯片和片上系统上集成更多的电路。正是由于晶体管集成度的提高,使得今天任何一个小小处理器的性能都要远远胜过当年占地170m2、功耗达150kW的首台电子管计算机ENICA。HPC的未来将是片上系统。
记者:在通用计算领域,我们看到GPU正在嵌入到CPU。未来,这种SoC不应是简单地集成了GPU,而应该充分地利用GPU并行计算的优势,你认为CPU+GPU能给计算带来哪些变革
贾斯汀:我们确实正在向市场推出这样的产品。
我们将在片上集成CPU和GPU,它将是SoC,而不是在封装(SoP)上集成。人们会想,如果在芯片上集成资源,可以用它做什么呢,如何进行编程我想,最大的变化是开发编程模式,让程序员能够在应用开发中更加有效地集这两种架构之长。
长远地看,我们的工作一直是围绕IA架构进行优化的,针对通用计算和特殊计算的特点,集成包括图形计算在内的不同类型处理器。这也可以说是IA Everywhere的一个例子。
数字电视:融合的下一个主战场
记者:今年9月,英特尔在IDF上发布了CE4100数字电视芯片。为什么英特尔只将其用在机顶盒上,而不用它做个数字电视的解决方案
贾斯汀:是的。我们在广播领域没有产品。但我们接入卫星网络时,我们将集成接收器。我们现在关注机顶盒,未来几年,我们将更关注电视,你会看到英特尔芯片用于很多电视。我对此不担心。CE4100确实为机顶盒而不是电视进行了优化。电视的要求有很大不同,因此,我们必须抓住机会,我们选择了机顶盒,并将很快进入电视领域。
记者:数字电视中的射频调谐未来是否也能集成进来
贾斯汀:这比蜂窝射频要简单很多。
记者:电视与计算机存在着行业知识上的差异和用户需求的不同,当英特尔涉足更多陌生领域时,如何应对这些来自行业知识和用户需求方面差异性的挑战
贾斯汀:我认为,在我们所涉足的市场中,机会不仅在于我们的技术能力,还在于我们的投资能力。从某种角度来说,在英特尔内部,我们是自我限制的。但是你会发现,英特尔将在选择的基础上追逐这些机会,并不是想要满足所有用户群的需求。我们还是会非常谨慎地选择机会,不轻易越界一步。
记者:CE4100功能多,视频处理性能强,而且功耗仅有7~8W。如果把CE4100用在笔记本电脑上是不是更具竞争力
贾斯汀:机顶盒的平台要求与笔记本电脑有很大的不同。如果要在笔记本电脑或上网本中使用,就必须与PC兼容,比如说,大多数SoC不支持PC的PCI总线。你可以增加PCI,但这就会增加SoC的成本,而机顶盒制造商不愿承担这个成本,消费电子产品用户也不想支付。因此,这是个成本问题,而不是技术问题。
记者:如今,人们只需要一根网线,就可以用笔记本电脑欣赏音视频节目。我个人认为,电视最终会借鉴PC的架构,或者说就是一个大屏幕的平板电脑挂在墙上。你认为呢
贾斯汀:我并不希望能与我的电视进行互动――就像用索尼的PSP那样。你知道人们是怎么说的:10英尺体验与2英尺体验完全是两回事。但是我想你提的问题很重要。iPhone的意义之所以很重要,是因为它是第一款能够像电话一样运行的计算机。我认为,对电视来说,也是可能的,但是我们还远远没有到达那一程度。我想不会有人能开发出一款类似于iPhone的电视机。但是有人肯定已经开发出了人性化界面,这对于电视体验来说十分独特。它不是PSP体验,它具有电视的功能,同时也具有很多计算的功能。
芯片厂商的软件观
记者:在2000年担任英特尔实验室主任时,你给英特尔软件部门提出了“四要四不要”的研究准则:要做新语言,不做旧语言;要做动态编译,不做静态编译;要做线程级并行,不做指令级并行;要做二进制级优化,不做源代码级优化。为什么提出这样的原则
贾斯汀:我认为,当我们前进时,这些理念都很重要――任何一项都很重要。我们已经在指令级上充分利用了并行,因此,必须看到更高层次的并行化――快速并行化和现在的数据并行化。动态编程是未来的一大趋势,因为动态语言使程序员的工作效率更高。我认为,过去十年的技术支持了我们的开发工作。我的意思是:如今,大部分程序员只用动态语言编程。Java或任何脚本语言都是动态语言,它们能够使我们高效、方便地工作――这正是我们所期待的。
记者:动态编译是否也是为了实现IAEverywhere
贾斯汀:我们肯定希望,无论英特尔架构在哪里,人们都能够利用动态编程、动态编译技术。事实上,我们围绕“针对安全性和隐私应用程序而使用动态编译技术”开展了一项调查。我们认为,这是一种将被广泛使用的技术,不仅仅用于英特尔架构。
记者:为什么强调二进制优化而非源代码优化
贾斯汀:我们正在研究二进制优化,以期简化设计并且使成本效益更高。现在,我们必须进行高级别的纯硬件竞争。如果你在低成本低功耗的处理器中使用二进制优化,那么,二进制优化未来还将起到关键作用。但将这些产品推向市场,还需要几年时间。
记者:我们还应看到软件在融合时代扮演的重要角色,不久前我采访了英特尔Lab在北京的软件研究部门,作为处理器厂商的英特尔在软件领域的努力,给我留下了深刻的印象。这对基于IA平台的创新有什么意义呢
贾斯汀:是的,你知道我们十分努力,尽量减少对操作系统开发的依赖。我想,你将看到IA架构从根本上是支持在独立于操作系统的应用程序级别上出现更多的创新。我们对这一点做了优化平衡,你将在未来几年看到效果。但是,想要在无须编译器、工具、操作系统、hypervisor等供应商与你合作的条件下使硬件不断发展,这确实是一个挑战。我们在宣传方面已经做了很多工作了。但是只要可能,我们宁愿让开发商利用这些新功能,并减少应用程序编程与硬件之间的依赖程度。
融合时代的创新与挑战
记者:计算、SoC和数据业务正在边缘化传统通信厂商。现在,数字电视又使得传统的电视厂商面临同样的境地。英特尔的数字电视平台单片解决方案在大大简化和标准化电视机硬件系统的同时,也严重地挤压了传统的电视产业链;与此同时,一个巨大的数字电视节目消费市场正在浮现。这无论是对电视机市场还是对电视节目市场都是颠覆性的。您的看法是什么
贾斯汀:是的,但我认为还有其他因素。行业已经开始了解互联网正在如何改变电视,开始从不同的角度了解英特尔架构的价值。三四年前,我和帕特(基辛格)在日本和韩国看到英特尔还与消费电子关系不大。但这种情况已经发生了变化。很多公司在考虑退出硬件业务和芯片业务。他们确实期待英特尔提供电视和互联网的集成。因此,不仅仅是说技术让这成为可能,而是消费电子公司希望如此。
记者: 以往,我们看到的是Intel Inside,英特尔通过芯片技术在幕后推动着产业的发展;如今,我们看到的是Intel Outside,英特尔站在台前推动着并行、虚拟化等软件技术发展。未来,英特尔还是像以前那样只是做平台供应商呢,还是会走得更远
贾斯汀:我想,我们将会继续在那些没有与客户发生直接竞争的领域为英特尔寻找机会。同时,我们将忠实于英特尔的根源所在,并且继续充当“建筑模块”供应商,未来会有越来越多“建筑模块”,尤其是软件“建筑模块”出自英特尔。
我们将继续开发工具功能,提高多核和众核的编程效率;继续提供更多完整解决方案,但这些解决方案并不标明英特尔品牌。其实,我们一直在做这样的工作,例如,新款轻薄型笔记本电脑就是基于英特尔一揽子设计的。未来,我们要与OEM、ODM甚至服务提供商紧密合作,提供基于英特尔产品的解决方案。
记者:英特尔的软件应用是为了让CPU更好地明白是怎么用的,还是英特尔想把一些应用集成到CPU中
贾斯汀:两者都有。我们希望扩展和强化英特尔架构,进行图形方面的处理工作。比如我们在今天的开放日上就展示了图形处理等很多软件应用方面的研究成果。我们想把这些功能集成到处理器和产品中。
记者手记
产业格式化进行时
貌似平静的海面下,可能早已潜流涌动,当潜流显现出它的力量时,有些事情可能就于事无补了。
多年来,人们常常把芯片速度与摩尔定律等同起来,然而,从字面上看,摩尔定律只与晶体管集成度相联。摩尔定律的真正魅力在于晶体管集成度的线性增长:当单一晶体管速度无法持续提升时,人们可以用多个晶体管的并行来提升速度;集成度的提升还使得芯片厂商可以将更多的功能乃至整个硬件系统集成在一个芯片上,也就是片上系统(SoC)。
无疑,SoC是融合时代主要的技术驱动力。对于用户而言,SoC将会带来功耗降低、体积缩小、功能增加、购买与使用成本下降等诸多好处,而对于市场而言,SoC将硬件系统的复杂性完全封装在一个芯片中,在大大压缩产业链的同时,也十分显著地降低了市场的准入门槛,这意味着整机市场竞争更为激烈,而绝大部分电子零配件厂商的生存空间消失殆尽。
如果说这种现象正在手机市场上蔓延的话,那么,不出几年,电视机厂商就会重蹈覆辙,因为当英特尔数字电视单片解决方案面市后,在IPTV市场上,人们将会看到这样的现象,诺大的数字电视机壳内,能让电视机厂商安装的东西已经没有几个了。失去了硬件复杂性的屏障后,电视机厂商在硬件上还能比拼什么呢
现有产业格局的融合、重组只是格式化的结果。而产业将会以计算技术、IP技术为标准进行格式化。今天,信息的数字化已经遍及各个领域,而IP化又是数据传输的发展趋势,因此,无论是在信息的存储、传输还是处理上,计算均占有无可替代的位置。
那么,我们该如何看待伴随着产业格式化的品牌集中化呢或许,我们可以从PC市场的发展中受到一些启发。PC市场曾经品牌林立,因为PC的单台利润不错,各路诸侯日子过得都不错。而如今,大部分市场被屈指可数的几个厂商把持,但竞争的惨烈史无前例。从厂商的角度看,这可不是件好事。但从用户角度看,则截然相反。
如果认可计算技术将格式化产业,那么,PC市场的竞争场景就一定会在融合市场重演。
无疑,用户将会拥抱融合,而作为厂商,现在就要琢磨琢磨。
近n来,随着自主CPU技术取得长足进步,助力神威太湖之光一度在TOP500刷榜,过去对在技术上对我国严防s守的境外寡头纷纷改变过去严防死守策略,赴中国大陆开展合资或合作,高通、IBM、英特尔、ARM、AMD等公司均在大陆找到了合作伙伴。
当下,国内(桌面、服务器)CPU与外商有较大差距,除了海光(Zen)在性能上可能具有一拼之力外,其它国产CPU在商业市场上面对英特尔、AMD基本不具备竞争力,因而只能在篱笆墙内的市场角逐。而为了能够进入篱笆墙内的市场,就必须符合自主可控标准,进而导致一个有趣的现象,那就是从国外买源代码,买IP做SoC设计的厂商都宣传自主研发、自主可控。在篱笆墙内的市场,龙蛇并起,环境极度恶劣,可谓是群雄逐鹿互相倾轧。
到底哪家公司有望问鼎中原呢?
铁流对篱笆墙内市场和各家CPU公司的发展做一个预测。
申威
申威采用自主定义的SW64指令集,有别于引进的CPU指令集,是完全自主的,知识产权和自主研发能力不受限制。这里再强调一下,DEC已经挂了20年了,别给SW找爹了,SW不是Alpha指令集。不会被断供、制裁,或停止收取的风险,可以威关键领域提供长远的、可控的供应链和技术支撑。能同时解决“下绊子”、“卡脖子”、“捅刀子”等问题。
申威最大的特点就是独立自主,安全可控。申威CPU的结构设计、逻辑设计、正确性验证、物理设计、及测试封状等由我方独立完成。申威CPU不存在人为安全隐患,现行木马、病毒无法攻击,开展了高等级安全的特色设计。
申威CPU的性能也很不错,基本国内第一梯队,而且是超算加速器、服务器CPU、桌面CPU、嵌入式CPU全线发力,都做得不错,这个很难得。其中,SW26010助力神威太湖之光,新一代的众核芯片将用在E级超算上。
SW的短板在于软件生态,以及受体制机制限制,在商业化力度非常弱。SW的未来应该是特定应用和J的一些应用,在服务器CPU方面会和飞腾发生冲突。必须指出的是,相对于个别厂商借助大环境在全国各地圈地要市场要政策,SW的表现非常佛系,压根就没有去借政策东风圈地,反而按照自己的节奏不紧不慢,稳扎稳打。这会让SW的路子走得比较稳,但也会使SW失去很多机会,失去不少市场。
铁流认为,在篱笆墙内的市场SW会有一席之地,能够完成很多关键任务,会取得比较耀眼的成绩,但市场份额会比较一般。
0条评论