英伟达CPU问世:ARM架构,对比x86实现十倍性能提升

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升,第1张

机器之心报道

机器之心编辑部

「只需一张 GeForce 显卡,每个学生都可以拥有一台超级计算机,这正是 Alex Krizhevsky、Ilya 和 Hinton 当年训练 AI 模型 AlexNet 的方式。通过搭载在超级计算机中的 GPU,我们现在能让科学家们在 youxian 的一生之中追逐无尽的科学事业,」英伟达创始人兼首席执行官黄仁勋说道。

4 月 12 日晚,英伟达 GTC 2021 大会在线上开始了。或许是因为长期远程办公不用出门,人们惊讶地看到在自家厨房讲 Keynote 的黄老板居然留了一头摇滚范的长发:

如果你只是对他的黑色皮衣印象深刻,先对比一下 2019、2020 和 2021 的 GTC,老黄气质越来越摇滚。如此气质,黄仁勋今天推出的新产品肯定将会与众不同。

「这是世界第一款为 terabyte 级别计算设计的 CPU,」在 GTC 大会上,黄仁勋祭出了英伟达的首款中央处理器 Grace,其面向超大型 AI 模型的和高性能计算。

英伟达也要做 CPU 了

Grace 使用相对能耗较低的 Arm 核心,但它又可以为训练超大 AI 模型的系统提供 10 倍左右的性能提升。英伟达表示,它是超过一万名工程人员历经几年的研发成果,旨在满足当前世界最先进应用程序的计算需求,其具备的计算性能和吞吐速率是以往任何架构所无法比拟的。

「结合 GPU 和 DPU,Grace 为我们提供了第三种基础计算能力,并具备重新定义数据中心架构,推进 AI 前进的能力,」黄仁勋说道。

Grace 的名字来自于计算机科学家、世界最早一批的程序员,也是最早的女性程序员之一的格蕾丝 · 赫柏(Grace Hopper)。她创造了现代第一个编译器 A-0 系统,以及第一个高级商用计算机程序语言「COBOL」。计算机术语「Debug」(调试)便是她在受到从电脑中驱除蛾子的启发而开始使用的,于是她也被冠以「Debug 之母」的称号。

英伟达的 Grace 芯片利用 Arm 架构的灵活性,是专为加速计算而设计的 CPU 和服务器架构,可用于训练具有超过 1 万亿参数的下一代深度学习预训练模型。在与英伟达的 GPU 结合使用时,整套系统可以提供相比当今基于 x86 CPU 的最新 NVIDIA DGX 快 10 倍的性能。

目前英伟达自家的 DGX,使用的是 AMD 7 纳米制程的 Rome 架构 CPU。

据介绍,Grace 采用了更为先进的 5nm 制程,在内部通信能力上,它使用了英伟达第四代 NVIDIA NVLink,在 CPU 和 GPU 之间提供高达 900 GB/s 的双向带宽,相比之前的产品提升了八倍。Grace 还是第一个通过错误校正代码(ECC)等机制利用 LPDDR5x 内存系统提供服务器级可靠性的 CPU,同时提供 2 倍的内存带宽和高达 10 倍的能源效率。在架构上,它使用下一代 Arm Neoverse 内核,以高能效的设计提供高性能。

基于这款 CPU 和仍未发布的下一代 GPU,瑞士国家超级计算中心、苏黎世联邦理工大学将构建一台名为「阿尔卑斯」的超级计算机,算力 20Exaflops(目前全球第一超算「富岳」的算力约为 0537Exaflops),将实现两天训练一次 GPT-3 模型的能力,比目前基于英伟达 GPU 打造的 Selene 超级计算机快 7 倍。

美国能源部下属的洛斯阿拉莫斯国家实验室也将在 2023 年推出一台基于 Grace 的超级计算机。

GPU+CPU+DPU,三管齐下

「简单说来,目前市场上每年交付的 3000 万台数据中心服务器中,有 1/3 用于运行软件定义的数据中心堆栈,其负载的增长速度远远快于摩尔定律。除非我们找到加速的办法,否则用于运行应用的算力将会越来越少,」黄仁勋说道。「新时代的计算机需要新的芯片、新的系统架构、新的网络、新的软件和工具。」

除了造 CPU 的大新闻以外,英伟达还在一个半小时的 Keynote 里陆续发布了大量重要软硬件产品,覆盖了 AI、 汽车 、机器人、5G、实时图形、云端协作和数据中心等领域的最新进展。英伟达的技术,为我们描绘出了一幅令人神往的未来愿景。

黄仁勋表示,英伟达全新的数据中心路线图已包括 CPU、GPU 和 DPU 三类芯片,而 Grace 和 BlueField 是其中必不可少的关键组成部分。投身 Arm 架构的 CPU,并不意味着英伟达会放弃原有的 x86、Power 等架构,黄仁勋将英伟达重新定义为「三芯片」公司,覆盖 CPU、GPU 和 DPU。

对于未来的发展节奏,黄仁勋表示:「我们的发展将覆盖三个产品线——CPU、GPU 和 DPU,以每两年一次更新的节奏进行,第一年更新 x86,第二年就更新 Arm。」

最后是自动驾驶。「对于 汽车 而言,更高的算力意味着更加智能化,开发者们也能让产品更快迭代。TOPS 就是新的马力,」黄仁勋说道。

英伟达将于 2022 年投产的 NVIDIA 自动驾驶 汽车 计算系统级芯片——NVIDIA DRIVE Orin,旨在成为覆盖自动驾驶和智能车机的 汽车 中央电脑。搭载 Orin 的量产车现在还没法买到,但英伟达已经在为下一代,超过 L5 驾驶能力的计算系统作出计划了。

Atlan 是这家公司为 汽车 行业设计的下一代 SoC,其将采用 Grace 下一代 CPU 和下一代安培架构 GPU,同时也集成数据处理单元 (DPU)。如此一来,Atlan 可以达到每秒超过 1000 万亿次(TOPS)运算次数。如果一切顺利的话,2025 年新生产的车型将会搭载 Atlan 芯片。

与此同时,英伟达还展示了 Hyperion 8 自动驾驶 汽车 平台,业内算力最强的自动驾驶 汽车 模板——搭载了 3 套 Orin 中心计算机。

不知这些更强的芯片和系统,能否应付未来几年里人们对于算力无穷无尽的需求。在 GTC 2021 上,英伟达对于深度学习模型的指数增长图又更新了。「三年间,大规模预训练模型的参数量增加了 3000 倍。我们估计在 2023 年会出现 100 万亿参数的模型。」黄仁勋说道。

英伟达今天发布的一系列产品,让这家公司在几乎所有行业和领域都能为你提供最强大的机器学习算力。在黄仁勋的 Keynote 发表时,这家公司的股票一度突破了 600 美元大关。

「20 年前,这一切都只是科幻小说的情节;10 年前,它们只是梦想;今天,我们正在实现这些愿景。

英伟达每年在 GTC 大会上发布的新产品,已经成为了行业发展的风向。不知在 Grace 推出之后,未来我们的服务器和电脑是否会快速进入 Arm 时代。

一、计算模式

使用VDP技术,构架共享计算网络,云终端桌面机共享使用中心主机(服务器)的软硬件资源,实现远程桌面,带来与单独PC桌面机相同的使用体验

1、中心主机管理软件统一实施集中管理策略,管理员轻松实现集中管控

2、每个用户按照预定策略独立使用属于自己的资源

3、现有环境无需改变,轻松部署,构建企业基于云计算理念的网络环境

二、PC模式

可作为迷你PC单独使用,也可单独上网冲浪(surfing)、享受云计算、独立运行精简Office软件,可下载数据并存储到U盘或移动硬盘。

扩展资料:

根据云终端的架构可分为ARM和X86两种。

ARM架构采用嵌入式芯片搭载Linux内核,CPU内存硬盘这些都是一体式的通常需要连接服务器使用不能单独使用,而X86架构采用嵌入式处理器,一般搭载Windows或者Android系统,CPU内存硬盘这些都是独立的并可安装独立的windows系统通常可单独使用。

-云终端

目前主流的云桌面终端架构方案有VDI、VOI、IDV三种,把云桌面办公系统都放到云服务器上属于传统的VDI云桌面架构模式,是基于服务器后端计算的,虽然数据不落地,安全性高一些,支持移动办公、支持桌面漫游,但是对服务器消耗大、硬件成本高,对网络依赖严重、对3D高清应用的运行性能也较差、外设兼容性不佳。如果更倾向终端使用体验,需要运行3D类应用的话可以采用VOI架构配合VDI架构模式的云桌面,这样仅需普通标准配置的服务器即可运行。以和信下一代云桌面为例,它不仅深度融合了VDI和VOI,还加入了IDV架构,让新硬件能支持早期操作系统,比如win7/xp等等,这对于一些只允许使用某些指定系统的用户来说适应性更高。

云手机是依托公有云和ARM虚拟化技术,最终为用户,客户在云端提供的一个安卓实例操作系统。

云手机Cloudphone,就是将云计算技术运用于网络终端服务,通过云服务器实现云服务的手机。其实就是深度结合了网络服务的智能手机,这类手机凭借自带的系统以及厂商架设的网络终端可以通过网络实现众多的功能。

手机的价值在于,充分利用3G带来的移动宽带网络,手机永远在线的特性和云技术的特点,把手机和整个网络体系联系起来,让手机不再是一个孤独的手机。无论是任何品牌推出的云手机,都共同具备的。

在技术创新的驱动下,计算产业将产生巨大潜力日前举行的鲲鹏计算产业发展峰会上,华为宣布未来5年将投资30亿元发展鲲鹏产业生态华为投资鲲鹏产业?让金投小编为你解答吧!

本次大会由中国电子技术标准化研究院、华联合主办,由绿色计算产业联盟(GCC)协作华为轮值会长徐直军说:面向多样性计算时代,华为与产业合作伙伴合作构建鲲鹏计算产业生态,为各行业提供鲲鹏处理器的领先IT基础设施和行业应用华为着重于鲲鹏和升级处理器、鲲鹏云服务和AI云服务等领域的技术创新,开放能力,使合作伙伴能够共同扩大计算产业

为了支持鲲鹏产业生态的建设和发展,华为计划未来五年投资30亿元人民币发展鲲鹏产业生态同时,华为已构建线上鲲鹏社区,提供加速库、编译器、工具链、开源操作系统等,帮助合作伙伴和开发商快速掌握操作系统、编译器和应用转移优化等能力,共建、共享、共赢计算新时代

今年年初,华为高调推出基于ARM架构的处理器-鲲鹏920Kunpeng920),华为官方称其为目前最强的ARM服务器芯片在当时的发表会上,华为董事、战略Marketing社长徐文伟说,从2018年到2025年,数据量增加了18倍,达到了180ZB(1ZB为10兆字节),计算力增加了10倍

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 英伟达CPU问世:ARM架构,对比x86实现十倍性能提升

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情