中国“芯”系列:国产GPU主要企业详细介绍?
中国“芯”系列:国产GPU主要企业详细介绍。
1、华为海思
海思半导体有限公司成立于2004年10月,前身是创建于1991年的华为集成电路设计中心。海思公司总部位于深圳,在北京、上海、美国硅谷和瑞典设有设计分部。为面向公开市场,海思以其位于上海的分部为基础,于2018年6月成立上海海思技术有限公司。自此,海思的产品正式在公开市场销售。
海思的产品覆盖无线网络、固定网络、数字媒体等领域的芯片及解决方案,成功应用在全球100多个国家和地区;在数字媒体领域,已推出SoC网络监控芯片及解决方案、可视电话芯片及解决方案、DVB芯片及解决方案和IPTV芯片及解决方案。
2、紫光展锐
紫光展锐(上海)科技有限公司是中国集成电路设计产业的龙头企业,是中国大陆公开市场唯一拥有5G芯片能力并已成功商用的主芯片平台提供者。紫光展锐具备稀缺的大型芯片集成能力和完整周边套片能力,拥有全场景通信能力,是全球少数全面掌握2G/3G/4G/5G、Wi-Fi、蓝牙、电视调频、卫星通信等技术的企业之一。此外,紫光展锐实现了全球网络验证,通过了全球128个国家,200余家运营商的出货认证。
紫光展锐的产品包括移动通信中央处理器、基带芯片、AI芯片、射频前端芯片、射频芯片等各类通信、计算及控制芯片,广泛应用于智能手机、智能平板、智能手表等消费电子领域和智慧金融、智慧物流、智慧电力、智慧医疗等行业领域。紫光展锐拥有全球化的研发布局,在全球拥有超过5000名员工,其中90%是研发人员。
3、翱捷科技
翱捷科技股份有限公司(翱捷科技,688220SH)成立于2015年4月,总部位于上海张江高科技园区,在北京、南京、深圳、合肥、大连、成都、西安、美国、意大利等地区建立了多个研发、支持中心。
翱捷科技是一家提供无线通信、超大规模芯片的平台型芯片企业。公司自设立以来一直专注于无线通信芯片的研发和技术创新,同时拥有全制式蜂窝基带芯片及多协议非蜂窝物联网芯片设计与供货能力,且具备提供超大规模高速SoC芯片定制及半导体IP授权服务能力。
目前,公司已成为国内少数同时在“5G+AI”领域完成技术和产品突破的企业。公司各类芯片产品下游应用场景广阔,可应用于以手机、智能可穿戴设备为代表的消费电子市场及以智慧安防、智能家居、自动驾驶为代表的智能物联网市场。
4、联发科
联发科技股份有限公司(MediaTek Inc)是全球第四大晶圆厂半导体公司,在移动终端、智能家居应用、无线连接技术及物联网产品等市场位居领先地位,一年约有15亿台内建MediaTek芯片的终端产品在全球各地上市。
MediaTek力求技术创新并赋能市场,为5G、智能手机、智能电视、Chromebook笔记本电脑、平板电脑、智能音箱、无线耳机、可穿戴设备与车用电子等产品提供高性能低功耗的移动计算技术、先进的通信技术、AI解决方案以及多媒体功能。
2022年5月23日,联发科发布旗下首款支持5G毫米波的移动平台——天玑1050。采用台积电6nm制程,搭载八核心CPU,包含两个主频的25GHz的Arm Cortex-A78大核,GPU采用新一代Arm Mali-G610,天玑1050高度集成5G调制解调器,支持5G毫米波和Sub-6GHz全频段网络的双连接和无缝切换,在5G Sub-6GHz(FR1)频段内支持3CC三载波聚合技术,在5G毫米波(FR2)频段内支持4CC四载波聚合技术。
5、龙芯
龙芯中科面向国家信息化建设需求,面向国际信息技术前沿,以创新发展为主题、以产业发展为主线、以体系建设为目标,坚持自主创新,全面掌握CPU指令系统、处理器IP核、操作系统等计算机核心技术,打造自主开放的软硬件生态和信息产业体系,为国家战略需求提供自主、安全、可靠的处理器,为信息产业的创新发展提供高性能、低成本的处理器和基础软硬件解决方案。
龙芯中科主营业务为处理器及配套芯片的研制、销售及服务,主要产品与服务包括处理器及配套芯片产品与基础软硬件解决方案业务。目前,龙芯中科基于信息系统和工控系统两条主线开展产业生态建设,面向网络安全、办公与业务信息化、工控及物联网等领域与合作伙伴保持全面的市场合作,系列产品在电子政务、能源、交通、金融、电信、教育等行业领域已获得广泛应用。
2001年,中国科学院计算技术研究所开始研制龙芯处理器,得到了中科院知识创新工程、863、973、核高基等项目大力支持,完成了十年的技术积累。2010年,在中国科学院和北京市政府共同牵头出资支持下,龙芯开始市场化运作,对龙芯处理器研发成果进行产业化。
6、兆芯
兆芯是成立于2013年的国资控股公司,总部位于上海张江,在北京、西安、武汉、深圳等地设有研发中心和分支机构,拥有一大批具备硕士、博士学历的专职研发人员。兆芯同时掌握中央处理器、图形处理器、芯片组三大核心技术,具备相关IP自主设计研发的能力。
自成立以来,兆芯已成功研发并量产多款通用处理器产品,并形成“开先”“开胜”两大系列,产品性能不断提升,达到国际主流的水平。作为国内率先实现主频30GHz关键突破的国产通用处理器,兆芯开先®KX-6000系列处理器荣获“第二届集成电路产业技术创新奖”“2019年中国IC设计成就奖”和“第二十届中国国际工业博览会金奖”、并入选“2019~2020年度上海设计100+”优秀成果。
凭借卓越的产品性能、杰出的软硬件兼容性和安全稳定等优势,兆芯与产业链生态伙伴紧密合作,构建了丰富的台式机、笔记本、一体机、云终端、服务器以及嵌入式工业主板和工业计算平台等产品,致力为党政办公、金融、教育、能源、交通、医疗、网络通信等关键行业以及消费类用户,提供高性能、高稳定、高可靠、体验优越的产品和解决方案,助力应用平滑迁移,推动产业的可持续发展。
7、飞腾
飞腾信息技术有限公司是国内领先的自主核心芯片提供商,致力于“飞腾”系列国产高性能、低功耗通用计算微处理器(飞腾CPU)的设计研发和产业化推广,以“聚焦信息系统核心芯片,支撑国家信息安全和产业发展”为使命,坚持“核心技术自主创新,产业生态开放联合”的发展理念,联合众多国产软硬件生态厂商,提供基于国际主流技术标准、中国自主可控的全国产信息系统整体解决方案,支撑国家信息安全和重要工业安全。
8、申威
成都申威科技有限责任公司(以下简称"成都申威"),成立于2016年11月25日。公司依托国家信息安全发展战略,主要从事对申威处理器的产业化推广,核心业务包括申威处理器芯片内核、封装设计、技术支持服务及销售,小型超级计算机研发、测试、销售、服务及核心部件生产,基于申威处理器的软件、中间件开发,嵌入式计算机系统定制化产品服务,集成电路IP核等知识产权授权。
申威处理器是在国家"核高基"重大专项支持下,由我国自主研制的全国产处理器。现已形成申威高性能计算处理器、服务器/桌面处理器、嵌入式处理器三个系列的国产处理器产品线,以及申威国产I/O套片产品线。
9、中科曙光
曙光信息产业股份有限公司(以下简称“中科曙光”)作为我国核心信息基础设施领军企业,为中国及全球用户提供创新、高效、可靠的IT产品、解决方案及服务。
公司在中国科学院的大力推动下组建,于2014年在上海证券交易所上市(股票代码:603019)。经历20余年发展,中科曙光在高端计算、存储、安全、数据中心等领域拥有深厚的技术积淀和领先的市场份额,并充分发挥高端计算优势,布局智能计算、云计算、大数据等领域的技术研发,打造计算产业生态,为科研探索创新、行业信息化建设、产业转型升级、数字经济发展提供了坚实可信的支撑。
中科曙光在全国各省、自治区和直辖市均设立了分支机构,拥有国际领先的5大智能制造生产基地、7大研发中心,在全国50多个城市部署了城市云计算中心。
10、威盛电子
威盛电子股份有限公司(VIA Technologies,Inc,简称VIA),成立于公元1992年9月,为全球IC设计与个人电脑平台解决方案领导厂商,以自有品牌进军国际市场。在整个半导体产业链中,威盛也因其无晶圆厂的经营模式、加上重视人才招揽与技术开发,成为知识经济时代的企业典范,现阶段全球员工人数超过2000人。
在1990年后期,VIA开始他的核心逻辑事业之多样化发展,以及公司在那开始收购并组成CPU部门,绘图部门,以及音效部门。因为硅芯片制造的进展,而继续增加芯片组中的集成性等级和功能性,VIA也需要这些个别的部门以维持核心逻辑市场的竞争性。
很多同学有意做IC设计,但苦于找不到学习方向,怎么办?这里给大家介绍一下IC设计6大热门岗位,IC设计分为数字IC设计和模拟IC设计两大块:数字IC设计又有4个不同方向:数字前端,数字验证,数字DFT和数字后端、数字前端,数字后端数字验证数字DFT,模拟IC设计也分为2个不同方向:模拟IC和模拟板图。模拟IC模拟版图,找工作,选择比能力更重要。如果一开始选对了行业和岗位,就会比较容易取得成功。
绝大多数的人都不知道,第一块多核CPU在1982-1983年间由中国银河巨型机研究所制作,当时是世界上最快的CPU。每秒运算次数在一亿次(100M次)以上。
现在就已经普及了双核
中国现在在研究的龙芯三就是多核CPU
中国台湾威盛电子的首款双核CPU“玲珑3000”样品已经展出订货,今年发售,将采用先进40NM制作。
答案:ka96fp50ti是一款芯片,由于其属于华为的产品,因此其上市时间不便透露,可能需要关注华为官方发布的相关信息。
解释:ka96fp50ti是一款基于华为自主研发的麒麟9000芯片的升级版,其主要用途是作为华为5G通信设备的处理器。由于华为自身具有完整的产业链,因此对于ka96fp50ti的上市时间也没有公开的官方消息。
拓展:除了ka96fp50ti,华为还有很多其他的芯片产品,比如麒麟系列、升腾系列等,这些芯片在华为的手机、电脑、服务器等多个领域都有应用。同时,华为也在积极推动芯片产业的发展,不断加强自主研发和创新能力,为中国科技的发展做出了重要贡献。
AMD 5X86(1995年)微处理器,核心代号X5,AMD公司在486市场的利器。486时代的后期,TI(德州仪器)推出了高性价比的TI486DX2-80,很快占领了中低端市场,Intel也推出了高端的Pentium系列。AMD为了抢占市场的空缺,便推出了5x86系列CPU(几乎是与Cyrix 5x86同时推出)。它是486级最高频的产品----334、133MHz,035微米制造工艺,内置16KB一级回写缓存,性能直指Pentium75,并且功耗要小于Pentium。
AMD K5(1997年)微处理器,1997年发布。因为研发问题,其上市时间比竞争对手Intel的"经典奔腾"晚了许多,再加上性能并不十分出色,这个不成功的产品一度使得AMD的市场份额大量丧失。K5的性能非常一般,整数运算能力比不上Cyrix 6x86,但比"经典奔腾"略强;浮点预算能力远远比不上"经典奔腾",但稍强于Cyrix 6x86。综合来看,K5属于实力比较平均的产品,而上市之初的低廉的价格比其性能更加吸引消费者。另外,最高端的K5-RP200产量很小(惯例吧:)并且没有在中国大陆销售。
AMD K6(1997年)处理器是与Intel PentiumMMX同档次的产品。是AMD在收购了NexGen,融入当时先进的NexGen
686技术之后的力作。它同样包含了MMX指令集以及比Pentium MMX整整大出一倍的64KB的L1缓存!整体比
较而言,K6是一款成功的作品,只是在性能方面,浮点运算能力依旧低于Pentium MMX。
K6-2(1998年)系列微处理器曾经是AMD的拳头产品,现在我们称之为经典。为了打败竞争对手Intel,AMD K6-2系列微处理器在K6的基础上做了大幅度的改进,其中最主要的是加入了对"3DNow!"指令的支持。"3DNow!"指令是对X86体系的重大突破,此项技术带给我们的好处是大大加强了计算机的3D处理能力,带给我们真正优秀的3D表现。当你使用专门为"3DNow!"优化的软件时就能发现,K6-2的潜力是多么的巨大。而且大多数K6-2并没有锁频,加上025微米制造工艺带给我们的低发热量,能很轻松的超频使用。也就是从K6-2开始,超频不再是Intel的专有名词。同时,K62也继承了AMD一贯的传统,同频型号比Intel产品价格要低25%左右,市场销量惊人。K6-2系列上市之初使用的是"K6 3D"这个名字("3D"即"3DNow!"),待到正式上市才正名为"K6-2"。正因为如此,大多数K6 3D为ES(少量正式版,毕竟没有量产:)。K6 3D曾经有一款非标准的250MHz产品,但是在正式的K6-2系列中并没有出现。K6-2的最低频率为200MHz,最高达到550MHz。
AMD于1999年2月推出了代号为"Sharptooth"(利齿)的K6-3(1998年)系列微处理器,它是AMD推出的最后一款支持Super架构和CPGA封装形式的CPU。K6-3采用了025微米制造工艺,集成256KB二级缓存(竞争对手Intel的新赛扬是128KB),并以CPU的主频速度运行。而曾经Socket 7主板上的L2此时就被K6-3自动识别为了L3,这对于高频率的CPU来说无疑很有优势,虽然K6-3的浮点运算依旧差强人意。因为各种原因,K6-3投放市场之后难觅踪迹,价格也并非平易近人,即便是更加先进的K6-3+出现之后。
AMD于2001年10月推出了K8架构。尽管K8和K7采用了一样数目的浮点调度程序窗口(scheduling window ),但是整数单元从K7的18个扩充到了24个,此外,AMD将K7中的分支预测单元做了改进。global history counter buffer(用于记录CPU在某段时间内对数据的访问,称之为全历史计数缓冲器)比起Athlon来足足大了4倍,并在分支测错前流水线中可以容纳更多指令数,AMD在整数调度程序上的改进让K8的管线深度比Athlon多出2级。增加两级线管深度的目的在于提升K8的核心频率。在K8中,AMD增加了后备式转换缓冲,这是为了应对Opteron在服务器应用中的超大内存需求。
AMD于2007下半年推出K10架构。
采用K10架构的 Barcelona为四核并有463亿晶体管。Barcelona是AMD第一款四核处理器,原生架构基于65nm工艺技术。和Intel Kentsfield四核不同的是,Barcelona并不是将两个双核封装在一起,而是真正的单芯片四核心。
● Barcelona新特性解析:引入全新SSE128技术
Barcelona中的一项重要改进是被AMD称为“SSE128”的技术,在K8架构中,处理器可以并行处理两个SSE指令,但是SSE执行单元一般只有64位带宽。对于128位的SSE操作,K8处理器需要将其作为两个64位指令对待。也就是说,当一个128位 SSE指令被取出后,首先需要将其解码为两个micro-ops,因此一个单指令还占用了额外的解码端口,降低了执行效率。
而Barcelona加宽了执行单元从64位到128位,所有128位的SSE操作不再需要进行解码分解为两个64位操作,并且浮点调度器也可以支持这种128位 SSE操作,提高了执行效率。
提高SSE指令执行单元带宽的同时,也会带来一些新的变化,也可以说是新的瓶颈:指令存取带宽。为了将并行处理器过程中解码数量最大化,Barcelona开始支持32字节每时钟周期的指令存取,而先前K8架构只支持16字节。32字节的指令存取带宽不仅对处理器SSE代码有帮助,同时对于整数指令也有效果。
● Barcelona新特性解析:内存控制器再度强化
当年当AMD将内存控制器集成至CPU内部时,我们看到了崭新而强大的K8构架。如今,Barcelona的内存控制器在设计上将又一次极大的改进其内存性能。
Intel Xeon服务器所有使用的FB-DIMM内存一大优势是,可以同时执行读和写命令到AMB,而在标准的DDR2内存中,你只能同时进行一个操作,而且读和写的切换会有非常大的损失。如果是一连串的随机混合执行的话,将会带来非常严重的资源浪费,而如果是先全部读然后再转换到写的话,就可以避免性能的损失。K8内存控制器就采用读取优先于写的策略来提高运行效率,但是Barcelona则更加智能化。
但是读取的数据会被先存放在buffer中,而不采用先直接执行写,但当它的容量达到了极限就会溢出,为了避免这种情况,在此之前才对读写之间进行切换,同时可以带来带宽和延迟方面效率的提高。K8核心配备的是128-bits宽度的单内存控制器,但是在Barcelona中,AMD把它分割成两个64-bit,每个控制器可以独立的进行操作,因此它可以带来效率上的不小提升,尤其是在四核执行的环境下,每个核心可以独立占有内存访问资源。
Barcelonas中集成的北桥部分(注意不是主板北桥)也被设计成更高的带宽,更深的buffers将允许更高的带宽利用率,同时北桥自身已经可以使用未来的内存技术,比如DDR3。
内存控制器的预取功能是运用相当广泛、十分重要的一项功能。预取可以减少内存延迟对整体性能的负面影响。当NVIDIA发布nForce2主板时,重点介绍的就是nForce2芯片组的128位智能预取功能。Intel在发布Core 2处理器之时也强调了CORE构架每核心拥有三个预取单元。
K8构架中每个核心设计有2个预取器,一个是指令预取器,另一个是数据预取器。K8L构架的Barcelona保持了2个的数量,但在性能上有了较大的改进。一个明显的改进是数据预取器直接将数据寄存入L1缓存中,相比K8构架中寄存入L2缓存的做法,新的数据预取器准确率更高,速度更快,内存性能及CPU整体性能将得益于此。
● Barcelona新特性解析:创新——三级缓存
受工艺技术方面的影响,AMD处理器的缓存容量一直都要落后于Intel,AMD自己也清楚自己无法在宝贵的die上加入更多的晶体管来实现大容量的缓存,但是勇于创新的AMD却找到了更好的办法——集成内存控制器。
处理器整合内存控制器可以说是一项杰作,拥有整合内存控制器的K8构架仅依靠512KB的L2缓存就能够击败当时的对手Pentium 4。直到现在的Athlon 64 X2也依然保持着Intel 2002年就已过时的512KB L2缓村。
现在Core 2已经拥有了4MB的L2缓存,看来Intel和AMD之间的缓存差距还将保持,因为Barcelona的L2缓存依然是512KB。相比之下,Intel四核的Kentsfield芯片拥有8MB的L2缓存,而2007年末上市的新型Penryn芯片将拥有12MB的L2缓存。
Barcelona的缓存体系和K8构架有一定的相似之处,它的四颗核心各拥有64KB的L1缓存和512KB的L2缓存。从简化芯片设计的角度来看,四核心共享巨大的L2缓存对K8L构架而言并不合适,所以AMD引入了L3缓存,得益于65nm工艺,Barcelona在一颗晶圆上集成四颗核心外,还集成了一块2MB容量的L3缓存。也就是说L3缓存与4颗内核同样原生于一块晶圆,其容量为最小2M起跳。同L2缓存一样,L3缓存也是独立的,L1缓存的数据和L3缓存的数据将不会重复。
Barcelona的缓存工作原理是:L2缓存是作为L1缓存的备用空间。L1缓存储存着CPU当前最需要的数据,而当空间不足时,一些不是最重要的数据就转移到L2缓存中。而当未来再次需要时,则从L2缓存中再次转移到L1缓存中。新加入的L3缓存延续了L2缓存的角色,四颗核心的L2缓存将溢出的数据暂时寄存在L3缓存中。
L1缓存和L2缓存依然分别是2路和16路,L3缓存则是32路。快速的32路L3缓存不仅可以更好的满足多任务并行,而且对单任务的执行也有着较大积极作用。尤其在3D运用方面,2MB的L3缓存将对性能产生极大的推进作用。
AMD全新45nm的Shanghai架构
2008年11月13日,AMD公司宣布其代号为“上海”的新一代45nm四核皓龙处理器已经广泛上市。“上海”性能最高提升达35%,而空载时的功耗可显著降低35%2。新一代四核AMD皓龙处理器采用创新的设计,能够带来更高的虚拟化性能和每瓦性价比,帮助数据中心提高效率,降低复杂性,从而最大限度地满足IT管理者的需要,以更低的投入实现更高的产出。
AMD公司负责计算解决方案业务的高级副总裁Randy Allen表示:“新一代四核AMD皓龙处理器是在正确的时间诞生的一款正确的产品。堪称完美的提前推出,使之成为x86服务器性能的新王者。通过与OEM厂商和解决方案供应商等合作伙伴的紧密合作,AMD的创新技术在满足企业用户目前最基本需求的同时,还为其未来发展做好准备。自4年前AMD推出世界首款x86双核处理器以来,这一增强的新一代皓龙处理器带来了AMD产品性能和每瓦性价比的最大提升。”
领先的性能满足当今最迫切的商务需求
数据中心的管理者们面对日益增长的压力,诸如网络服务、数据库应用等的企业工作负载对计算的需求越来越高;而在当前的IT支出环境下,还要以更低的投入实现更高的产出。迅速增长的新计算技术如云计算和虚拟化等,在今年第二季度实现了60%的同比增长率3,这些技术在迅速应用的同时也迫切需要一个均衡的系统解决方案。最新的四核AMD皓龙处理器进一步增强了AMD独有的直连架构优势,能够为包括云计算和虚拟化在内的日渐扩大的异构计算环境提供具有出色稳定性和扩展性的解决方案。
卓越的虚拟化性能
具有改进的AMD直连架构和AMD虚拟化技术(AMD-V ),45nm四核皓龙处理器成为已有的基于AMD技术的虚拟化平台的不二选择,目前全球的OEM厂商已基于上一代AMD四核皓龙处理器推出了9款专门为虚拟化应用而设计的服务器。新一代处理器可提供更快的虚拟机转换时间,并优化快速虚拟化索引技术(RVI)的特性,从而提高虚拟机的效率,AMD的AMD-V 还可以减少软件虚拟化的开销。
无与伦比的性价比
与历代的AMD皓龙处理器相比,新一代四核皓龙处理器带来了前所未有的性能和每瓦性能比显著增强,包括:
以与上代四核皓龙处理器相同的功耗设计,大幅提高CPU时钟频率。这得益于处理器设计增强、AMD业界领先的45nm沉浸式光刻技术和超强的处理器设计与验证能力。
L3缓存容量提高200%,达到6MB,增强虚拟化、数据库和Java等内存密集型应用的性能。
支持DDR2-800内存,与现有AMD皓龙处理器相比内存带宽实现了大幅提高,并且比竞品使用的Fully-Buffered DIMM具有更高的能效。
即将推出的超传输总线 30 (HyperTransport 30)技术将进一步增强AMD革命性的直连架构,计划于2009年2季度将处理器之间的通信带宽提高到176GB/s。
无可匹敌的节能特性
AMD皓龙处理器业已带来了业界领先的X86服务器处理器每瓦性价比,与之相比,新一代45nm四核AMD皓龙处理器在空载状态的能耗可以大幅降低35%,而性能可提高达35%。“上海”采用了众多的新型节能技术:AMD智能预取技术,可允许处理器核心在空载时进入“暂停”状态,而不会对应用性能和缓存中的数据有任何影响,从而显著降低能耗;AMD CoolCore 技术能够关闭处理器中非工作区域以进一步节省能耗。
在平台配置相似的情况下,基于75瓦AMD 四核皓龙处理器的平台,与基于50瓦处理器的竞争平台相比,具有高达30%的每瓦性能比优势。相似平台配置下,基于AMD 四核皓龙处理器2380的平台,空载状态的功耗为138瓦;与之对比,基于英特尔四核处理器的平台在相同状态下的功耗则为179瓦。基于AMD 四核皓龙2380型号处理器的平台,在SPECpower_ssj 2008基准测试中取得761ssj_ops/每瓦的总成绩 (308,089 ssj_ops @ 100% 的目标负载),而英特尔四核平台为总成绩为561ssj_ops/每瓦 (267,804 ssj_ops @ 100%的目标负载) 4
前所未有的平台稳定性
作为唯一用相同的架构提供2路到8路服务器处理器的x86微处理器制造商,AMD新一代45nm四核皓龙处理器在插槽和散热设计与上代四核和双核AMD皓龙处理器兼容,延续了AMD的领先地位。这可以帮助消费者减少平台管理的复杂性和费用,增强数据中心的正常运行时间和生产力。新的45nm处理器适用于现有的Socket 1207插槽架构,未来代号为“Istanbul”的AMD 下一代皓龙处理器也计划使用相同插槽。
全球OEM 厂商支持
作为业内最易于管理和一致的x86服务器平台,由于采用AMD皓龙处理器,至少是部分原因,全球OEM和系统开发商能够迅速完成验证流程,并预计从本月起开始交付基于增强的四核AMD皓龙处理器的下一代系统。本季度和2009年第一季度,基于增强的四核AMD皓龙处理器的系统的供应量有望迅速增长。
惠普工业标准服务器业务部营销副总裁Paul Gottsegen 表示:“通过采用基于新 ‘上海’处理器的 HP ProLiant服务器,客户可以降低成本,同时使能效和性能更上层楼。在与AMD公司过去的4年合作中,我们为各种规模的客户提供了基于AMD皓龙处理器的平台,并取得了空前的成功。初期反馈结果表明‘上海’将成为赢者。“
Sun公司系统业务部执行副总裁John Fowler 表示:“ Sun的创新系统设计和Solaris与增强型四核AMD皓龙处理器相结合,将为虚拟化应用和系统整合带来具有难以置信的强大性能、可扩展性和高能效特性的x64平台。在数据中心增长过程中,基于AMD增强型四核皓龙处理器的Sun服务器能够处理最复杂的数据群并灵活扩展。而由于历代平台之间的连续性,客户有信心确保新系统与已部署的AMD皓龙系统实现无缝兼容。”
戴尔商用产品部高级副总裁Brad Anderson表示:“戴尔和AMD公司共同致力于为企业提供强大的全系列产品,以简化IT环境管理并降低管理成本。我们的PowerEdge服务器专门设计以充分利用AMD芯片中集成的虚拟化特性。这种紧密协作效果显著,2路和4路机架和刀片式PowerEdge服务器已经取得了破纪录的虚拟化性能。”
IBM刀片式服务器副总裁Alex Yost表示:“自2003年以来,IBM就利用AMD皓龙处理器的性能和直连架构满足企业用户计算密集型的需求,并为其带来更多选择。IBM正在AMD新处理器高能效和虚拟化的基础上进一步创新,为我们的客户带来更高的价值。”
采用直连架构的 AMD 皓龙(Opteron) 处理器可以提供领先的多技术。 使IT管理员能够在同一服务器上运行32位与64位应用软件,前提是该服务器使用的是64位操作系统。
AMD 速龙(Athlon64),又叫阿斯龙 64 处理器可以为企业的台式电脑用户提供卓越的性能和重要的投资保护。
AMD 双核速龙 64(AthlonX2 64 )处理器可以提供更高的多任务性能,帮助企业在更短的时间内完成更多的任务。
AMD 炫龙 64(Turion64) 移动计算技术可以利用移动计算领域的最新成果,提供最高的移动办公能力,以及领先的 64 位计算技术。
AMD 闪龙 (Sempron64) 处理器不仅可以为企业提供出色的性价比,而且可以提高员工的日常工作效率。
AMD 羿龙 (phenom)处理器 全新架构的4核处理器,进一步满足用户需求(在命名中取消“64”,因为现今的CPU都是64位的,不必再标明)。为满足消费者的不同需求,AMD近期也推出了3核羿龙产品!
对于消费者, AMD 也提供全系列 64 位产品
AMD 双核速龙 64 处理器可以让用户在更短的时间内完成更多的任务(包括业务应用和视频、照片编辑,内容创建和音频制作等)。这些强大的功能使其成为那些即将上市的新型媒体中心的最佳选择。
AMD 速龙 64 处理器具有出色的功能和性能,可以提供栩栩如生的数字媒体效果――包括音乐、视频、照片和 DVD 等。
AMD 雷鸟 (Thunderbird)处理器
AMD 钻龙 (Duron)处理器可以说是雷鸟的精简便宜版,架构和雷鸟处理器一样,其差别除了时脉较低之外,就是内建的L2 Cache,只有64K 。
AMD
对于那些希望通过轻薄型笔记本电脑领略 64 位性能的消费者, AMD 炫龙 64 移动计算技术可以在不影响性能的情况下提供安全的移动办公能力。
对于那些希望获得最佳性价比的消费者, AMD 闪龙 处理器可以提供从文字处理到照片浏览的各种常用功能。
在生活中我们经常会接触到一些科技名词,如鲲鹏、麒麟、升腾、天罡等词,如今华为的这些科技名词越来越多,到底是啥意思,小编认为有必要给大家科普一下,跟上时代潮流。
海思半导体是一家半导体公司,海思半导体有限公司成立于2004年10月,前身是创建于1991年的华为集成电路设计中心。海思公司总部位于深圳,在北京、上海、美国硅谷和瑞典设有设计分部。
海思的产品覆盖无线网络、固定网络、数字媒体等领域的芯片及解决方案,成功应用在全球100多个国家和地区;在数字媒体领域,已推出SoC网络监控芯片及解决方案、可视电话芯片及解决方案、DVB芯片及解决方案和IPTV芯片及解决方案。
1、麒麟Kirin 智能手机芯片,能生产 10nm 工艺的只有英特尔、三星和台积电。
2、凌霄芯片 专为物联网研发的专用芯片,(路由器,WIFI等设备)2019年8月,华为在开发者大会上正式发布凌霄WiFi-loT芯片,该芯片将于2019年底上市。
3、鸿鹄honghu 智慧显示芯片,鸿鹄之于电视,正如麒麟之于手机。
4、天罡系列5G芯片 天罡芯片是华为5G 基站核心芯片,实现25倍运算能力的提升,搭载最新的算法及Beamforming。
5、巴龙balong5G芯片 巴龙5000,5G终端的基带芯片,采用单芯片多模的5G模组,能够在单芯片内实现2G、3G、4G和5G多种网络制式,有效降低多模间数据交换产生的时延和功耗。
6、升腾Ascend ,华为升腾芯片是华为公司发布的两款人工智能处理器 ,包括升腾910和升腾310处理器 ,采用自家的达芬奇架构,2019年8月23日,下午3点华为副董事长、轮值董事长徐直军在发布会上宣布,“升腾910”正式推出。国内首款全栈全景场智能芯片。
7、鲲鹏 鲲鹏处理器是华为在2019年1月向业界发布的高性能数据中心处理器。目的在于满足数据中心的多样性计算和绿色计算需求 ,具有高性能,高带宽,高集成度,高效能四大特点。(服务器处理器),专为大数据处理与分布式存储等应用设计,目前性能最好的基于ARM的服务器CPU
看到此处,是否对这些科技名词了有了一个初步的了解,同时为我们能拥有华为海思半导体这样的公司感到自豪,希望中国这样的高科技公司越来越多。
在众多中国神话中,能与独角兽相提并论的神话动物并不多,而鲲鹏恰好是其中最具标志性的一种。
道教《庄子逍遥游》。这本书里记载着 quot在北京有一种鱼,它的名字叫鲲 quot。我不 我不知道昆明有多大,但它在千里之外。又变成了一只鸟,名字叫彭。彭 回来了,我不 我不知道它有几千英里。愤怒地飞翔,它的翅膀像天空悬挂的云。鲲鹏常用来比喻一些宏大的事物。常言道, quot学做鲲鹏,飞向万里,却不 不要做一只鸟 的窝。
鲲鹏也成为继麒麟之后又一个雄心勃勃的产品和技术布局。
徐文伟强调,在计算趋势中,虽然从终端收集的庞大数据可以通过所谓的边缘计算共享,但对于当前的云计算基础设施来说,这仍然是一个沉重的负担。如何解决庞大的数据流量以及对存储和实时计算的需求,成为各云服务器厂商积极寻求突破的关键。徐文伟指出,通过与ARM的合作和大规模核心集成,大数据的实时处理和计算得到了很好的解决。
符合去年发布的瑞星架构 的全连接大会,以及手机等边缘计算加入的NPU计算能力,华为拥有强大的生态优势。同时,徐文伟还强调,华为不会走封闭的道路,将继续与英特尔和其他合作伙伴合作。
当然,与行业伙伴的合作还会继续,但为了摆脱依赖,增加自主能力,华为一直是其发展的重点。徐文伟谈到这一点,拿出了他最新的服务器芯片,也是今天 主角:鲲鹏服务器芯片鲲鹏920。
鲲鹏920集成64核,主频26 GHz。该芯片组集成了8通道DDR4,内存带宽超过现有产品的46%。通过两个100G RoCE端口,系统集成度也显著提高。鲲鹏920支持PCIe 40和CCIX接口,总带宽640 Gbps。此外,单槽速度是现有产品的两倍,有效提升了存储和各种加速器的性能。
另外值得一提的是,鲲鹏芯片在单个封装中集成了传统计算芯片的四种结构,包括网络、存储、主控芯片和CPU。
鲲鹏芯片还集成了一个8通道内存控制器,提供了比之前架构更高的整体带宽输出性能,提升幅度超过48%,可以为带宽要求高、实时计算能力要求高的计算环境带来极大的帮助。
鲲鹏920是业界最高性能的基于ARM的服务器CPU。采用最先进的7nm工艺,CPU由华为自主设计,基于ARMv8架构授权。通过优化分支预测算法、增加运算单元数量和改进存储子系统结构,显著提高了处理器性能。在典型的时钟速度下,Quantum 920 CPU在SPECint基准测试中的得分超过930,比行业基准高出25%。同时,电源效率比行业同行高30%。鲲鹏920为数据中心提供更高的计算性能,同时降低功耗。
华为 在创新上的不断进步也体现在它在服务器产品上的重要表现。不仅在性能上有优势,其服务器产品总出货量已经达到356万台,成为华为的又一支柱。
吴雄 安科技中国区执行董事兼CEO ang强调了ARM生态所拥有的强大计算生态,可以帮助华为更好地在云计算方面发挥作用。
华为总裁邱龙 的智能计算业务部,上台宣布了基于鲲鹏芯片的泰山服务器产品线。他还强调,这些服务器是为海量存储和数据计算而设计的,所有的生态都是基于原生ARM生态研发的,包括硬件和软件的适配等。因为原生应用可以发挥硬件的最大效率,华为还强调在泰山推出之前,软件开发环境已经完成,而这一切
不仅仅是原生应用和优化,邱龙还强调他在自己的服务器设计中提供了更高效的存储模式和更好的动态管理机制,让各种计算场景都能达到更好的效果,同时降低管理成本。
邱龙还宣布,华为 美国云计算将使用基于鲲鹏的泰山服务器,并提供比其竞争对手三倍以上的整体输出性能。云手机服务也同时开放,提供直接在云端运行App的能力。
华为还邀请了几个关键的合作伙伴来谈谈基于ARM生态系统的创新计算。
华为不断推动硬件、基础软件和应用的行业合作。华为一直与绿色计算联盟、Linaro、Open Edge、HPC Initiative等行业组织合作,与Hortonworks、微软、SAP、SUSE、Ubuntu等合作伙伴共同构建开放协作的行业生态系统。和中国标准软件。
硬件方面,华为是Linaro的核心成员。在基础软件方面,华为是OpenStack基金会的白金会员和云原生计算基金会的创始成员。在应用方面,华为已经加入了海湾合作委员会。GCC发布了绿色计算联盟服务器的技术标准报告,以及其他构建绿色开源计算社区的努力。华为也是OEHI的成员。
布局已久的智能计算技术
其实早在去年 智能计算大会,华为宣布从2018年12月21日起,其服务器将全面升级为华为智能计算。作为华为 基于连接、计算和云的三大任务,智能计算的重要性不言而喻。在当天的华为智能计算大会上,华为 的新智能计算业务战略旨在解决行业面临的四个主要问题 智能,即计算电源、数据协同、场景部署、专业技术。为了解决这些问题,华为 的智能计算业务将专注于四个方面:计算能力、工程、云端协作和集成解决方案。团队也在会上展示了自己的努力。
会上公布的亮点有:将其FusionServer升级为FusionServer pro,并将数据中心升级为智能数据中心;2019年,华为 首款AI管理芯片将诞生,可以自动预测整个设备管理故障。
虽然当天已经提到了64核ARM架构处理器鲲鹏芯片,但是今天 拥有更多细节和生态支持的s的出现,表明华为正在积极推动整体计算行业的创新,在拥抱行业合作伙伴的同时,积极推动自己架构的研发。这代表了与世界接轨,但同时拥有核心技术的两种诉求。对于现在的中国行业来说,其实是一个值得学习的点。
云计算竞争激烈,拥有生态才有话语权
随着中国云计算市场的快速扩张,竞争也越来越激烈。其中,拥有优质互联网基因的阿里和腾讯在公有云领域已经处于领先地位。阿里云占据中国半壁江山 版图,规模效应优势明显,而腾讯云围绕游戏和视频业务优势,在游戏云和视频云领域领先。2018Q1,腾讯其他业务同比增长111%,其中云业务增速超过100%。
以华为为首的传统IT企业的进攻不容忽视。
在刚刚过去的2018年,华为发布了一款 quot大招 quot在10月举行的全连接大会上,并一口气发布了3354盛腾910和盛腾310两款自研AI芯片,成为华为 的智能计算架构。
其中,盛腾910采用7nm工艺,半精度256T,据说是全球单颗计算能力最高的AI芯片,计算能力远超Google和Nvidia。盛腾310采用12nm工艺,最大功耗仅8W,整数精度16T,是计算效率极高、功耗极低的主力AI芯片。当时许华伟智骏也给出了这两款AI芯片的上市时间为2019年第二季度。2019年,华为还将推出三款AI芯片,都属于瑞星系列。同时,华为将提供AI云服务ba
特别需要强调的是,盛腾910和盛腾310这两款自研AI芯片采用了华为研发的达芬奇架构和华为研发的高效灵活的CISC指令集。每个AI核心可以在一个周期内完成4096次MAC计算。它们集成了张量、向量和标量等各种计算单元,支持多种混合精度计算,以及训练和推理场景下的数据精度计算。
在华为之前,百度和阿里巴巴已经宣布布局自己的AI芯片。百度 昆仑芯片采用自主设计的架构。尽管该芯片仍处于设计阶段,但该公司声称其理论计算能力是英伟达的两倍多 的方案。
阿里巴巴宣布将投资阿里-NPU神经网络芯片的研发。这种架构不提绝对性能,而是强调其超强性价比,号称超越传统CPU/GPU架构40倍。虽然腾讯尚未宣布自有ai芯片的布局,但此前已投资了体素云、碳云智能、甄氏科技、蔚来汽车等公司,发展方向主要是AI的产业应用,与其他公司不同。
此次发布的鲲鹏芯片,其背后的ARM生态布局,不仅构成了华为 在服务器和云计算业务上拥有自己的通用计算架构,也确保了华为从云到端都能拥有自己的核心竞争优势。麒麟和鲲鹏两大猛兽,将继续成为华为最大的驱动力 美国未来的生态进步。
云计算已经华为下一个经营重点,两大神兽从端到云分头并进
华为2008年开始云计算的研发,正式发布华为 云计算战略和端到端解决方案,并于2015年7月30日发布了面向中国市场的企业云服务,积极探索开发、运营、运维一体化模式,与合作伙伴携手打造 开放、协作和供应 云合作生态系统。
2017年,之前属于PS部门的Cloud BU迁移到华为集团,成为华为 继运营商BG、企业BG、终端BG之后的第四大业务单元,发布华为 发展云计算的巨大决心。也是在这一年,华为宣布进军公有云,并表示其优势在于可以提供 quot云、边、端和连接 quot。
2018年7月,华为云公布了一些核心 quot成绩单 quot。官方数据显示,仅2018年上半年,华为云 合作伙伴增长45%,其营收同比增长700%。云市场上有872个新应用,软件开发服务DevCloud有9万名开发者。
在人工智能领域,华为云推出了ei agent,发布了深度学习、图像搜索、EI智能视频等一系列服务。推动AI在行业中的应用场景;在计算领域,推出了全新的网络增强型云服务器C3ne,让云计算进入千万级网络转发时代。云安全方面,国内首个全平台、全业务、全节点通过PCI-DSS安全认证,高分通过公安部网络安全等级保护四级测评。
华为云能取得上述成就。从软硬件到解决方案,华为云 长期的技术积累赋予其后发优势。
过去,华为一直以麒麟兽称霸移动和边缘计算行业。去年智能手机出货量超过2亿,麒麟是其高端产品的重要核心。今年,鲲鹏加入了华为 beast行列,成为推动服务器计算生态的重要核心,这也代表了华为 积极布局更多商机。同时要掌握自己的计算核心技术,与世界同步,打造更广阔的开放生态。
王者之心2点击试玩
计算产品
对于需要高性能计算和 IT 基础设施的企业用户来说, AMD 提供一系列解决方案。
o 1981年,AMD 287 FPU ,使用Intel 80287核心。
产品的市场定位和性能与Intel 80287基本相同。
也是迄今为止AMD公司 唯一生产过的FPU产品,十分稀有。
o AMD 8080(1974年)、8085(1976年)、8086(1978年)、8088(1979年)、80186(1982年)、80188、80286微处理器,使用Intel 8080核心。
产品的市场定位和性能与Intel同名产品基本相同。
o AMD 386(1991年)微处理器,核心代号P9,有SX和DX之分,分别与Intel 80386SX和DX相兼容的微处理器。
AMD 386DX与Intel 386DX同为32位处理器。
不同的是AMD 386SX是一个完全的16位处理器,而Intel 386SX是一种准32位处理器----内部总线32位,外部16位。
AMD 386DX的性能与Intel 80386DX相差无己,同为当时的主流产品之一。
AMD也曾研发了386 DE等多种型号基于386核心的嵌入式产品。
o AMD 486DX(1993年)微处理器,核心代号P4,AMD自行设计生产的第一代486产品。
而后陆续推出了其他486级别的产品,常见的型号有:486DX2,核心代号P24;486DX4,核心代号P24C;486SX2,核心代号P23等。
其它衍生型号还有486DE、486DXL2等,比较少见。
AMD 486的最高频率为120MHz(DX4-120),这是第一次在频率上超越了强大的竞争对手Intel。
o AMD 5X86(1995年)微处理器,核心代号X5,AMD公司在486市场的利器。
486时代的后期,TI(德州仪器)推出了高性价比的TI486DX2-80,很快占领了中低端市场,Intel也推出了高端的Pentium系列。
AMD为了抢占市场的空缺,便推出了5x86系列CPU(几乎是与Cyrix 5x86同时推出)。
它是486级最高频的产品----334、133MHz,035微米制造工艺,内置16KB一级回写缓存,性能直指Pentium75,并且功耗要小于Pentium。
o AMD K5(1997年)微处理器,1997年发布。
因为研发问题,其上市时间比竞争对手Intel的"经典奔腾"晚了许多,再加上性能并不十分出色,这个不成功的产品一度使得AMD的市场份额大量丧失。
K5的性能非常一般,整数运算能力比不上Cyrix x86,但比"经典奔腾"略强;浮点预算能力远远比不上"经典奔腾",但稍强于Cyrix 6x86。
综合来看,K5属于实力比较平均的产品,而上市之初的低廉的价格比其性能更加吸引消费者。
另外,最高端的K5-RP200产量很小(惯例吧:)并且没有在中国大陆销售。
o AMD K6(1997年)处理器是与Intel PentiumMMX同档次的产品。
是AMD在收购了NexGen,融入当时先进的NexGen 686技术之后的力作。
它同样包含了MMX指令集以及比Pentium MMX整整大出一倍的64KB的L1缓存!整体比较而言,K6是一款成功的作品,只是在性能方面,浮点运算能力依旧低于Pentium MMX。
o K6-2(1998年)系列微处理器曾经是AMD的拳头产品,现在我们称之为经典。
为了打败竞争对手Intel,AMD K6-2系列微处理器在K6的基础上做了大幅度的改进,其中最主要的是加入了对"3DNow!"指令的支持。
"3DNow!"指令是对X86体系的重大突破,此项技术带给我们的好处是大大加强了计算机的3D处理能力,带给我们真正优秀的3D表现。
当你使用专门"3DNow!"优化的软件时就能发现,K6-2的潜力是多么的巨大。
而且大多数K6-2并没有锁频,加上025微米制造工艺带给我们的低发热量,能很轻松的超频使用。
也就是从K6-2开始,超频不再是Intel的专有名词。
同时,K62也继承了AMD一贯的传统,同频型号比Intel产品价格要低25%左右,市场销量惊人。
K6-2系列上市之初使用的是"K6 3D"这个名字("3D"即"3DNow!"),待到正式上市才正名为"K6-2"。
正因为如此,大多数K6 3D为ES(少量正式版,毕竟没有量产:)。
K6 3D曾经有一款非标准的250MHz产品,但是在正式的K6-2系列中并没有出现。
K6-2的最低频率为200MHz,最高达到550MHz。
o AMD于1999年2月推出了代号为"Sharptooth"(利齿)的K6-3(1998年)系列微处理器,它是AMD推出的最后一款支持Super架构和CPGA封装形式的CPU。
K6-3采用了025微米制造工艺,集成256KB二级缓存(竞争对手Intel的新赛扬是128KB),并以CPU的主频速度运行。
而曾经Socket 7主板上的L2此时就被K6-3自动识别为了L3,这对于高频率的CPU来说无疑很有优势,虽然K6-3的浮点运算依旧差强人意。
因为各种原因,K6-3投放市场之后难觅踪迹,价格也并非平易近人,即便是更加先进的K6-3+出现之后。
oAMD于2001年10月推出了K8架构。
尽管K8和K7采用了一样数目的浮点调度程序窗口(sche ng window ),但是整数单元从K7的18个扩充到了24个,此外,AMD将K7中的分支预测单元做了改进。
global history counter buffer(用于记录CPU在某段时间内对数据的访问,称之为全历史计数缓冲器)比起Athlon来足足大了4倍,并在分支测错前流水线中可以容纳更多指令数,AMD在整数调度程序上的改进让K8的管线深度比Athlon多出2级。
增加两级线管深度的目的在于提升K8的核心频率。
在K8中,AMD增加了后备式转换缓冲,这是为了应对Opteron在服务器应用中的超大内存需求。
oAMD于2007下半年推出K10架构。
采用K10架构的 Barcelona为四核并有463亿晶体管。
Barcelona是AMD第一款四核处理器,原生架构基于65nm工艺技术。
和Intel Kentsfield四核不同的是,Barcelona并不是将两个双核封装在一起,而是真正的单芯片四核心。
● Barcelona新特性解析:引入全新SSE128技术 Barcelona中的一项重要改进是被AMD称为“SSE128”的技术,在K8架构中,处理器可以并行处理两个SSE指令,但是SSE执行单元一般只有64位带宽。
对于128位的SSE操作,K8处理器需要将其作为两个64位指令对待。
也就是说,当一个128位 SSE指令被取出后,首先需要将其解码为两个micro-ops,因此一个单指令还占用了额外的解码端口,降低了执行效率。
而Barcelona加宽了执行单元从64位到128位,所有128位的SSE操作不再需要进行解码分解为两个64位操作,并且浮点调度器也可以支持这种128位 SSE操作,提高了执行效率。
提高SSE指令执行单元带宽的同时,也会带来一些新的变化,也可以说是新的瓶颈:指令存取带宽。
为了将并行处理器过程中解码数量最大化,Barcelona开始支持32字节每时钟周期的指令存取,而先前K8架构只支持16字节。
32字节的指令存取带宽不仅对处理器SSE代码有帮助,同时对于整数指令也有效果。
● Barcelona新特性解析:内存控制器再度强化 当年当AMD将内存控制器集成至CPU内部时,我们看到了崭新而强大的K8构架。
如今,Barcelona的内存控制器在设计上将又一次极大的改进其内存性能。
Intel Xeon服务器所有使用的FB-DIMM内存一大优势是,可以同时执行读和写命令到AMB,而在标准的DDR2内存中,你只能同时进行一个操作,而且读和写的切换会有非常大的损失。
如果是一连串的随机混合执行的话,将会带来非常严重的资源浪费,而如果是先全部读然后再转换到写的话,就可以避免性能的损失。
K8内存控制器就采用读取优先于写的策略来提高运行效率,但是Barcelona则更加智能化。
但是读取的数据会被先存放在buffer中,而不采用先直接执行写,但当它的容量达到了极限就会溢出,为了避免这种情况,在此之前才对读写之间进行切换,同时可以带来带宽和延迟方面效率的提高。
K8核心配备的是128-bits宽度的单内存控制器,但是在Barcelona中,AMD把它分割成两个64-bit,每个控制器可以独立的进行操作,因此它可以带来效率上的不小提升,尤其是在四核执行的环境下,每个核心可以独立占有内存访问资源。
Barcelonas中集成的北桥部分(注意不是主板北桥)也被设计成更高的带宽,更深的buffers将允许更高的带宽利用率,同时北桥自身已经可以使用未来的内存技术,比如DDR3。
内存控制器的预取功能是运用相当广泛、十分重要的一项功能。
预取可以减少内存延迟对整体性能的负面影响。
当NVIDIA发布nForce2主板时,重点介绍的就是nForce2芯片组的128位智能预取功能。
Intel在发布Core 2处理器之时也强调了CORE构架每核心拥有三个预取单元。
K8构架中每个核心设计有2个预取器,一个是指令预取器,另一个是数据预取器。
K8L构架的Barcelona保持了2个的数量,但在性能上有了较大的改进。
一个明显的改进是数据预取器直接将数据寄存入L1缓存中,相比K8构架中寄存入L2缓存的做法,新的数据预取器准确率更高,速度更快,内存性能及CPU整体性能将得益于此。
● Barcelona新特性解析:创新——三级缓存 受工艺技术方面的影响,AMD处理器的缓存容量一直都要落后于Intel,AMD自己也清楚自己无法在宝贵的die上加入更多的晶体管来实现大容量的缓存,但是勇于创新的AMD却找到了更好的办法——集成内存控制器。
处理器整合内存控制器可以说是一项杰作,拥有整合内存控制器的K8构架仅依靠512KB的L2缓存就能够击败当时的对手Pentium 4。
直到现在的Athlon 64 X2也依然保持着Intel 2002年就已过时的512KB L2缓存。
现在Core 2已经拥有了4MB的L2缓存,看来Intel和AMD之间的缓存差距还将保持,因为Barcelona的L2缓存依然是512KB。
相比之下,Intel四核的Kentsfield芯片拥有8MB的L2缓存,而2007年末上市的新型Penryn芯片将拥有12MB的L2缓存。
Barcelona的缓存体系和K8构架有一定的相似之处,它的四颗核心各拥有64KB的L1缓存和512KB的L2缓存。
从简化芯片设计的角度来看,四核心共享巨大的L2缓存对K8L构架而言并不合适,所以AMD引入了L3缓存,得益于65nm工艺,Barcelona在一颗晶圆上集成四颗核心外,还集成了一块2MB容量的L3缓存。
也就是说L3缓存与4颗内核同样原生于一块晶圆,其容量为最小2M起跳。
同L2缓存一样,L3缓存也是独立的,L1缓存的数据和L3缓存的数据将不会重复。
Barcelona的缓存工作原理是:L2缓存是作为L1缓存的备用空间。
L1缓存储存着CPU当前最需要的数据,而当空间不足时,一些不是最重要的数据就转移到L2缓存中。
而当未来再次需要时,则从L2缓存中再次转移到L1缓存中。
新加入的L3缓存延续了L2缓存的角色,四颗核心的L2缓存将溢出的数据暂时寄存在L3缓存中。
L1缓存和L2缓存依然分别是2路和16路,L3缓存则是32路。
快速的32路L3缓存不仅可以更好的满足多任务并行,而且对单任务的执行也有着较大积极作用。
尤其在3D运用方面,2MB的L3缓存将对性能产生极大的推进作用。
AMD全新45nm的Shanghai架构 2008年11月13日,AMD公司宣布其代号为“上海”的新一代45nm四核皓龙处理器已经广泛上市。
“上海”性能最高提升达35%,而空载时的功耗可显著降低35%。
新一代四核AMD皓龙处理器采用创新的设计,能够带来更高的虚拟化性能和每瓦性价比,帮助数据中心提高效率,降低复杂性,从而最大限度地满足IT管理者的需要,以更低的投入实现更高的产出。
AMD公司负责计算解决方案业务的高级副总裁Randy Allen表示:“新一代四核AMD皓龙处理器是在正确的时间诞生的一款正确的产品。
堪称完美的提前推出,使之成为x86服务器性能的新王者。
通过与OEM厂商和解决方案供应商等合作伙伴的紧密合作,AMD的创新技术在满足企业用户目前最基本需求的同时,还为其未来发展做好准备。
自4年前AMD推出世界首款x86双核处理器以来,这一增强的新一代皓龙处理器带来了AMD产品性能和每瓦性价比的最大提升。” 领先的性能满足当今最迫切的商务需求 数据中心的管理者们面对日益增长的压力,诸如网络服务、数据库应用等的企业工作负载对计算的需求越来越高;而在当前的IT支出环境下,还要以更低的投入实现更高的产出。
迅速增长的新计算技术如云计算和虚拟化等,在今年第二季度实现了60%的同比增长率3,这些技术在迅速应用的同时也迫切需要一个均衡的系统解决方案。
最新的四核AMD皓龙处理器进一步增强了AMD独有的直连架构优势,能够为包括云计算和虚拟化在内的日渐扩大的异构计算环境提供具有出色稳定性和扩展性的解决方案。
卓越的虚拟化性能 具有改进的AMD直连架构和AMD虚拟化技术(AMD-V(TM)),45nm四核皓龙处理器成为已有的基于AMD技术的虚拟化平台的不二选择,目前全球的OEM厂商已基于上一代AMD四核皓龙处理器推出了9款专门为虚拟化应用而设计的服务器。
新一代处理器可提供更快的虚拟机转换时间,并优化快速虚拟化索引技术(RVI)的特性,从而提高虚拟机的效率,AMD的AMD-V(TM)还可以减少软件虚拟化的开销。
无与伦比的性价比 与历代的AMD皓龙处理器相比,新一代四核皓龙处理器带来了前所未有的性能和每瓦性能比显著增强,包括: o 以与上代四核皓龙处理器相同的功耗设计,大幅提高CPU时钟频率。
这得益于处理器设计增强、AMD业界领先的45nm沉浸式光刻技术和超强的处理器设计与验证能力。
o L3缓存容量提高200%,达到6MB,增强虚拟化、数据库和Java等内存密集型应用的性能。
o 支持DDR2-800内存,与现有AMD皓龙处理器相比内存带宽实现了大幅提高,并且比竞品使用的Fully-Buffered DIMM具有更高的能效。
o 即将推出的超传输总线(TM)30 (HyperTransport(TM) 30)技术将进一步增强AMD革命性的直连架构,计划于2009年2季度将处理器之间的通信带宽提高到176GB/s。
无可匹敌的节能特性 AMD皓龙处理器业已带来了业界领先的X86服务器处理器每瓦性价比,与之相比,新一代45nm四核AMD皓龙处理器在空载状态的能耗可以大幅降低35%,而性能可提高达35%。
“上海”采用了众多的新型节能技术:AMD智能预取技术,可允许处理器核心在空载时进入“暂停”状态,而不会对应用性能和缓存中的数据有任何影响,从而显著降低能耗;AMD CoolCore(TM) 技术能够关闭处理器中非工作区域以进一步节省能耗。
在平台配置相似的情况下,基于75瓦AMD 四核皓龙处理器的平台,与基于50瓦处理器的竞争平台相比,具有高达30%的每瓦性能比优势。
相似平台配置下,基于AMD 四核皓龙处理器2380的平台,空载状态的功耗为138瓦;与之对比,基于英特尔四核处理器的平台在相同状态下的功耗则为179瓦。
基于AMD 四核皓龙2380型号处理器的平台,在SPECpower_ssj(TM)2008基准测试中取得761ssj_ops/每瓦的总成绩 (308,089 ssj_ops @ 100% 的目标负载),而英特尔四核平台为总成绩为561ssj_ops/每瓦 (267,804 ssj_ops @ 100%的目标负载) 4 前所未有的平台稳定性 作为唯一用相同的架构提供2路到8路服务器处理器的x86微处理器制造商,AMD新一代45nm四核皓龙处理器在插槽和散热设计与上代四核和双核AMD皓龙处理器兼容,延续了AMD的领先地位。
这可以帮助消费者减少平台管理的复杂性和费用,增强数据中心的正常运行时间和生产力。
新的45nm处理器适用于现有的Socket 1207插槽架构,未来代号为“Istanbul”的AMD 下一代皓龙处理器也计划使用相同插槽。
全球OEM 厂商支持 作为业内最易于管理和一致的x86服务器平台,由于采用AMD皓龙处理器,至少是部分原因,全球OEM和系统开发商能够迅速完成验证流程,并预计从本月起开始交付基于增强的四核AMD皓龙处理器的下一代系统。
本季度和2009年第一季度,基于增强的四核AMD皓龙处理器的系统的供应量有望迅速增长。
惠普工业标准服务器业务部营销副总裁Paul Gottsegen 表示:“通过采用基于新 ‘上海’处理器的 HP ProLiant服务器,客户可以降低成本,同时使能效和性能更上层楼。
在与AMD公司过去的4年合作中,我们为各种规模的客户提供了基于AMD皓龙处理器的平台,并取得了空前的成功。
初期反馈结果表明‘上海’将成为赢者。” Sun公司系统业务部执行副总裁John Fowler 表示:“ Sun的创新系统设计和Solaris与增强型四核AMD皓龙处理器相结合,将为虚拟化应用和系统整合带来具有难以置信的强大性能、可扩展性和高能效特性的x64平台。
在数据中心增长过程中,基于AMD增强型四核皓龙处理器的Sun服务器能够处理最复杂的数据群并灵活扩展。
而由于历代平台之间的连续性,客户有信心确保新系统与已部署的AMD皓龙系统实现无缝兼容。” 戴尔商用产品部高级副总裁Brad Anderson表示:“戴尔和AMD公司共同致力于为企业提供强大的全系列产品,以简化IT环境管理并降低管理成本。
我们的PowerEdge服务器专门设计以充分利用AMD芯片中集成的虚拟化特性。
这种紧密协作效果显著,2路和4路机架和刀片式PowerEdge服务器已经取得了破纪录的虚拟化性能。” IBM刀片式服务器副总裁Alex Yost表示:“自2003年以来,IBM就利用AMD皓龙处理器的性能和直连架构满足企业用户计算密集型的需求,并为其带来更多选择。
IBM正在AMD新处理器高能效和虚拟化的基础上进一步创新,为我们的客户带来更高的价值。” o 采用直连架构的 AMD 皓龙(Opteron)(TM) 处理器可以提供领先的多技术。
使IT管理员能够在同一服务器上运行32位与64位应用软件,前提是该服务器使用的是64位操作系统。
o AMD 速龙(Athlon64),又叫阿斯龙(TM) 64 处理器可以为企业的台式电脑用户提供卓越的性能和重要的投资保护,具有出色的功能和性能,可以提供栩栩如生的数字媒体效果――包括音乐、视频、照片和 DVD 等。
o AMD 双核速龙(TM) 64(AthlonX2 64 )处理器可以提供更AMD双核速龙64处理器架构高的多任务性能,帮助企业在更短的时间内完成更多的任务(包括业务应用和视频、照片编辑,内容创建和音频制作等)。
这些强大的功能使其成为那些即将上市的新型媒体中心的最佳选择。
o AMD 炫龙(TM) 64(Turion64) 移动计算技术可以利用移动计算领域的最新成果,提供最高的移动办公能力,以及领先的 64 位计算技术。
o AMD 闪龙(TM)(Sempron64) 处理器不仅可以为企业提供出色的性价比,而且可以提高员工的日常工作效率。
o AMD 羿龙(TM)(phenom)处理器 全新架构的4核处理器,进一步满足用户需求(在命名中取消“64”,因为现今的CPU都是64位的,不必再标明)。
为满足消费者的不同需求,AMD近期也推出了3核羿龙产品! 对于消费者, AMD 也提供全系列 64 位产品。
o AMD 雷鸟(TM) (Thunderbird)处理器 o AMD 钻龙(TM) (Duron)处理器可以说是雷鸟的精简便宜版,架构和雷鸟处理器一样,其差别除了时脉较低之外,就是内建的L2 Cache,只有64K 。
嵌入式解决方案
AMD 的嵌入式解决方案以个人电脑以外的上网设备为目标市场,锁定的目标产品包括平板电脑、汽车导航及娱乐系统、家庭与小型办公室网络产品以及通信设备。
AMD Geode(TM) 解决方案系列不仅包括基于x86的嵌入式处理器,还包括多种系统解决方案。
AMD 的一系列 Alchemy(TM) 解决方案有低功率、高性能的 MIPS(TM) 处理器、无线技术、开发电路板及参考设计套件。
随着这些新的解决方案相继推出,AMD 的产品将会更加多元化,有助确立 AMD 在新一代产品市场上的领导地位。
精确生产技术
为了在当今竞争异常激烈的市场中获得成功,跨国电子公司需要值得信赖的供应商和合作伙伴来为他们按时按量地提供他们所需要的解决方案。
因此, AMD 采用了一种高效的、基于合作伙伴的研发模式,确保它的产品和解决方案可以始终在性能和功率方面保持领先。
借助于行业伙伴的技术和资源, AMD 为它的产品集成了先进的亚微米技术。
它的产品通常领先于行业总体水平,而且成本远低于平均成本。
为了在批量生产过程中无缝地采用这些先进的技术, AMD 开发和采用了数百种旨在自动确定最复杂的制造决策的专利技术。
这些业界独一无二的功能现在被统称为自动化精确生产( APM )。
它们为 AMD 提供了前所未有的生产速度、准确性和灵活性。
0条评论