CPU好与坏看的是哪些参数?
主频
主频也叫时钟频率,单位是兆赫(MHz)或千兆赫(GHz),用来表示CPU的运算、处理数据的速度。
CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度,这不仅是片面的,而且对于服务器来讲,这个认识也出现了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系,即使是两大处理器厂家Intel(英特尔)和AMD,在这点上也存在着很大的争议,从Intel的产品的发展趋势,可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有人曾经拿过一块1GHz的全美达处理器来做比较,它的运行效率相当于2GHz的Intel处理器。
主频和实际的运算速度存在一定的关系,但并不是一个简单的线性关系 所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中,也可以看到这样的例子:1
GHz Itanium芯片能够表现得不多跟266 GHz至强(Xeon)/Opteron一样快,或是15 GHz Itanium
2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线、总线等等各方面的性能指标。
主频和实际的运算速度是有关的,只能说主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。
外频
外频是CPU的基准频率,单位是MHz。CPU的外频决定着整块主板的运行速度。通俗地说,在台式机中,所说的超频,都是超CPU的外频(当然一般情况下,CPU的倍频都是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。
目前的绝大部分电脑系统中外频与主板前端总线不是同步速度的,而外频与前端总线(FSB)频率又很容易被混为一谈,下面的前端总线介绍谈谈两者的区别。
前端总线(FSB)频率
前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。有一条公式可以计算,即数据带宽=(总线频率×数据位宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。比方,现在的支持64位的至强Nocona,前端总线是800MHz,按照公式,它的数据传输最大带宽是64GB/秒。
外频与前端总线(FSB)频率的区别:前端总线的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一亿次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8bit/Byte=800MB/s。
其实现在“HyperTransport”构架的出现,让这种实际意义上的前端总线(FSB)频率发生了变化。IA-32架构必须有三大重要的构件:内存控制器Hub
(MCH) ,I/O控制器Hub和PCI Hub,像Intel很典型的芯片组 Intel
7501、Intel7505芯片组,为双至强处理器量身定做的,它们所包含的MCH为CPU提供了频率为533MHz的前端总线,配合DDR内存,前端总线带宽可达到43GB/秒。但随着处理器性能不断提高同时给系统架构带来了很多问题。而“HyperTransport”构架不但解决了问题,而且更有效地提高了总线带宽,比方AMD
Opteron处理器,灵活的HyperTransport
I/O总线体系结构让它整合了内存控制器,使处理器不通过系统总线传给芯片组而直接和内存交换数据。这样的话,前端总线(FSB)频率在AMD
Opteron处理器就不知道从何谈起了。
CPU的位和字长
位:在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是 “0”或是“1”在CPU中都是 一“位”。
字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。字节和字长的区别:由于常用的英文字符用8位二进制就可以表示,所以通常就将8位称为一个字节。字长的长度是不固定的,对于不同的CPU、字长的长度也不一样。8位的CPU一次只能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次可以处理8个字节。
倍频系数
倍频系数是指CPU主频与外频之间的相对比例关系。在相同的外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的,一味追求高主频而得到高倍频的CPU就会出现明显的“瓶颈”效应-CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的,少量的如Inter
酷睿2
核心的奔腾双核E6500K和一些至尊版的CPU不锁倍频,而AMD之前都没有锁,现在AMD推出了黑盒版CPU(即不锁倍频版本,用户可以自由调节倍频,调节倍频的超频方式比调节外频稳定得多)。
缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑,缓存都很小。
L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32-256KB。
L2 Cache(二级缓存)是CPU的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,原则是越大越好,以前家庭用CPU容量最大的是512KB,现在笔记本电脑中也可以达到2M,而服务器和工作站上用CPU的L2高速缓存更高,可以达到8M以上。
L3 Cache(三级缓存),分为两种,早期的是外置,现在的都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。
其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB
L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心Itanium2处理器。
但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。
CPU扩展指令集
CPU依靠指令来自计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分(指令集共有四个种类),而从具体运用看,如Intel的MMX(Multi
Media Extended,此为AMD猜测的全称,Intel并没有说明词源)、SSE、 SSE2(Streaming-Single
instruction multiple data-Extensions
2)、SSE3、SSE4系列和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。通常会把CPU的扩展指令集称为”CPU的指令集”。SSE3指令集也是目前规模最小的指令集,此前MMX包含有57条命令,SSE包含有50条命令,SSE2包含有144条命令,SSE3包含有13条命令。目前SSE4也是最先进的指令集,英特尔酷睿系列处理器已经支持SSE4指令集,AMD会在未来双核心处理器当中加入对SSE4指令集的支持,全美达的处理器也将支持这一指令集。
CPU内核和I/O工作电压
从586CPU开始,CPU的工作电压分为内核电压和I/O电压两种,通常CPU的核心电压小于等于I/O电压。其中内核电压的大小是根据CPU的生产工艺而定,一般制作工艺越小,内核工作电压越低;I/O电压一般都在16~5V。低电压能解决耗电过大和发热过高的问题。
制造工艺
制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设计。现在主要的180nm、130nm、90nm、65nm、45纳米。最近inter已经有32纳米的制造工艺的酷睿i3/i5系列了。
而AMD则表示、自己的产品将会直接跳过32nm工艺(2010年第三季度生产少许32nm产品、如Orochi、Llano)于2011年中期初发布28nm的产品(名称未定)
指令集
(1)CISC指令集
CISC指令集,也称为复杂指令集,英文名是CISC,(Complex
Instruction Set
Computer的缩写)。在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是IA-32架构)CPU及其兼容CPU,如AMD、VIA的。即使是现在新起的X86-64(也被成AMD64)都是属于CISC的范畴。
要知道什么是指令集还要从当今的X86架构的CPU说起。X86指令集是Intel为其第一块16位CPU(i8086)专门开发的,IBM1981年推出的世界第一台PC机中的CPU-i8088(i8086简化版)使用的也是X86指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片,以后就将X86指令集和X87指令集统称为X86指令集。
虽然随着CPU技术的不断发展,Intel陆续研制出更新型的i80386、i80486直到过去的PII至强、PIII至强、Pentium
3,Pentium
4系列,最后到今天的酷睿2系列、至强(不包括至强Nocona),但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集,所以它的CPU仍属于X86系列。由于Intel
X86系列及其兼容CPU(如AMD Athlon
MP、)都使用X86指令集,所以就形成了今天庞大的X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU和AMD的服务器CPU两类。
(2)RISC指令集
RISC是英文“Reduced
Instruction Set Computing ”
的缩写,中文意思是“精简指令集”。它是在CISC指令系统基础上发展起来的,有人对CISC机进行测试表明,各种指令的使用频度相当悬殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20%,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需要复杂的操作,必然会降低计算机的速度。基于上述原因,20世纪80年代RISC型CPU诞生了,相对于CISC型CPU
,RISC型CPU不仅精简了指令系统,还采用了一种叫做“超标量和超流水线结构”,大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与传统的CISC(复杂指令集)相对。相比而言,RISC的指令格式统一,种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的CPU,特别是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适合高档服务器的操作系统UNIX,现在Linux也属于类似UNIX的操作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。
目前,在中高档服务器中采用RISC指令的CPU主要有以下几类:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、Alpha处理器。
(3)IA-64
EPIC(Explicitly
Parallel Instruction
Computers,精确并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很多,单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重要步骤。从理论上说,EPIC体系设计的CPU,在相同的主机配置下,处理Windows的应用软件比基于Unix下的应用软件要好得多。
Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即Merced)。它是64位处理器,也是IA-64系列中的第一款。微软也已开发了代号为Win64的操作系统,在软件上加以支持。在Intel采用了X86指令集之后,它又转而寻求更先进的64-bit微处理器,Intel这样做的原因是,它们想摆脱容量巨大的x86架构,从而引入精力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架构便诞生了。IA-64
在很多方面来说,都比x86有了长足的进步。突破了传统IA32架构的许多限制,在数据的处理能力,系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。
IA-64微处理器最大的缺陷是它们缺乏与x86的兼容,而Intel为了IA-64处理器能够更好地运行两个朝代的软件,它在IA-64处理器上(Itanium、Itanium2
……)引入了x86-to-IA-64的解码器,这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效率的解码器,也不是运行x86代码的最好途径(最好的途径是直接在x86处理器上运行x86代码),因此Itanium
和Itanium2在运行x86应用程序时候的性能非常糟糕。这也成为X86-64产生的根本原因。
(4)X86-64 (AMD64 / EM64T)
AMD公司设计,可以在同一时间内处理64位的整数运算,并兼容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据操作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,如果是32位运算操作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。
x86-64(也叫AMD64)的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86。AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。在技术上AMD在x86-64架构中为了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器以提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:Long
Mode(长模式)和Legacy Mode(遗传模式),Long模式又分为两种子模式(64bit模式和Compatibility
mode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron处理器
而今年也推出了支持64位的EM64T技术,再还没被正式命为EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64位sub-mode,和AMD的X86-64技术类似,采用64位的线性平面寻址,加入8个新的通用寄存器(GPRs),还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64位技术将兼容IA32和IA32E,只有在运行64位操作系统下的时候,才将会采用IA32E。IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode,同AMD64一样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理器已经加入了一些64位技术,Intel的Pentium
4E处理器也支持64位技术。
应该说,这两者都是兼容x86指令集的64位微处理器架构,但EM64T与AMD64还是有一些不一样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供。
超流水线与超标量
在解释超流水线与超标量前,先了解流水线(Pipeline)。流水线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5-6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5-6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。
超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。例如Pentium
4的流水线就长达20级。将流水线设计的步(级)越长,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用,很可能会出现主频较高的CPU实际运算速度较低的现象,Intel的奔腾4就出现了这种情况,虽然它的主频可以高达14G以上,但其运算性能却远远比不上AMD
12G的速龙甚至奔腾III。
封装形式
CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot
x槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。现在还有PLGA(Plastic Land Grid
Array)、OLGA(Organic Land Grid
Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。
多线程
同时多线程Simultaneous
Multithreading,简称SMT。SMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或Cache未命中带来的访问内存延时。当没有多个线程可用时,SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从306GHz
Pentium 4开始,所有处理器都将支持SMT技术。
多核心
多核心,也指单芯片多处理器(Chip
Multiprocessors,简称CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与CMP比较,
SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入018微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。目前,IBM
的Power 4芯片和Sun的
MAJC5200芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。
2005年下半年,Intel和AMD的新型处理器也将融入CMP结构。新安腾处理器开发代码为Montecito,采用双核心设计,拥有最少18MB片内缓存,采取90nm工艺制造,它的设计绝对称得上是对当今芯片业的挑战。它的每个单独的核心都拥有独立的L1,L2和L3
cache,包含大约10亿支晶体管。
SMP
SMP(Symmetric
Multi-Processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。像双至强,也就是所说的二路,这是在对称处理器系统中最常见的一种(至强MP可以支持到四路,AMD
Opteron可以支持1-8路)。也有少数是16路的。但是一般来讲,SMP结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见,像UNIX服务器可支持最多256个CPU的系统。
构建一套SMP系统的必要条件是:支持SMP的硬件包括主板和CPU;支持SMP的系统平台,再就是支持SMP的应用软件。为了能够使得SMP系统发挥高效的性能,操作系统必须支持SMP系统,如WINNT、LINUX、以及UNIX等等32位操作系统。即能够进行多任务和多线程处理。多任务是指操作系统能够在同一时间让不同的CPU完成不同的任务;多线程是指操作系统能够使得不同的CPU并行的完成同一个任务
。
要组建SMP系统,对所选的CPU有很高的要求,首先、CPU内部必须内置APIC(Advanced Programmable
Interrupt Controllers)单元。Intel 多处理规范的核心就是高级可编程中断控制器(Advanced
Programmable Interrupt
Controllers–APICs)的使用;再次,相同的产品型号,同样类型的CPU核心,完全相同的运行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批次的CPU作为双处理器运行的时候,有可能会发生一颗CPU负担过高,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能导致死机。
NUMA技术
NUMA即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统,各个节点可以是单个的CPU或是SMP系统。在NUMA中,Cache
的一致性有多种解决方案,需要操作系统和特殊软件的支持。图2中是Sequent公司NUMA系统的例子。这里有3个SMP模块用高速专用网络联起来,组成一个节点,每个节点可以有12个CPU。像Sequent的系统最多可以达到64个CPU甚至256个CPU。显然,这是在SMP的基础上,再用NUMA的技术加以扩展,是这两种技术的结合。
乱序执行技术
乱序执行(out-of-orderexecution),是指CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速度。分枝技术:(branch)指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行。
CPU内部的内存控制器
许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache
hit不可预测的时候),并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order
execution)这样的CPU特性,也会受内存延迟的限制。这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自CPU
cache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns,而CPU速度则达到了3GHz以上,一次单独的内存请求可能会浪费200-300次CPU循环。即使在缓存命中率(cache
hit rate)达到99%的情况下,CPU也可能会花50%的时间来等待内存请求的结束- 比如因为内存延迟的缘故。
你可以看到Opteron整合的内存控制器,它的延迟,与芯片组支持双通道DDR内存控制器的延迟相比来说,是要低很多的。英特尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥芯片将变得不那么重要。但改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性
服务器方面,据说i因为技术原因,2011的至强止步10c/20t,这个应该是已知的最强的即将发布的服务器cpu了,至强系列是高性能系列,价格不菲,按照i的规划,新至强应该做到12c/24t,应该是技术没达到吧,多核技术还得amd!amd的六核cpu可比i早。话说,很多cpu在中关村都能查到,在这里问,浪费时间,浪费精力。希望能够帮助你。
主频186G: CPU的主频,即CPU内核工作的时钟频率(CPU Clock Speed)。通常所说的某某CPU是多少兆赫的,而这个多少兆赫就是“CPU的主频”。很多人认为CPU的主频就是其运行速度,其实不然。CPU的主频表示在CPU内数字脉冲信号震荡的速度,与CPU实际的运算能力并没有直接关系。主频和实际的运算速度存在一定的关系,但目前还没有一个确定的公式能够定量两者的数值关系,因为CPU的运算速度还要看CPU的流水线的各方面的性能指标(缓存、指令集,CPU的位数等等)。由于主频并不直接代表运算速度,所以在一定情况下,很可能会出现主频较高的CPU实际运算速度较低的现象。比如AMD公司的AthlonXP系列CPU大多都能以较低的主频,达到英特尔公司的Pentium 4系列CPU较高主频的CPU性能,所以AthlonXP系列CPU才以PR值的方式来命名。因此主频仅是CPU性能表现的一个方面,而不代表CPU的整体性能。
CPU的主频不代表CPU的速度,但提高主频对于提高CPU运算速度却是至关重要的。举个例子来说,假设某个CPU在一个时钟周期内执行一条运算指令,那么当CPU运行在100MHz主频时,将比它运行在50MHz主频时速度快一倍。因为100MHz的时钟周期比50MHz的时钟周期占用时间减少了一半,也就是工作在100MHz主频的CPU执行一条运算指令所需时间仅为10ns比工作在50MHz主频时的20ns缩短了一半,自然运算速度也就快了一倍。只不过电脑的整体运行速度不仅取决于CPU运算速度,还与其它各分系统的运行情况有关,只有在提高主频的同时,各分系统运行速度和各分系统之间的数据传输速度都能得到提高后,电脑整体的运行速度才能真正得到提高。
提高CPU工作主频主要受到生产工艺的限制。由于CPU是在半导体硅片上制造的,在硅片上的元件之间需要导线进行联接,由于在高频状态下要求导线越细越短越好,这样才能减小导线分布电容等杂散干扰以保证CPU运算正确。因此制造工艺的限制,是CPU主频发展的最大障碍之一。
1066MHZ前端总线 :总线是将信息以一个或多个源部件传送到一个或多个目的部件的一组传输线。通俗的说,就是多个部件间的公共连线,用于在各个部件之间传输信息。人们常常以MHz表示的速度来描述总线频率。总线的种类很多,前端总线的英文名字是Front Side Bus,通常用FSB表示,是将CPU连接到北桥芯片的总线。选购主板和CPU时,要注意两者搭配问题,一般来说,如果CPU不超频,那么前端总线是由CPU决定的,如果主板不支持CPU所需要的前端总线,系统就无法工作。也就是说,需要主板和CPU都支持某个前端总线,系统才能工作,只不过一个CPU默认的前端总线是唯一的,因此看一个系统的前端总线主要看CPU就可以。
2M二级高速缓存 :CPU缓存(Cache Memory)是位于CPU与内存之间的临时存储器,它的容量比内存小但交换速度快。在缓存中的数据是内存中的一小部分,但这一小部分是短时间内CPU即将访问的,当CPU调用大量数据时,就可避开内存直接从缓存中调用,从而加快读取速度。由此可见,在CPU中加入缓存是一种高效的解决方案,这样整个内存储器(缓存+内存)就变成了既有缓存的高速度,又有内存的大容量的存储系统了。缓存对CPU的性能影响很大,主要是因为CPU的数据交换顺序和CPU与缓存间的带宽引起的。
缓存的工作原理是当CPU要读取一个数据时,首先从缓存中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不必再调用内存。
775针脚 目前CPU都采用针脚式接口与主板相连,而不同的接口的CPU在针脚数上各不相同。CPU接口类型的命名,习惯用针脚数来表示,比如目前Pentium 4系列处理器所采用的Socket 478接口,其针脚数就为478针;而Athlon XP系列处理器所采用的Socket 939接口,其针脚数就为939针。
原则上CPU性能的好坏和针脚数的多少是没有关系的,而且CPU上的针脚也并不是每个针脚都是起作用的,也就是说其实CPU上还有些针脚是没有任何作用的“摆设”,是闲置起的。这是因为CPU厂商在设计CPU时,必然会考虑到今后一段时间内的功能扩展和性能提高,而会预留一些暂时不起作用的针脚以便今后改进。不过随着CPU技术的发展,需要越来越多的CPU针脚以实现更丰富的功能以及更高的性能,例如集成双通道内存控制器所需要的针脚数量就要比只集成单通道内存控制器所需要的针脚数要多得多,因此总的来说CPU针脚数有越来越多的趋势,基本上可以认为针脚多的CPU其架构也越先进。但是任何事物都不是绝对的,例如AMD在移动平台上用来取代Socket 754的Socket S1其针脚数反而从754根减少到了638根。
64位机器 这里的64位技术是相对于32位而言的,这个位数指的是CPU GPRs(General-Purpose Registers,通用寄存器)的数据宽度为64位,64位指令集就是运行64位数据的指令,也就是说处理器一次可以运行64bit数据。64bit处理器并非现在才有的,在高端的RISC(Reduced Instruction Set Computing,精简指令集计算机)很早就有64bit处理器了,比如SUN公司的UltraSparc Ⅲ、IBM公司的POWER5、HP公司的Alpha等。
64bit计算主要有两大优点:可以进行更大范围的整数运算;可以支持更大的内存。不能因为数字上的变化,而简单的认为64bit处理器的性能是32bit处理器性能的两倍。实际上在32bit应用下,32bit处理器的性能甚至会更强,即使是64bit处理器,目前情况下也是在32bit应用下性能更强。所以要认清64bit处理器的优势,但不可迷信64bit。
要实现真正意义上的64位计算,光有64位的处理器是不行的,还必须得有64位的操作系统以及64位的应用软件才行,三者缺一不可,缺少其中任何一种要素都是无法实现64位计算的。目前,在64位处理器方面,Intel和AMD两大处理器厂商都发布了多个系列多种规格的64位处理器;而在操作系统和应用软件方面,目前的情况不容乐观。因为真正适合于个人使用的64位操作系统现在就只有Windows XP X64,而Windows XP X64本身也只是一个过渡性质的64位操作系统,在Windows Vista发布以后就将被淘汰,而且Windows XP X64本身也不太完善,易用性不高,一个明显的例子就是各种硬件设备的驱动程序很不完善,而且现在64位的应用软件还基本上没有,确实硬件厂商和软件厂商也不愿意去为一个过渡性质的操作系统编写驱动程序和应用软件。所以要想实现真正的64位计算,恐怕还得等到Windows Vista普及一段时间之后才行。
目前主流CPU使用的64位技术主要有AMD公司的AMD64位技术、Intel公司的EM64T技术、和Intel公司的IA-64技术。
双核芯的 在2005年以前,主频一直是两大处理器巨头Intel和AMD争相追逐的焦点。而且处理器主频也在Intel和AMD的推动下达到了一个又一个的高峰就在处理器主频提升速度的同时,也发现在目前的情况下,单纯主频的提升已经无法为系统整体性能的提升带来明显的好处,并且高主频带来了处理器巨大的发热量,更为不利是Intel和AMD两家在处理器主频提升上已经有些力不从心了。在这种情况下,Intel和AMD都不约而同地将投向了多核心的发展方向在不用进行大规模开发的情况下将现有产品发展成为理论性能更为强大的多核心处理器系统,无疑是相当明智的选择。
双核处理器就基于单个半导体的一个处理器上拥有两个一样功能的处理器核心,即是将两个物理处理器核心整合入一个内核中。事实上,双核架构并不是什么新技术,不过此前双核心处理器一直是服务器的专利,现在已经开始普及之中。
主流至强XEON可以嘛?
XEON
Xeon是英特尔生产的400MHz的奔腾微处理器,它用于"中间范围"的企业服务器和工作站。在英特尔的服务器主板上,多达八个Xeon处理器能够共用100MHz的总线而进行多路处理。Xeon正在取代Pentium Pro而成为英特尔的主要企业微芯片。Xeon设计用于因特网以及大量的数据处理服务,例如工程、图像和多媒体等需要快速传送大量数据的应用。Xeon是奔腾生产线的高端产品。
Xeon基于奔腾微处理器P6构架,它设计成与新的快速外围元件互连线以及加速图形端口一起工作。Xeon具有:512千字节或1兆字节,400MHz的高速缓冲存储器、在处理器、RAM和I/O器件之间传递数据的高速总线、能提供36位地址的扩展服务器内存结构。
装有Xeon微处理器的计算机一般可使用Windows NT、NetWare或Unix操作系统,其系统可与Sun Microsystem、Silicon Graphics等媲美。
XEON 中文名称 至强
现代Xeon 则是作为intel的高端处理器形象出现。现在基本已经形成如下格局:高端Xeon,中端Core/Pentium,低端Celeron赛扬。其中Xeon由于可以使用多处理器技术,因此尤其受到多任务用户推荐。
至强(Xeon)处理器
至强的诞生:Pentium II Xeon
1998年英特尔发布了Pentium II Xeon(至强)处理器。Xeon是英特尔引入的新品牌,当时Intel公司为了区分服务器市场和普通个人电脑市场,决定研制全新的服务器CPU,命名也跟普通CPU做了一些明显的区分,称为Pentium II Xeon,取代之前所使用的Pentium Pro品牌。这个产品线面向中高端企业级服务器、工作站市场;是英特尔公司进一步区格市场的重要步骤。Xeon主要设计来运行商业软件、因特网服务、公司数据储存、数据归类、数据库、电子,机械的自动化设计等。
Pentium II Xeon处理器不但有更快的速度,更大的缓存,更重要的是可以支持多达4路或者8路的SMP对称多CPU处理功能,它采用和Pentium II Slot1接口不同的Slot 2接口,必须配合专门的服务器主板才能使用。
巨大的成功:Pentium III Xeon
1999年,英特尔发布了Pentium III Xeon处理器。相信大家都还记得,采用“铜矿”核心的奔腾3处理器那几年是如何的风光,至今都还被誉为一代经典产品,而作为Pentium II Xeon的后继者,除了在内核架构上采纳全新设计以外,也继承了Pentium III处理器新增的70条指令集,以更好执行多媒体、流媒体应用软件。除了面对企业级的市场以外,Pentium III Xeon加强了电子商务应用与高阶商务计算的能力。Intel还将Xeon分为两个部分,低端Xeon和高端Xeon。其中,低端Xeon和普通的 Coppermine一样,仅装备256KB二级缓存,并且不支持多处理器。这样低端Xeon和普通的Pentium III的性能差距很小,价格也相差不多;而高端Xeon还是具有以前的特征,支持更大的缓存和多处理器。
前赴后继:Pentium 4 Xeon
2001年英特尔发布了Xeon处理器。英特尔将Xeon的前面去掉了Pentium的名号,并不是说就与x86脱离了关系,而是更加明晰品牌概念。 Xeon处理器的市场定位也更加瞄准高性能、均衡负载、多路对称处理等特性,而这些是台式电脑的Pentium品牌所不具备的。Xeon处理器实际上还是基于Pentium 4的内核,而且同样是64位的数据带宽,但由于其利用了与AGP 4X相同的原理--“四倍速”技术,因此其前端总线有了巨大的提升,表现更是远胜过Pentium III Xeon处理器。Xeon处理器基于英特尔的NetBurst架构,有更高级的网络功能,及更复杂更卓越的3D图形性能,另一方面,支持至强的芯片组也在并行运算、支持高性能I/O子系统(如SCSI磁盘阵列、千兆网络接口)、支持PCI总线分段等方面更好地支持服务器端的运算。
Prestonia
是Xeon处理器的第二代核心,Prestonia同第一代的Foster核心之间的首要区别就是整合的二级缓存容量的差别,前者为512KB,而后者仅为256KB。Prestonia核心处理器也采用了先进的013微机制造工艺。但是Prestonia核心最大的优势就是增加了对Hyper- Threading(超线程)的支持。Hyperthreading早先称为Jackson技术,这是一种多线程(SMT Simultaneous Multi-Threading)技术的扩展,其主要功能就是让处理器在单处理器工作模式下也进行多线程工作(每块处理器可以同时进行一个以上进程的处理)。
Nocona
这是Intel的XEON CPU核心,采用90nm制程,使用800Mhz FSB,具有16KB L1缓存、1MB L2缓存和12KB uOps Trace缓存,同时支持SSE3以及HyperThreading。对应Xeon处理器通过EM64T技术同时支持32位和64位计算,并通过集成 DBS(Demand Based Switching,基于需要切换技术)实现增强型SpeedStep技术,可以根据工作负载动态调整处理器运行频率和功耗。
Irwindale
Xeon产品的核心,前端总线、HyperThreadingII、增强型Speedstep、EDB以及EM64T都和Nocona完全一致。该核心与 Nocona核心最大的不同就是二级缓存进一步提升到2MB,频率由30G开始起跳,与Pentium 4 600系列处理器的架构有些类似。不过由于二级缓存的加大,工艺也没得得到改进,导致该处理器的功率和发热量均大大高于Nocona,在选购该处理器时散热应该引起足够的重视。
Conroe(双核心)
Intel Xeon 3000系列的新核心,与Intel Core 2 Duo采用相同的LGA 775针脚,而非Woodcrest所用的LGA 771针脚。Xeon 3000系列处理器运行于1066 MHz系统总线(FSB),内含4 MB或2 MB共享型二级缓存,支持Intel 64位扩展技术(Intel EM64T),Intel虚拟化技术(Intel Virtualization Technology)及Enhanced Intel SpeedStep技术,其中包括 Xeon 3040, 3050, 3060和3070,Intel Xeon 3070 (266 GHz/4MB L2/FSB1066),Intel Xeon 3060 (240 GHz/4MB L2/FSB1066),Intel Xeon 3050 (213 GHz/2MB L2/FSB1066),Intel Xeon 3040 (183 GHz/2MB L2/FSB1066)。其中3040和3050配备了2MB二级缓存,而3060和3070配备了4MB二级缓存。新的Xeon处理器采用了Core核心,与前代的NetBurst相比,在性能和功耗方面都有了很大的提高和改善。
Dempsey(双核心)
Dempsey是Xeon的双核心版本,型号命名为50xx的双核处理器,包括5030(2x2MB/267GHz/667 MHz前端总线/功率95W/DP)、5050(2x2MB/300GHz/667MHz前端总线/功率95W/DP)、5060 (2x2MB/320GHz/前端总线1066 MHz/功率130W/DP)、5063(2x2MB/320GHz/前端总线1066 MHz/功率95W/DP)、(5080 2x2MB/373 GHz/前端总线1066 MHz/功率130W/DP)。这些Xeon 50XX系列均为双核心,主频从250GHz到373GHz,所有处理器采用 65 纳米制造工艺,均支持FB-DIMM内存,英特尔虚拟化技术、超线程(HT)技术、增强型英特尔SpeedStep动态节能技术(其中5063、5060 不支持)、英特尔64位内存扩展技术、英特尔病毒防护技术。这些处理器均配置了4MB L2缓存,其中每个核心独享2MB L2缓存,其前端总线为1066MHz或者667MHz,可以提供85GB/s或者53GB/s的传输带宽。采用65nm工艺的双核心Xeon Dempsey使用LGA771接口。与此50XX系列配合的芯片组为INTEL 5000X,5000P,5000Z,5000V。
WoodCrest(双核心)
这是XEON采用Core微架构的服务器级双核心处理器,WoodCrest核心处理器包括Xeon 5110(16GHz/4MB L2/1066MHz FSB)、Xeon 5120(186GHz/4MB L2/1066MHz FSB)、Xeon 5130(2GHz/4MB L2/1333MHz FSB)、Xeon 5140(233GHz/4MB L2/1333MHz FSB)、Xeon 5150(266GHz/4MB L2/1333MHz FSB)及最高型号Xeon 5160(3GHz/4MB L2/1333MHz FSB),采用LGA 771处理器接口,全线最高功耗只有80W,对比上代Dempsey核心最高功耗可高达130W有着明显的改善,支持Intel EM64T、Intel Execute Disable Bit、Intel Virtualization Technology功能,而Demand-Based Switching功能则只提供于Xeon 5140或以上的型号。另有一款低功耗产品XEON 5148 LV,频率为233GHz/4MB L2 Cache/1333MHz FSB,但最高功耗只有40W,是正常型号的一半,并完全支持援Intel EM64T、Intel Execute Disable Bit、Intel Virtualization Technology功能及Demand-Based Switching功能。与此51XX系列配合的芯片组为INTEL 5000X,5000P,5000Z,5000V。
processor : 44(处理器线程序号,包括内核和超线程)
vendor_id : AuthenticAMD(品牌AMD)
cpu family : 21(CPU家族代号)
model : 1(型号代号)
model name : AMD Opteron(TM) Processor 6234(型号名称)
stepping : 2(工艺步进)
cpu MHz : 2400127(主频24G)
cache size : 2048 KB(缓存2M)
physical id : 0(CPU物理封装的序号)
siblings : 12(逻辑处理器数量,相当于线程数。)
core id : 5(CPU物理内核的序号)
cpu cores : 6(CPU物理内核的数量)
apicid : 43
initial apicid : 11
fpu : yes
fpu_exception : yes
cpuid level : 13
wp : yes
没有12位的处理器。你的CPU是64位的。
由于AMD采用多线程技术与Intel不一样,这款CPU应描述为6模块12核,而不是6核12线程。
CPU 的参数有很多,而且 CPU 的技术也在不断变化,有一些概念/参数会被取代。
关于性能:
1,CPU 核心的架构,这是影响 CPU 运算性能最关键的因素之一。相对而言这个平时概念我们接触较少。你可以大概的理解为这就是 P3 / P4 / Core 等不同世代 CPU 架构之间的差异。通常而言,同等级别的 CPU,基于新架构的 CPU 会有更高的性能,支持更多的功能。
2,支持的指令长度。目前主流的处理器都是支持 64bit 指令的。64bit 带来的好处之一是内存寻址的空间增大,突破 32bit 4GB 内存寻址范围的限制。
3,主频,即 CPU 核心的工作频率,当前主流的处理器从 1xxGHz - 3xx GHz 不等。同样的处理器架构,主频越高性能越高。
4,FSB,前端总线,这个概念在新的处理器平台中比较少见了,主要是因为内存控制器等原属于北桥的功能被整合到处理器当中。对于新的处理器,如 Core i3 / i5 / i7 这个档次的,宣传当中已经看不到关于 FSB 的信息。
5,CACHE,缓存,目前说的缓存主要是二级缓存, L2 cache,越大越好。缓存也是 CPU 里面占用空间比较多的电路。
6,核心数量,单核/双核/三核/四核/六核/八核 等。越多越好。
7,支持的特性:比如
a) 超线程,支持超线程的 CPU 可以同时处理两个线程,在操作系统中,一个内核可以被看作是两个单独的处理器,双核超线程,在操作系统中就可以看到四个处理器了。
b) 指令集,支持的指令集越丰富,越新,对新技术的支持越好,处理特定的运算会有优势。比如说多媒体播放/编码,3D 的回放和制作等。
8,功耗,低碳也是我们现在要关注的因素之一。
9,封装,有 BGA,PGA 等等。
还有很多其他的指标,对于普通消费者,以上的指标应该可以满足你选择判别处理器的需要了。
CPU 参数详解
CPU是Central Processing Unit(中央处理器)的缩写,CPU一般由逻辑运算单元、控制单元和存储单元组成。在逻辑运算和控制单元中包括一些寄存器,这些寄存器用于CPU在处理数据过程中数据的暂时保存。大家需要重点了解的CPU主要指标/参数有:
1主频
主频,也就是CPU的时钟频率,简单地说也就是CPU的工作频率,例如我们常说的P4(奔四)18GHz,这个18GHz(1800MHz)就是CPU的主频。一般说来,一个时钟周期完成的指令数是固定的,所以主频越高,CPU的速度也就越快。主频=外频X倍频。
此外,需要说明的是AMD的Athlon XP系列处理器其主频为PR(Performance Rating)值标称,例如Athlon XP 1700+和1800+。举例来说,实际运行频率为153GHz的Athlon XP标称为1800+,而且在系统开机的自检画面、Windows系统的系统属性以及WCPUID等检测软件中也都是这样显示的。
2外频
外频即CPU的外部时钟频率,主板及CPU标准外频主要有66MHz、100MHz、133MHz几种。此外主板可调的外频越多、越高越好,特别是对于超频者比较有用。
3倍频
倍频则是指CPU外频与主频相差的倍数。例如Athlon XP 2000+的CPU,其外频为133MHz,所以其倍频为125倍。
4接口
接口指CPU和主板连接的接口。主要有两类,一类是卡式接口,称为SLOT,卡式接口的CPU像我们经常用的各种扩展卡,例如显卡、声卡等一样是竖立插到主板上的,当然主板上必须有对应SLOT插槽,这种接口的CPU目前已被淘汰。另一类是主流的针脚式接口,称为Socket,Socket接口的CPU有数百个针脚,因为针脚数目不同而称为Socket370、Socket478、Socket462、Socket423等。
5缓存
缓存就是指可以进行高速数据交换的存储器,它先于内存与CPU交换数据,因此速度极快,所以又被称为高速缓存。与处理器相关的缓存一般分为两种——L1缓存,也称内部缓存;和L2缓存,也称外部缓存。例如Pentium4“Willamette”内核产品采用了423的针脚架构,具备400MHz的前端总线,拥有256KB全速二级缓存,8KB一级追踪缓存,SSE2指令集。
内部缓存(L1 Cache)
也就是我们经常说的一级高速缓存。在CPU里面内置了高速缓存可以提高CPU的运行效率,内置的L1高速缓存的容量和结构对CPU的性能影响较大,L1缓存越大,CPU工作时与存取速度较慢的L2缓存和内存间交换数据的次数越少,相对电脑的运算速度可以提高。不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大,L1缓存的容量单位一般为KB。
外部缓存(L2 Cache)
CPU外部的高速缓存,外部缓存成本昂贵,所以Pentium 4 Willamette核心为外部缓存256K,但同样核心的赛扬4代只有128K。
6多媒体指令集
为了提高计算机在多媒体、3D图形方面的应用能力,许多处理器指令集应运而生,其中最著名的三种便是Intel的MMX、SSE/SSE2和AMD的3D NOW!指令集。理论上这些指令对目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。
7制造工艺
早期的处理器都是使用05微米工艺制造出来的,随着CPU频率的增加,原有的工艺已无法满足产品的要求,这样便出现了035微米以及025微米工艺。制作工艺越精细意味着单位体积内集成的电子元件越多,而现在,采用018微米和013微米制造的处理器产品是市场上的主流,例如Northwood核心P4采用了013微米生产工艺。而在2003年,Intel和AMD的CPU的制造工艺会达到009毫米。
8电压(Vcore)
CPU的工作电压指的也就是CPU正常工作所需的电压,与制作工艺及集成的晶体管数相关。正常工作的电压越低,功耗越低,发热减少。CPU的发展方向,也是在保证性能的基础上,不断降低正常工作所需要的电压。例如老核心Athlon XP的工作电压为175v,而新核心的Athlon XP其电压为165v
9封装形式
所谓CPU封装是CPU生产过程中的最后一道工序,封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot x槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。
10整数单元和浮点单元
ALU—运算逻辑单元,这就是我们所说的“整数”单元。数学运算如加减乘除以及逻辑运算如“OR、AND、ASL、ROL”等指令都在逻辑运算单元中执行。在多数的软件程序中,这些运算占了程序代码的绝大多数。
而浮点运算单元FPU(Floating Point Unit)主要负责浮点运算和高精度整数运算。有些FPU还具有向量运算的功能,另外一些则有专门的向量处理单元。
整数处理能力是CPU运算速度最重要的体现,但浮点运算能力是关系到CPU的多媒体、3D图形处理的一个重要指标,所以对于现代CPU而言浮点单元运算能力的强弱更能显示CPU的性能。
CPU内核:
核心(Die)又称为内核,是CPU最重要的组成部分。CPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,CPU所有的计算、接受/存储命令、处理数据都由核心执行。各种CPU核心都具有固定的逻辑结构,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。
为了便于CPU设计、生产、销售的管理,CPU制造商会对各种CPU核心给出相应的代号,这也就是所谓的CPU核心类型。
不同的CPU(不同系列或同一系列)都会有不同的核心类型(例如Pentium 4的Northwood,Willamette以及K6-2的CXT和K6-2+的ST-50等等),甚至同一种核心都会有不同版本的类型(例如Northwood核心就分为B0和C1等版本),核心版本的变更是为了修正上一版存在的一些错误,并提升一定的性能,而这些变化普通消费者是很少去注意的。每一种核心类型都有其相应的制造工艺(例如025um、018um、013um以及009um等)、核心面积(这是决定CPU成本的关键因素,成本与核心面积基本上成正比)、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集(这两点是决定CPU实际性能和工作效率的关键因素)、功耗和发热量的大小、封装方式(例如SEP、PGA、FC-PGA、FC-PGA2等等)、接口类型(例如Socket 370,Socket A,Socket 478,Socket T,Slot 1、Socket 940等等)、前端总线频率(FSB)等等。因此,核心类型在某种程度上决定了CPU的工作性能。
一般说来,新的核心类型往往比老的核心类型具有更好的性能(例如同频的Northwood核心Pentium 4 18A GHz就要比Willamette核心的Pentium 4 18GHz性能要高),但这也不是绝对的,这种情况一般发生在新核心类型刚推出时,由于技术不完善或新的架构和制造工艺不成熟等原因,可能会导致新的核心类型的性能反而还不如老的核心类型的性能。例如,早期Willamette核心Socket 423接口的Pentium 4的实际性能不如Socket 370接口的Tualatin核心的Pentium III和赛扬,现在的低频Prescott核心Pentium 4的实际性能不如同频的Northwood核心Pentium 4等等,但随着技术的进步以及CPU制造商对新核心的不断改进和完善,新核心的中后期产品的性能必然会超越老核心产品。
CPU核心的发展方向是更低的电压、更低的功耗、更先进的制造工艺、集成更多的晶体管、更小的核心面积(这会降低CPU的生产成本从而最终会降低CPU的销售价格)、更先进的流水线架构和更多的指令集、更高的前端总线频率、集成更多的功能(例如集成内存控制器等等)以及双核心和多核心(也就是1个CPU内部有2个或更多个核心)等。CPU核心的进步对普通消费者而言,最有意义的就是能以更低的价格买到性能更强的CPU。
在CPU漫长的历史中伴随着纷繁复杂的CPU核心类型,以下分别就Intel CPU和AMD CPU的主流核心类型作一个简介。主流核心类型介绍(仅限于台式机CPU,不包括笔记本CPU和服务器/工作站CPU,而且不包括比较老的核心类型)。
Tualatin
这也就是大名鼎鼎的“图拉丁”核心,是Intel在Socket 370架构上的最后一种CPU核心,采用013um制造工艺,封装方式采用FC-PGA2和PPGA,核心电压也降低到了15V左右,主频范围从1GHz到14GHz,外频分别为100MHz(赛扬)和133MHz(Pentium III),二级缓存分别为512KB(Pentium III-S)和256KB(Pentium III和赛扬),这是最强的Socket 370核心,其性能甚至超过了早期低频的Pentium 4系列CPU。
Willamette
这是早期的Pentium 4和P4赛扬采用的核心,最初采用Socket 423接口,后来改用Socket 478接口(赛扬只有17GHz和18GHz两种,都是Socket 478接口),采用018um制造工艺,前端总线频率为400MHz, 主频范围从13GHz到20GHz(Socket 423)和16GHz到20GHz(Socket 478),二级缓存分别为256KB(Pentium 4)和128KB(赛扬),注意,另外还有些型号的Socket 423接口的Pentium 4居然没有二级缓存!核心电压175V左右,封装方式采用Socket 423的PPGA INT2,PPGA INT3,OOI 423-pin,PPGA FC-PGA2和Socket 478的PPGA FC-PGA2以及赛扬采用的PPGA等等。Willamette核心制造工艺落后,发热量大,性能低下,已经被淘汰掉,而被Northwood核心所取代。
Northwood
这是目前主流的Pentium 4和赛扬所采用的核心,其与Willamette核心最大的改进是采用了013um制造工艺,并都采用Socket 478接口,核心电压15V左右,二级缓存分别为128KB(赛扬)和512KB(Pentium 4),前端总线频率分别为400/533/800MHz(赛扬都只有400MHz),主频范围分别为20GHz到28GHz(赛扬),16GHz到26GHz(400MHz FSB Pentium 4),226GHz到306GHz(533MHz FSB Pentium 4)和24GHz到34GHz(800MHz FSB Pentium 4),并且306GHz Pentium 4和所有的800MHz Pentium 4都支持超线程技术(Hyper-Threading Technology),封装方式采用PPGA FC-PGA2和PPGA。按照Intel的规划,Northwood核心会很快被Prescott核心所取代。
Prescott
这是Intel最新的CPU核心,目前还只有Pentium 4而没有低端的赛扬采用,其与Northwood最大的区别是采用了009um制造工艺和更多的流水线结构,初期采用Socket 478接口,以后会全部转到LGA 775接口,核心电压125-1525V,前端总线频率为533MHz(不支持超线程技术)和800MHz(支持超线程技术),主频分别为533MHz FSB的24GHz和28GHz以及800MHz FSB的28GHz、30GHz、32GHz和34GHz,其与Northwood相比,其L1 数据缓存从8KB增加到16KB,而L2缓存则从512KB增加到1MB,封装方式采用PPGA。按照Intel的规划,Prescott核心会很快取代Northwood核心并且很快就会推出Prescott核心533MHz FSB的赛扬。
Athlon XP的核心类型
Athlon XP有4种不同的核心类型,但都有共同之处:都采用Socket A接口而且都采用PR标称值标注。
Palomino
这是最早的Athlon XP的核心,采用018um制造工艺,核心电压为175V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz。
Thoroughbred
这是第一种采用013um制造工艺的Athlon XP核心,又分为Thoroughbred-A和Thoroughbred-B两种版本,核心电压165V-175V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz和333MHz。
Thorton
采用013um制造工艺,核心电压165V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为333MHz。可以看作是屏蔽了一半二级缓存的Barton。
Barton
采用013um制造工艺,核心电压165V左右,二级缓存为512KB,封装方式采用OPGA,前端总线频率为333MHz和400MHz。
新Duron的核心类型
AppleBred
采用013um制造工艺,核心电压15V左右,二级缓存为64KB,封装方式采用OPGA,前端总线频率为266MHz。没有采用PR标称值标注而以实际频率标注,有14GHz、16GHz和18GHz三种。
Athlon 64系列CPU的核心类型
Clawhammer
采用013um制造工艺,核心电压15V左右,二级缓存为1MB,封装方式采用mPGA,采用Hyper Transport总线,内置1个128bit的内存控制器。采用Socket 754、Socket 940和Socket 939接口。
Newcastle
其与Clawhammer的最主要区别就是二级缓存降为512KB(这也是AMD为了市场需要和加快推广64位CPU而采取的相对低价政策的结果),其它性能基本相同
cpu接口:
Slots、Sockets 和 Slocket 都是用来把 CPU 安装在主板上的。在 1981 年 IBM 的 PC 机刚出炉时,CPU 8086 是直接焊在主板上的,接着的 286、386 也都是焊在主板上,很不好拆卸,对普通用户来说一旦买了一台计算机就基本上没有什么升级的余地了。到了 486 以后,处理器厂商开始采用插座或插槽来安装 CPU。目前市场上的各种 CPU 种类繁多,所用的插座和插槽也很多,本文就给大家介绍一下各种 CPU 的插座和插槽。
Socket 1:Intel 开发的最古老的 CPU 插座,用于 486 芯片。有 169 个脚,电压为 5V。最多只能支持 DX4 的倍频。
Socket 2:Intel 在 Socket 1 的基础上作了小小的改进得到 Socket 2。Socket 2有 238 个脚,电压仍为 5V。虽然它还是 486 的插座,但只要稍作修改就可以支持 Pentium 了。
Socket 3:Socket 3 是在 Socket 2 的基础上发展起来的。它有 237 个脚,电压为 5V,但可以通过主板上的跳线设为 33V。它支持 Socket 2 的所有 CPU,还支持 5x86。它是最后一种 486 插座。
Socket 4:Pentium 时代的 CPU 插座从 Socket 4 开始。它有 273 个脚,工作电压为 5V。正是因为它的工作电压太高,所以它并没有怎么流行就被 Socket 5 取代了。Socket 4 只能支持 60-66MHz 的 Pentium。
Socket 5:Socket 5 有 320 个脚,工作电压为 33V。它支持从 75MHz 到 133MHz 的 Pentium。Socket 5 插座在早期的 Pentium 中非常流行。
Socket 6:看名字你也许会认为这是一个 Pentium 插座,但实际上 Socket 6 是一个 486 插座。它有 235 个脚,工作电压为 33V,比 Socket 3 稍微先进一点。不过随着 Pentium 的流行,486 很快就不再是市场的主流,Socket 6 也很快就被人遗忘了。
Socket 7:Socket 7是到目前为止最流行和应用最广泛的CPU插座。它 有321个脚,工作电压范围为25-33V。它支持从75MHz开始的所有Pentium处理器,包括Pentium MMX,K5, K6, K6-2, K6-3, 6x86, M2和M3。Socket 7是由Intel发布的,事实上已成为当时的工业标准,可以支持IDT、 AMD和Cyrix的第六代CPU。但Intel在开发自己的第六代CPU-Pentium II是,却决定舍弃Socket 7,另外开创一个局面。
Socket 8:Socket 8 是 Pentium Pro 专用的插座。它有 387 个脚,工作电压为 31/33V。它还为双处理器的主板做了特殊的设计。但随着市场主流从 Pentium MMX 转向 Pentium II,Socket 8 很快就被遗忘了。
Socket 370 :Socket 370是Intel为赛扬A CPU提供的接口。其后,Intel 也在不断转变着策略,新千年随着Intel Coppermine系列CPU新P Ⅲ和新赛扬 Ⅱ(均为 Socket 370 结构设计)的推出, Socket 370接口的主板一改低端形象,逐渐成为CPU接口结构主板的主流。
Socket 423:早期的奔腾 4系列处理器都采用Socket423封装。
Socket 478:基于Northwood核心的奔腾 4处理器必须使用Socket478封装,采用013微米工艺加工。
Slot 1:Slot 1 的出现彻底改变了 Intel 的 CPU 插座一贯的形状。Intel 原来的 CPU 都是四方的,管脚在芯片的底部,安装时 CPU 插在主板的插座上。而 Pentium II 不再是四方的了,处理器芯片焊在一块电路板上,然后这块电路板再插到主板的插槽中,这个插槽就是 Slot 1。采用这种设计处理器内核和 L2 缓存之间的通信速度更快。Slot 1 有 242 个脚,工作电压为 28-33V。Slot 1 主要用于 P2,P3 和 Celeron(赛扬),另外还有 Socket 8 的转接卡用来安装 Pentium Pro。
Slot 2:Slot 2 是 Slot 1 的改进,主要用于 Xeon 系列处理器。Slot 2 有 330 个脚,它和 Slot 1 之间最大的区别就在于 Slot 1 的 CPU 和 L2 缓存只能以 CPU 工作频率的一半进行通信,而 Slot 2 允许 CPU 和 L2 缓存以 CPU 工作频率进行通信。
Socket 370:从名字就可以看出 Socket 370 插座有 370 个管脚。在 Intel 找到了把处理器内核和 L2 缓存很便宜的做在一起的方法之后,它的 CPU 插座从 Slot 回到了 Socket。Socket 370 是基于 Socket 7 的,它不过只是在插座的四边每一边加了一排管脚。首先采用 Socket 370 的是 PPGA 封装的 Celeron,接着是 FC-PGA 封装的 Pentium III 和 Celeron II。同样也有 Socket 370 到 Slot 1 的转接卡。目前 Intel 的主流 CPU 都是 Socket 370 类型的。
Slot A:由于 Intel 给 Slot 1 申请了很全面的专利,AMD 不能象从前那样照搬 Intel 的插座,所以 AMD 独立开发了 Slot A,Slot A 是 AMD 拥有独立知识产权的 CPU 插座,主要用于 Athlon 系列处理器。它的设计和 Slot 1 类似,但采用的协议不一样,它用的是 EV6 总线协议。采用 EV6 总线协议,CPU 和内存之间的工作频率可以达到 200MHz。目前随着 Athlon 处理器越来越流行,Slot A 的主板也越来越多。
Socket A:当 Intel 从 Slot 转回 Socket 时,AMD 也亦步亦趋,从 Slot A 转回了 Socket A。018 微米的 Athlon 和 Duron 都采用 Socket A 插座,它也支持 200MHz 以及 266MHz 的 EV6 总线。与 Socket 370 不同的是,Socket 370 CPU 可以直接用 Socket 7 的散热器,而 Socket A 的散热器要稍作修改。另外 AMD 没有提供 Socket A 到 Slot A 的转接卡。Socket A 有 462 个脚,它与 Socket 370 不兼容。目前 AMD 的主流 CPU 都是 Socket A 类型的。
Slockets:所谓的 Slocket 是 Slot 和 Socket 的结合体,从它的拼法上就可以看出。它实质上是一个Slot 1 到 Socket 370 的转接卡,在不同的电平和接口之间进行转换。有的 Slocket 可以插两个 CPU,还有的 Slocket 可以去除 CPU 的锁频,使超频更容易。
以上给大家介绍了一下已有的各种 CPU 插座和插槽,希望用户在升级的时候,注意要买自己的主板能支持的 CPU。
在Linux服务器上查看CPU详细信息:
cat /proc/cpuinfo
输出结果:
上面只截取了一部分信息,
完整的CPU信息请参考文末附录,
这个命令输出了太多的冗余信息不方便查看,
下面介绍的命令以该Linux输出的CPU信息为例,
可以很方便的知道当前系统CPU的特定信息。
请参考以下文章了解CPU的一些基本概念:
物理CPU,物理CPU内核,逻辑CPU概念详解
cat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -l
输出结果:
2
表示Linux服务器上面实际安装了2个物理CPU芯片。
cat /proc/cpuinfo | grep "cpu cores" | uniq
输出结果:
cpu cores : 8
表示1个物理CPU里面有8个物理内核。
cat /proc/cpuinfo | grep "processor" | wc -l
输出结果:
32
表示Linux服务器一共有32个逻辑CPU。
cat /proc/cpuinfo | grep 'siblings' | uniq
输出结果:
siblings : 16
表示每个物理CPU中有16个逻辑CPU,
一共有2个物理CPU,
所以总共有32个逻辑CPU,
和第5步中查看的结果一致。
cat /proc/cpuinfo | grep -e "cpu cores" -e "siblings" | sort | uniq
输出结果:
cpu cores : 8
siblings : 16
看到cpu cores数量是siblings数量一半,说明启动了超线程。
如果cpu cores数量和siblings数量一致,则没有启用超线程。
cpuinfo输出了详细的信息,
可以看到CPU具体型号等各种参数,
下面说明各个输出项的含义:
14、/proc/cpuinfo 文件(查看CPU信息)
Linux CPU数量判断,通过/proc/cpuinfo
0条评论