主板前端总线HT1.0的疑惑,第1张

对于超线程技术和双通道内存控制技术可以说是两种不同的技术。当然,这两种技术在实际中的应用,均能从不同的应用层面找到自己的位置和价值。为了让大家彻底了解两种技术,笔者认为,唯有对这两种技术进行相应的剖析和纵向对比测试,方能找到我们所需要的答案。当然,也只有这样,才能使我们在“攒机”的时候,做到“有的放矢”,以避免自己钱袋中所剩无几的“银两”被浪费掉。

一、 什么是“超线程”处理器技术

简单定义“超线程”技术

所谓超线程技术就是利用特殊的硬件指令,把多线程处理器内部的两个逻辑内核模拟成两个物理芯片,从而使单个处理器就能“享用”线程级的并行计算的处理器技术。多线程技术可以在支持多线程的操作系统和软件上,有效的增强处理器在多任务、多线程处理上的处理能力。

超线程技术可以使操作系统或者应用软件的多个线程,同时运行于一个超线程处理器上,其内部的两个逻辑处理器共享一组处理器执行单元,并行完成加、乘、负载等操作。这样做可以使得处理器的处理能力提高30%,因为在同一时间里,应用程序可以充分使用芯片的各个运算单元。

对于单线程芯片来说,虽然也可以每秒钟处理成千上万条指令,但是在某一时刻,其只能够对一条指令(单个线程)进行处理,结果必然使处理器内部的其它处理单元闲置。而“超线程”技术则可以使处理器在某一时刻,同步并行处理更多指令和数据(多个线程)。可以这样说,超线程是一种可以将CPU内部暂时闲置处理资源充分“调动”起来的技术。

超线程是如何工作的

在处理多个线程的过程中,多线程处理器内部的每个逻辑处理器均可以单独对中断做出响应,当第一个逻辑处理器跟踪一个软件线程时,第二个逻辑处理器也开始对另外一个软件线程进行跟踪和处理了。

另外,为了避免CPU处理资源冲突,负责处理第二个线程的那个逻辑处理器,其使用的是仅是运行第一个线程时被暂时闲置的处理单元。例如:当一个逻辑处理器在执行浮点运算(使用处理器的浮点运算单元)时,另一个逻辑处理器可以执行加法运算(使用处理器的整数运算单元)。这样做,无疑大大提高了处理器内部处理单元的利用率和相应的数据、指令处吞吐能力。

实现超线程的五大前提条件

(1)需要CPU支持

目前正式支持超线程技术的CPU有Pentium4 306GHz 、240C、260C、280C 、30GHz、32GHz以及Prescott处理器,还有部分型号的Xeon。

(2)需要主板芯片组支持

正式支持超线程技术的主板芯片组的主要型号包括Intel的875P,E7205,850E,865PE/G/P,845PE/GE/GV,845G(B-stepping),845E。875P,E7205,865PE/G/P,845PE/GE/GV芯片组均可正常支持超线程技术的使用,而早前的845E以及850E芯片组只要升级BIOS就可以解决支持的问题。SIS方面有SiS645DX(B版)、SiS648(B版)、SIS655、SIS658、SIS648FX。VIA方面有P4X400A、P4X600、P4X800。

(3)需要主板BIOS支持

主板厂商必须在BIOS中支持超线程才行。

(4)需要操作系统支持

目前微软的操作系统中只有Windows XP专业版及后续版本支持此功能,而在Windows2000上实现对超线程支持的计划已经取消了。

(5)需要应用软件支持

一般来说,只要能够支持多处理器的软件均可支持超线程技术,但是实际上这样的软件并不多,而且偏向于图形、视频处理等专业软件方面,游戏软件极少有支持的。应用软件有Office 2000、Office XP等。另外Linux kernel 24x以后的版本也支持超线程技术。

二、 什么是“双通道”内存技术

双通道内存技术,就是在北桥(又称之为GMH)芯片组里制作两个内存控制器,这两个内存控制器是可以相互独立工作的。在这两个内存通道上,CPU可以分别寻址、读取数据,从而可以使内存的带宽增加一倍,数据存取速度也相应增加一倍(理论上是这样)。

目前流行的双通道DDR内存构架是在两个64bitDDR内存控制器构筑而成的,其带宽可以达到128bit,但工作方式不同于单通道128bit的内存控制技术。因为双通道体系的两个内存控制器是独立的、具备互补性的智能内存控制器,两个内存控制器都能够在彼此间零等待时间的情况下同时运作。例如:当控制器B准备进行下一次存取内存的时候,控制器 A就在读/写主内存,反之亦然。两个内存控制器的这种互补“天性”可以让有效等待时间缩减50%,从而使内存的带宽翻了一翻。

双通道DDR的两个内存控制器在功能上是完全一样的,并且两个控制器的时序参数都是可以单独编程设定的。这样的灵活性可以让用户使用两条不同构造、容量、速度的DIMM内存条,此时双通道DDR简单地调整到最低的密度来实现128bit带宽,允许不同密度/等待时间特性的DIMM内存条可以可靠地共同运作。

简而言之,双通道技术是一种关系到主板芯片组的技术,与内存自身无关,只要厂商在芯片内部整合两个内存控制器,就可以构成双通道DDR系统。而主板厂商只需要按照内存通道将DIMM分为Channel 1与Channel 2,用户也需要成双成对地插入内存,就如同RDRAM那样。如果只插单根内存,那么两个内存控制器中只会工作一个,也就没有了双通道的效果了。

如果只插单根内存,那么两个内存控制器中只会工作一个

双通道内存控制技术可以非常有效的提高内存带宽,特别是那些需要同内存频繁交换数据的软件和整合有图形核心(整合显卡)的芯片组。在865G这样整合有显卡的双通道主板上,双通道内存控制技术所带来的高带宽,可以帮助整合显卡在划分主存做为显存的时候,得到更高的数据带宽,而显存的数据带宽正是制约一块显卡性能发挥的瓶颈所在。

对于整合图形核心的主板来说,其内存不仅要与CPU频繁变换数据,而且还将被主板上整合的图形核心共享为显存。而在这个时候,显存也必将频繁地进行数据变换,而这对于有限内存带宽来说,无疑将是一种严峻的考验。

双通道内存控制技术是一种主板芯片组技术,只有支持双通道内存控制技术的芯片组才能构架起双通道内存平台,英特尔阵营有I850、 i875P、i7205、i865PE、i865G、SIS655、SIS655FX、VIA PT600(P4X600)、VIA PT800(P4X800)、VIA PT880等芯片组,其真可谓人才济济,而AMD阵营仅有NForce2 、NForce3芯片组独力支撑局面。

让事实说话 超线程与双通道到底有没有用(2)

2003-12-2 2:02

电脑动力

LSW

三、“超线程”处理器技术的优点与缺点

超线程技术的优点

(1)超线程在Web服务、SQL数据库等很多服务器领域的应用中表现优异。

(2)主流的桌面芯片组基本都已可以支持超线程,你无需额外的花费。

(3)Windows XP已经针对其作出优化,在运行多个不支持多线程的程序时,性能也可能会获得提高。即便带来损失,也会显得比较轻微。

(4)在某些支持多线程的软件应用上能够得到30%左右的性能提升,如3dsmax、Maya、Office、Photoshop等。Intel甚至在一项测试中取得了90%的提高。

超线程技术的缺点

(1)较受欢迎的Windows 2000并不支持超线程技术,必须得安装也许您并不满意的Windows XP。

(2)打开超线程后处理单线程应用,处理器性能有时会降低。

(3)缺乏针对超线程优化的各种普通应用软件,性能因此得不到充分体现。

总的来说,通过以上优缺点的比较,我们已经了解到了超线程技术的确能够在处理多任务的时候,能够给系统性能带来一定的提升。而在运行单任务处理的时候,多线程的其优势是无法表现出来的,而且一旦打开超线程,处理器内部缓存就会被划分成几个区域,互相共享内部资源,从而造成单个的子系统性能下降。 笔者认为,用户在进行单任务操作时候,没有必要打开超线程,只有多任务操作时候可以适时打开超线程,享受超线程技术带来的好处。

四、“双通道”内存控制技术的优缺点

双通道的优点

(1)可以带来2倍的内存带宽,从而可以那些与必须内存数据进行频繁交换的软件得到极大的好处,譬如SPEC Viewperf、3DMAX、IBM Data Explorer、Lightscape等。

(2)在板载显卡共享内存的时候,双通道技术带来的高内存带宽可以帮助显卡在游戏中获得更为流畅的速度,以3Dmark2001Se为例,其得分成绩的差距,可以拉大到15-40%。

双通道的缺点

(1)必须构架在支持双通道的主板上,并且必须要有两条相同容量、类型内存条。英特尔的双通道对于内存类型和容量要求很高,两根内存条必须完全一致。而SIS和VIA的双通道主板则允许不同容量和类型的内存共存,只要是两根内存条就行。

(2)双通道内存控制技术在普通的游戏和应用上,与单通道的差距极小。

(3)需要购买支持双通道内存控制技术的主板和两根内存条,而这需要更多的成本。

(4)双通道的接法,对于初手来说十分重要,一旦接法不正确,将无法使双通道起作用。

(5)双通道内存架构,其超频比较困难,这对于喜欢DIY超频朋友将不太适合。

五、 “超线程”与非“超线程”之间的较量

下面,我们将以一块P4 30G(支持HT)处理器为测试对象,通过打开和关闭其超线程技术来比较一下两者的性能差距究竟有多大。

测试平台,可见下表。

在这个测试平台之下,我们将使用ZD Business Winstone 2002 10(商用办公性能测试)、SiSoft Sandra2003(硬件信息和性能基准测试)、3DMark2001 SE(著名的3D显卡性能测试软件)、Lame(音频压缩)、Flaskmpeg+Divx 502 Codec(视频压缩)、3D Studio Max 5(3D渲染)、Photoshop 70(2D图像)、3D Mark2001 SE+Super PI(多任务测试)来验证HT究竟具备何等威力。

测试1:ZD Business Winstone 2002 10

这个软件用来测试系统商业办公性能,包括了Word、Excel、Access、PowerPoint、FrontPage、WinZip、Norton AntiVirus、Lotus Notes以及Netscape等实际应用;ZD Content Creation Winstone 2002 101则用来测试系统的Web、图形和多媒体等内容创建性能,包括Photoshop、Premiere、Director、Dreamweaver、UltraDev、Navigator、Windows Media Encoder 以及Sound Forge等。

在ZD Business Winstone 2002 10中,开启HT与关闭HT的性能差距是极小的。开启HT之后,几乎没有整机商业办公性能产生什么影响(仅02%)。当然,这与办公软件是否支持超线程有很大的关系,因此如果你仅仅是一个商用、办公用户,便没有必要选择超线程。

测试2:利用SiSoft Sandra2003单独对处理器子系统进行测试

CPU常规运算性能

在CPU常规运算性能的测试中,当我们打HT之后,HT带来的处理器性能提升是十分明显的。整数运算测试得分,由7969直冲9336分,处理器的整数运算性能提升17%。

而在P4独有的ISSE2指令运算测试中,开启HT之后,得分也由原来的4046提升到了5624分,性能提升了39%左右。

CPU多媒体运算性能

在多媒体运算性能的测试中,开启HT之后的整数运算得分由原来的12216分,提升到了14059分,性能提升约20%。而在ISSE2指令集的得分中,当我们开启HT之后,测试成绩,立即提升了40%左右,其提升可谓非常之大。由此可见,只要有游戏和相关的多媒体处理器软件对于英特尔的超线程技术进行优化,那么其带来的性能提升是可以想见的。可以说,目前超级程技术遇到的首先问题就是软件厂商的支持。之所以在SiSoft Sandra2003中处理器的性能测试得分能够有这么大的提升,在于SiSoft Sandra2003这个软件支持超线程,可见超线程处理器只有在应用软件的配合和优化之下,才能发挥其潜能。

让事实说话 超线程与双通道到底有没有用(3)

2003-12-2 2:03

电脑动力

LSW

测试3:3Dmark 2001SE性能测试

3DMark2001 SE体现了系统的D3D性能,经过1028768、32色测试,开启HT和关闭HT几乎对系统性能未能任何提升,反而在打开HT之后,处理器性能反而有很小很小的一点损失。可见,一旦软件不支持超线程技术,有时候反而会出人意外的出现性能上的下降。

测试4:音视频压缩

音频压缩和视频压缩对处理器的性能的要求是非常苛刻的,特别是视频的采集与压缩,在没有视频采集卡的情况下,处理器的性能对于视频、音频的压缩时间长短,将产生重大的影响。

首先是音频压缩的测试,在 Lame(音频压缩软件)对一段972MB的Wav文件压缩成882MB的MP3文件时,打开HT与关闭HT完全一样,按理说不应该这样,但是由于Lame未对超线程技术进行优化,因此导致两者未分出高下。音视频文件的压缩将比单纯的音频文件压缩更考验处理器性能,当我们用Flaskmpeg+Divx 502 Codec将一段DVD视频文件压缩成MPEG4文件时,支持超线程技术的Divx 502 Codec将超线程技术发挥得淋漓尽致。压缩时间由原来的349秒一下子缩短到了297秒。

测试5:2D图像处理和3D渲染

Photoshop 70和3D Studio Max 5分别可以代表2D图像处理和3D动画处理,通过这个两个软件下的表现,可以判断超线程技术在图形、动画处理上的作用。

由于Photoshop 70支持多处理器和超线程技术,因此,其可以轻松利用这一优点,在多线程技术的帮助下,得到约10%的性能提升。

这里是在Photoshop下进行Despeckle操作时,在开启与关闭HT之后的耗时比较。开启HT之后,仅耗时68秒,而关闭HT之后,则几乎慢了整整1秒。可以由此推断,如果一个操作以前需要耗时1小时,那么打开HT之后,则可以节约7-8分钟了。3D Studio Max系列是3D图形领域里最流行的3D建模软件,在场景的最终渲染过程中,处理器被满负载使用,能充分的考察出CPU的运算能力,3D Studio Max 5已经对Pentium 4提供了极大的优化,可以大幅提高渲染性能。3D Studio Max系列也能很好的支持多线程操作,以尽量利用多处理器的优势来减少渲染时间,多处理器系统总能获得极大的性能优势。不过,由于3D Studio Max在渲染过程中,过分依赖的是浮点单元,所以多线程技术对其帮助不大,这个时候,处理器的其它单元,无法帮上忙。因为这个时候,CPU的所有浮点单元,都全线上阵了,而其它单元则无法“插上一脚”。

测试6:多任务并行处理测试

为了考虑HT对于处理器在同时处理多个事务时,有什么帮助?这里决定在运行Super PI这种对处理器运算性能有压力的软件。并且在运行这个软件,同步运行另外一个对CPU运算性能有苛刻要求的软件3Dmark2001SE在处理多任务的时候,Super PI 和3D Mark2001 SE这两位杀手单独对于系统来说都不是轻松的任务,更何况同时运行,这是个相当严苛的考验。当关闭Hyperthreading技术时,306GHz的Pentium 4运行3D Mark2001 SE,测试场景调入的时间很长,测试运行时也有明显的丢帧现象出现;开启Hyperthreading技术后,情况有明显的改善,3D Mark2001 SE测试场景调入的时间明显缩短,感觉基本和单任务运行无异,测试运行时丢帧的现象也不再出现。从实际的测试成绩也能看出,无论是Super PI 还是3D Mark2001 SE,开启Hyperthreading技术后并行运算的成绩均有很大的提高。

小结

通过以上测试,我们发现只要应用软件支持超线程技术,那么,用户便可以从中获益1%-40%。特别是服务器和图形工作站用户,当然,这得益于服务器、图形、3D动画、视频制作软件,曾经对多线程技术进行过专门的优化和支持。而P4的超线程技术与多线程技术属“亲缘”关系,那么支持多线程技术的软件,自然也就能够从P4的超线程技术中获益。而对于普通的办公、商业、游戏用户来说,由于其应用领域的软件均不支持超线程技术,因此在购机时,便没有必要购买支持超线程技术的P4,毕竟购买支持超线程技术的CPU将付出更多的成本和代价。

我们这里以主流的P4 24C为例,从市场定位和价格上来说,P4 24C其仅仅比不支持超线程的同频率P4略贵了100元左右。而以6%的差价去换取那约40%左右的性能提升,我想是物有所值的。而且在市场上,我们也能以500元左右的价位,轻松获得一块支持超线程技术的主板。当然,如果你着实无法从超线程技术上获得一点好处,那么,自然也就无需多耗费这点银子了。

六、 P4平台双通道与单通道的较量

为了配合P4前进的步伐,英特尔连接推出了I865PE、I875P、I865G几款支持800MHz主流双通道芯片组,而SIS、VIA也不甘示弱,SIS655FX、VIA PT800随之杀出。然而,在推出主力双通道芯片组的同时,英特尔又推出了单通道I848P、而SIS和VIA也分别推出了单通道648FX、VIA PT800芯片组。那么,主流的双通道与低端的单通道究竟在武功上有多少差别呢?我们只有采用比试的方法来加以论证。

这里,我们就用I875P来单挑其它几位不支持双通道技术的单通道选手(I848P、PT800和SIS648FX)吧。测试平台,见下表。显卡,这里选择了目前最强悍的Geforce FX 5900。

比试项目:SiSoftware Sandra、MAX、ZD Business Winstone 2002、3Dmark2001、SPEC Viewperf等。

参考资料:

http://wwwitcfancom

2002-2004年:超线程P4处理器

2002年11月14日,英特尔在全新英特尔奔腾4处理器306 GHz上推出其创新超线程(HT)技术。超线程(HT)技术支持全新级别的高性能台式机,同时快速运行多个计算应用,或为采用多线程的单独软件程序提供更多性能。超线程(HT)技术可将电脑性能提升达 25%。除了为台式机用户引入超线程(HT)技术外,英特尔在推出英特尔奔腾4处理器306GHZ时达到了一个电脑里程碑。这是第一款商用微处理器,运行速率为每秒30亿周期,并且采用当时业界最先进的013 微米制程制作。

奔腾4处理器306GHz

英特尔发布前端总线为533MHz的Pentium 4 306 GHz处理器,采用了013微米工艺技术,提供L2 cache为512K的二级缓存,核心由5500万个晶体管组成。时隔一年,英特尔发布了支持超线程(HT)技术的P4处理器至尊版320 GHz。基于这一全新处理器的高性能电脑专为高端游戏玩家和计算爱好者而设计,现已由全球的系统制造商全面推出。英特尔奔腾4处理器至尊版采用英特尔的013微米制程构建而成,具备512 KB二级高速缓存、2MB三级高速缓存和800MHz系统总线速度。

P4处理器至尊版320GHz

该处理器可兼容现有的英特尔865和英特尔875芯片组家族产品以及标准系统内存。2MB三级高速缓存可以预先加载图形帧缓冲区或视频帧,以满足处理器随后的要求,使在访问内存和I/O设备时实现更高的吞吐率和更快的帧带率。最终,这可带来更逼真的游戏效果和改进的视频编辑性能。增强的 CPU性能还可支持软件厂商创建完善的软件物理引擎,从而带来栩栩如生的人物动作和人工智能,使电脑控制的人物更加形象、逼真。

半年之后,2004年6月,英特尔发布了P4 34GHz处理器,该处理器支持超线程(HT)技术,采用013 微米制程,具备 512 KB二级高速缓存、2 MB 三级高速缓存和800MHz 系统前端总线速度。

Northwood是第二代产品,采用013微米制程,具有电压低、体积小、温度低的优点。接着就是Prescott(009微米),虽然这技术很新,不过由于效能提升并不明显,而且有过热的问题。后来英特尔又推出Hyper Threading技术,大大增加工作效率,让P4又成为市场宠儿。英特尔之后又推出Extreme Edition、含有Prestonia(原本给服务器用的Xeon核心)以及Gallatin(013微米Northwood外频提升改良版)核心的CPU。市场上的高阶Pentium 4则是 Socket LGA 775的 Prescott为主。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 主板前端总线HT1.0的疑惑

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情