TDP热功耗的计算方法,第1张

从TDP是得不出CPU的实际功耗的,用计算机内部各个部件的TDP值相加得出整个系统的功耗,逻辑上似乎没有任何问题,事实上这项“创举”已经变成业界的笑谈。

CPU的实际功耗应该等于=实际输入CPU的电流(A)× CPU的实际电压(V),它是供电电压和电流的乘积。最好的办法是用精密的功率工具去测试。

另外,笼统地计算一个CPU在一个昼夜24小时反复运行一组程序,然后计算累计功耗,是非常误导的测试,因为一个高能效的CPU,可以在相同的时间完成更多的工作。

所以,CPU的实际功耗测试应该是用一组统计出来的程序组合,模拟人们使用计算机的习惯让计算机运行,如办公场景,典型的测试软件为SysMark,家用环境为PCMark,建议用最新的版本。

这样,性能好节能效果好的CPU,就可以在更短的时间内完成任务,依次进入等待,空闲,休眠,深度休眠等节能状态。例如,同样一段高清影片的压缩,高性能的CPU可以在5分钟完成,差的CPU需要10分钟完成。提前完成工作的CPU可以做别的工作,或者在剩下的5分钟处于低负荷的运行状态——CPU利用率低,系统功耗就小,甚至进入休眠。对于需要10分钟完成的CPU,后5分钟还是需要让CPU处于高负荷的运行状态,整个系统都需要处于相对高负荷的状态,由此可见能耗是无法和高性能的CPU相比的。

采用最新工艺,最新架构和最新的节能技术的CPU,都是厂商追求的目标,因为只有这些新技术可以确保高性能低能耗技术的实现。例如,从65纳米转向45纳米,每个晶体管可以减低5倍以上的漏电流,每个晶体管性能提高20%以上,驱动电量下降30%以上。如果晶体管的数量上数亿个,能节省的功耗就非常可观了。

采用这些新技术,就是要让更多的功耗用于CPU实际的运算中。这就好比日光灯和白炽灯,前者电-光转换效率高达80% 以上,不到20%转换为热,白炽灯电-光转换效率为50%,有一半转化为热量了,热量不是我们要的,白白浪费了。所以同样是60瓦的日光灯,要比60瓦的白炽灯亮多了,手摸上去也是温温的,而日炽灯会烫手的。这就是现在节能灯都是日光灯的原因吧。

用户对CPU性能的提升是没有止境的,英特尔公司面临的挑战还是:在不断提高性能的同时,控制能耗不变甚至降低能耗,如何解决芯片单位面积热密度不断提到的业界难题等等。

TDP功耗与处理功耗的关系

TDP功耗是处理器的基本物理指标。它的含义是当处理器达到负荷最大的时候,释放出的热量,单位同样以W计量。TDP也并非恒定不变,但是单颗处理器的 TDP值是固定的。而散热器必须保证在在处理器TDP最大的时候,处理器的温度仍然在设计范围内。但是,无论是在平面媒体或是在网络媒体的评测或是介绍 中,TDP都与处理器功耗混为一谈。

处理器的功耗,确切的说是消耗的功率是处理器最基本的电气指标。根据电路的基本原理,功率(P)=电流(A)×电压(V)。所以,一颗处理器的功耗(功率)是流经处理器核心的电流数值与加在该处理器上的核心电压的乘积。

那么处理器功耗与TDP有什么联系呢?在处理器的功耗分为两部分:实际消耗的功耗和产生的热功耗。前者是处理器各个功能单元正常工作消耗的电能,后者是电 流热效应以及其他形式产生的热能,他们均以热的形式释放。这类热量很大,单靠处理器自身是无法完全排除的,因此这部分热能需要借助外界的手段吸收,硅晶元 才不会因温度过高而损毁。

两者的关系可以用这个公式概括:处理器的功耗=实际消耗功耗+TDP。从这个等式我们可以得出这样的结论:TDP并不就是处理器的功耗,TDP要小于处理 器的功耗。虽然都是处理器的基本物理指标,但处理器功耗与TDP对应的硬件完全不同:与处理器功耗直接相关的是主板,主板的处理器供电模块必须具备足够的 电流输出能力才能保证处理器稳定工作;TDP需要借助主动散热器进行吸收,散热器若设计无法达到处理器的要求,那么灾难就会发生。

TDP与其他电气指标的关系

TDP作为处理器的基本参数,它的值取决于主要取决于最大核心电流:Icc Max,而TDP直接导致的结果就是处理器的Tc(case Temperature,直译为容器温度,后文会介绍)。处理器的核心电流越大,释放出的热量越大,TDP值越高,Tc也越高。具体的指标可以从 Intel的文档中得到,我们列举了以下几款:

630 30GHz 0 78A 84W 666℃

P4 570 38GHz 1 119A 115W 708℃

上表列出了最新LGA P4处理器的相关数据。有一点说明,表中的数据是这款处理器的最大值。个别处理器的数值会低于表中的数据。通过这张表我们可以发现:并不是处理器频率越 高,它的各项功耗指标就越高。为了保证主板对处理器的兼容性,Intel对不同处理器的功耗指标进行了严格的控制,一款处理器的最大核心电流,最大TDP 以及最高Tc值之间也存在着关联。在同样的主频下,TDP值越小,处理器的品质越好。

TDP与P的区别

TDP中文翻译为“热设计功耗”,是反应一颗处理器(CPU或GPU)热量释放的指标,它的含义是当处理器达到负荷最大的时候,释放出的热量,单位为瓦(W)。CPU或GPU的热功耗(TDP)并不是CPU或GPU的真正功耗(P)。功耗(功率)是CPU或GPU的重要物理参数,根据电路的基本原理,功率(P)=电流(I)×电压(U)。CPU或GPU的功耗(功率)等于流经处理器核心的电流值与该处理器上的核心电压值的乘积。而TDP是指CPU或GPU电流热效应以及其他形式产生的热能,他们均以热的形式释放。显然CPU或GPU的热功耗(TDP)远远小于实际功耗(P)。换句话说,CPU或GPU的功耗(P)是对主板或显卡提出的要求,要求主板或显卡能够提供相应的电压和电流;而TDP是对散热系统提出要求,要求散热系统能够把CPU或GPU发出的热量散发掉,也就是说TDP功耗是要求CPU或GPU的散热系统必须能够驱散的最大总热量。

两者的公式是不同的。

功耗P=UI

热功耗TDP=Tj-Ta=Pc(RTj+RTc+RTf)=Pc RTz

式中:

Tj为热源温度,芯片晶体管结温

Ta为环境温度

Pc为热源功率,芯片晶体管热功耗

RTj为芯片晶体管到外壳的热阻

RTc芯片外壳与散热器的接触热阻

RTf散热器热阻

RTz总热阻

对于独立显卡来讲,它除了有GPU外,还有显存,供电系统中的晶体管,电阻,电容,电感等消耗能量的器件。从专业角度讲,电容在直流电路中,不是绝对绝缘体,存在漏电阻;电感存在电阻,在直流电路中它们都是消耗能量的器件。在交流电路中电容存在介质损耗和频率损耗,电感存在涡流损耗,它们也都是消耗能量的器件。航嘉等一些网站由于缺乏专业知识,用CPU和GPU的热设计功耗(TDP)当作计算机的配置功耗(P)来计算,显然是错误的。电源功率的计算不能按照TDP值来计算,因为TDP只是芯片(CPU或GPU)的热功耗,而实际功耗(P)还包含为芯片提供能源的供电系统和外围电路。如显卡的显存,DC-DC 转换电路,晶体管,电阻,电容,电感等。

黄仁勋终于公布了NVIDIA新一代架构与核心,当然这次是面向HPC高性能计算、AI人工智能的“Hopper”,对应核心编号“GH100”,同时发布的还有基于新核心的加速计算卡“H100”、AI计算系统“DGX H100”。

与传闻不同,GH100核心采用的其实是台积电目前最先进的4nm工艺,而且是定制版,CoWoS 25D晶圆级封装,单芯片设计,集成多达800亿个晶体管,号称世界上最先进的芯片。

完整版有8组GPC(图形处理器集群)、72组TPC(纹理处理器集群)、144组SM(流式多处理器单元),而每组SM有128个FP32 CUDA核心,总计18432个。

显存支持六颗HBM3或者HBM2e,控制器是12组512-bit,总计位宽6144-bit。

Tensor张量核心来到第四代,共有576个,另有60MB二级缓存。

扩展互连支持PCIe 50、NVLink第四代,后者带宽提升至900GB/s,七倍于PCIe 50,相比A100也多了一半。整卡对外总带宽49TB/s。

性能方面,FP64/FP32 60TFlops(每秒60万亿次),FP16 2000TFlops(每秒2000万亿次),TF32 1000TFlops(每秒1000万亿次),都三倍于A100,FP8 4000TFlops(每秒4000万亿次),六倍于A100。

H100计算卡采用SXM、PCIe 50两种形态,其中后者功耗高达史无前例的700W,相比A100多了整整300W。

按惯例也不是满血,GPC虽然还是8组,但是SXM5版本只开启了62组TPC(魅族GPC屏蔽一组TPC)、128组SM,总计有15872个CUDA核心、528个Tensor核心、50MB二级缓存。

PCIe 50版本更是只有57组TPC,SM虽然还是128组,但是CUDA核心只有14952个,Tensor核心只有456个。

DGX H100系统集成八颗H100芯片、搭配两颗PCIe 50 CPU处理器(Intel Sapphire Rapids四代可扩展至器),拥有总计6400亿个晶体管、640GB HBM3显存、24TB/s显存带宽。

性能方面,AI算力32PFlops(每秒32亿亿次),浮点算力FP64 480TFlops(每秒480万亿次),FP16 16PFlops(每秒16千万亿次),FP8 32PFlops(每秒32千亿次),分别是上代DGX A100的3倍、3倍、6倍,而且新增支持网络内计算,性能36TFlops。

PCIe 50版本的性能基本都再下降20%。

同时配备Connect TX-7网络互连芯片,台积电7nm工艺,800亿个晶体管,400G GPUDirect吞吐量,400G加密加速,405亿/秒信息

DGX H100是最小的计算单元,为了扩展,这一次NVIDIA还设计了全新的VNLink Swtich互连系统,可以连接最多32个节点,也就是256颗H100芯片,称之为“DGX POD”。

这么一套系统内,还有205TB HBM3内存,总带宽768TB/s,AI性能高达颠覆性的1EFlops(100亿亿亿次每秒),实现百亿亿次计算。

系统合作伙伴包括Atos、思科、戴尔、富士通、技嘉、新华三、慧与、浪潮、联想、宁畅、超威。

云服务合作伙伴包括阿里云、亚马逊云、百度云、Google云、微软Azure、甲骨文云、腾讯

从哪里都看不到一台电脑的功耗,除非借助专用的设备。

首先最重要的一点,电脑的实时功耗是不停变动的,根据电脑上运行的程序强度而变化,很简单,玩游戏肯定比写文档的功耗高。

有一个比较接近的数据,就是看机箱里电源的标签,上面有电源的额定功率,基本可以认为是电脑的整体功率。

在说明两者之间的区别之前,我们现在了解一下什么事CPU,什么事GPU,两者各代表什么。CPU即中央处理器,GPU即图形处理器。其次,要解释两者的区别,要先明白两者的相同之处:两者都有总线和外界联系,有自己的缓存体系,以及数字和逻辑运算单元。一句话,两者都为了完成计算任务而设计。

两者的区别在于存在于片内的缓存体系和数字逻辑运算单元的结构差异:CPU虽然有多核,但总数没有超过两位数,每个核都有足够大的缓存和足够多的数字和逻辑运算单元,并辅助有很多加速分支判断甚至更复杂的逻辑判断的硬件;GPU的核数远超CPU,被称为众核(NVIDIA Fermi有512个核)。每个核拥有的缓存大小相对小,数字逻辑运算单元也少而简单(GPU初始时在浮点计算上一直弱于CPU)。从结果上导致CPU擅长处理具有复杂计算步骤和复杂数据依赖的计算任务,如分布式计算,数据压缩,人工智能,物理模拟,以及其他很多很多计算任务等。GPU由于历史原因,是为了视频游戏而产生的(至今其主要驱动力还是不断增长的视频游戏市场),在三维游戏中常常出现的一类操作是对海量数据进行相同的操作,如:对每一个顶点进行同样的坐标变换,对每一个顶点按照同样的光照模型计算颜色值。GPU的众核架构非常适合把同样的指令流并行发送到众核上,采用不同的输入数据执行。在2003-2004年左右,图形学之外的领域专家开始注意到GPU与众不同的计算能力,开始尝试把GPU用于通用计算(即GPGPU)。之后NVIDIA发布了CUDA,AMD和Apple等公司也发布了OpenCL,GPU开始在通用计算领域得到广泛应用,包括:数值分析,海量数据处理(排序,Map-Reduce等),金融分析等等。

简而言之,当程序员为CPU编写程序时,他们倾向于利用复杂的逻辑结构优化算法从而减少计算任务的运行时间,即Latency。当程序员为GPU编写程序时,则利用其处理海量数据的优势,通过提高总的数据吞吐量(Throughput)来掩盖Lantency。目前,CPU和GPU的区别正在逐渐缩小,因为GPU也在处理不规则任务和线程间通信方面有了长足的进步。另外,功耗问题对于GPU比CPU更严重。

总的来讲,GPU和CPU的区别是个很大的话题,甚至可以花一个学期用32个学时十几次讲座来讲,所以如果提问者有更具体的问题,可以进一步提出。我会在我的知识范围内尝试回答。

在日常使用计算机的过程中,了解自己电脑的配置和性能是非常重要的,因为这有助于我们更好地了解和掌握自己的设备,在日常维护和升级中作出更明智的选择。下面,我为大家介绍一些检测自己电脑配置与性能的方法。

一、 利用“系统信息”工具查看Windows和MacOS操作系统都提供了内置的“系统信息”工具,可以帮助我们快速地了解到自己电脑的基本信息和配置,步骤如下:

对于Windows系统:

按下键盘的Win+R键,打开运行窗口; 在搜索框中输入msinfo32并回车,便可打开“系统信息”界面;在此界面左侧选择“系统概要”,即可查看到当前电脑的硬件信息,包括处理器型号、内存容量、硬盘型号等; 在此界面左侧选择“组件”,再进入“显示器”、“声音设备”、“网络设备”等下属子菜单页签,也可获得相关配置信息。

对于MacOS系统:

点击屏幕左上角的苹果图标;在弹出的菜单中选择“关于本机”;在“关于本机”界面中,可以看到设备的系列号、系统版本、处理器信息、内存容量和显卡型号等盐基础配置。

以上这些方法都非常简单易行,但是很有效地能够帮助我们了解自己的电脑配置和基本参数。

二、使用第三方检测工具除了操作系统自带的“系统信息”功能外,市面上还有很多免费的第三方软件可供下载和安装,可以更全面地了解自己电脑各种性能细节,以及进行更加详尽的测试。其中比较常用的一些软件如下:

1 CPU-Z:

一个适用于Windows和Linux操作系统的免费CPU检测软件,它可以提供精确的CPU型号、主板芯片组型号、内存大小和型号、显卡型号和主频等相关信息。该软件分为单个CPU和双核CPU两个版本,我们可以根据需要选择相应的版本进行安装和使用。

2 HWInfo

这是一款开源、适用于Windows和Linux操作系统的硬件检测工具,它能够提供电脑各种硬件信息,包括CPU、GPU、主板、内存、硬盘、显示器等重要元件的详细参数与性能情况。该软件功能十分强大,并且提供的数据十分准确,是了解电脑硬件配置和性能表现的绝佳选择之一。

3 AIDA64:

这是一款专业的系统检测工具,可以检测电脑的硬件状态、监测温度、电压等参数,并同时提供CPU、GPU、内存速率测试以及利用负载测试评估电脑稳定性能力等功能。该软件界面也相对简洁美观,使用起来非常方便。

三、利用电脑游戏测试软件如果我们希望统计自己电脑在游戏运行时的性能表现,那么选择电脑游戏测试工具也是一个不错的选择,这些工具既可以测试有标识位于游戏各种情境下设备的表现,还可以通过图形卡实时引擎进行排除问题质素测试。市面上比较出色的游戏测试软件有3DMark,Unigine Heaven等常用软件。

大家可以根据自己电脑的型号进行选择,这几种方法都可以帮你查看自己的电脑硬件配置与性能。

至强系列和酷睿系列的CPU第一个区别就是市场定位不一样,至强系列是服务器CPU,比酷睿系列拥有更为丰富的指令集,更为出色的性能和支持更多的并发连接数,特别是在需要多线程运行的场景中优势相比酷睿系列是很明显的(例如处理大量的数据交换,视频压制转码,处理网站大量的IIS连接请求)。

这类CPU一般主频比较低,也无法超频,最多是有个睿频加速功能。这是因为服务器CPU一般都是需要长时间不关机全天候运行,所以功耗的控制必须要得当,而主频的高低是影响CPU功耗的一大因素。而且服务器CPU并无超频的需求,只需要变态的稳定。

酷睿系列(包括低端的G系列赛扬, I3 I5 I7系列 )主要面向绝大部分的家用桌面级消费市场,这类CPU的主要特点是全系列集成GPU,也就是核显。主频一般都比较高,相当一部分型号具有超频能力(主要是表现在型号后缀带K)。甚至现在出现了G4560这样的比肩I3级别的CPU,拥有超线程技术,超频能力不俗,被称为廉价I3。

至强系列CPU的具体型号划分有Xeon E3 Xeon E5还有高端的Xeon E7。

而至强系列CPU无GPU的说法并不准确,某些型号是有GPU的。

先来看看无GPU型号,E3的12X0系列

Xeon E3-1280:四核心,八线程,主频35GHz,动态加速最高39GHz,三级缓存8MB

Xeon E3-1270:四核心,八线程,主频34GHz,动态加速最高38GHz,三级缓存8MB

Xeon E3-1240:四核心,八线程,主频33GHz,动态加速最高37GHz,三级缓存8MB

Xeon E3-1230:四核心,八线程,主频32GHz,动态加速最高36GHz,三级缓存8MB,此外还有E3-1231,E3-1230 V5 (需要搭配C232主板)等型号。

Xeon E3-1220:四核心,四线程,主频31GHz,动态加速最高35GHz,三级缓存8MB

Xeon E3-1280热设计功耗95W,其他四款热设计功耗80W。

带有GPU的E3-12x5系列

Xeon E3-1275:四核心,八线程,主频34GHz,动态加速最高38GHz,三级缓存8MB

Xeon E3-1245:四核心,八线程,主频33GHz,动态加速最高37GHz,三级缓存8MB

Xeon E3-1235:四核心,八线程,主频32GHz,动态加速最高36GHz,三级缓存8MB

Xeon E3-1225:四核心,四线程,主频31GHz,动态加速最高34GHz,三级缓存8MB

ARM和X86的功耗控制区别很大,ARM是以低功耗出了名的,而X86 的高功耗是ARm的几十倍,不过在性能方面,ARM和X86是没有可比性的。ARM和X86原本是没有什么交集的,但是随着智能手机和智能平板的到来,ARM和X86也不可避免的发生碰撞,从两者架构优势到功耗控制都成了大家探讨的对象。

X86 与 ARM 的功耗控制差距如此之大完全是因为他们的市场定位不同导致的,X86的“复杂指令集”主攻的就是高性能市场,因为内部复杂的指令集和关注高性能的目的让它的功耗居高不下,而ARM的“精简指令集”主要针对的是对功耗敏感度比较高的移动端市场,Arm本身的设计就是将低功耗作为目标,X86 与 ARM本身的设计思路走的就不是同一个方向。

X86 与 ARM 的设计思路不同,也让它们表现出来的性能也有着巨大的差异,面向的设备也不一样。目前手机中的集成线路芯片都是采用了ARm架构作为核心基础,可以根据自身不同的需求去改变芯片的架构,而像英特尔、Amd则是采用的X 86架构,而x86的复杂指令系统大大提高了电脑的运算速度和处理效率,而ARm的性能只有x86的几十分之一。

虽然x86与ARm都试图弥补自己的短处学习对方的长处,但是无论进行怎样的优化,X86都无法实现Arm的低功耗,而ARm也没有办法和x86在性能上比拼的实力。由于两者最初的设计理念不同,现在想要进入对方的领域也并不容易,所以两者只能不断的通过各种尝试而缩小彼此之间的差异。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » TDP热功耗的计算方法

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情