服务器升级三两谈 如何选择CPU内存篇
而影响服务器性能的最主要因素就是CPU。无需多言,所有人都清楚处理器对整机性能意味着什么,通常他还决定了所采用的平台和支持的相关技术。 CPU篇 众所周知,各品牌服务器因设计不同,大多数的CPU散热器是不通用的,尤其在高端机型越发明显。本文仅以IBM品牌服务器为例,说说关于服务器配件的三两事。IBM X5550 CPU套件 首先是价格,举例来说,同样一个Xeon E7450(内核数6Core/主频24Ghz/前端总线1066MHz/二级缓存L2 9M/三级缓存L3 12M),在我们理解来说都是一样的,因为都是Intel的产品。但因为各品牌服务器设计不同,通常来说CPU套件也是不能通用的。因为CPU和散热器是不拆分销售的,所以选购不同品牌的服务器升级同样的硬件配置,花费是有些不同的。HP X5550 CPU套件 这样在我们升级处理器的时候就遇到了一个很大的问题。我们只能选用服务器厂商的CPU套件。 把这个话题扩展开来的话,还会涉及一些方面。包括各种渠道的散装CPU,加上各种来源的CPU散热器,就能组成出来很多非正规渠道的CPU套件。通常来说CPU的影响不大,毕竟CPU没有什么假的,我们要关心的是散热器。毕竟选用一款正规的散热器是一件很重要的事情。玩家们用的DIY风扇 与DIY玩家不同,服务器的理念是提供724的稳定性,这不是什么讲究个性甚至换散热器玩超频的事情。所以才会有不同厂家同样配置服务器之间价格上的巨大差异。当然,这不是说贵的就一定在各方面好,便宜的就一定在各方面不好,只是影响价格的其中一个因素。 CPU散热器 很多服务器的CPU散热器都是特别设计的。讲一个笔者曾经亲历的事情,某单位决定升级一批IBM Blade Center HS21的处理器Xeon E5440。有10台刀片式服务器打算把之前的单路配置升级为两路配置,经过各层转达最后订购到了10套CPU组件。配件型号为44R5634,具体内容是Quad-Core Xeon E5440 283GHz 12MB L2 1333MHz 80w 。IBM HS21 CPU套件 有什么问题吗?单看这些参数,大部分对服务器CPU有了解的人可能都不会觉得有问题。可当技术人员拿到这批CPU时候却顿时傻了眼,硕大的处理器散热器根本就无法安装在轻薄的刀片服务器上。机架式服务器CPU套件 正确的选件编号应该是44T1740内容同样是Intel Xeon QC E5440 283GHz 12MB L2 Cache 80w。区别就是CPU套件里提供了不同的散热器。而CPU本身是一样的。不同的编号对应的是不同类型的服务器。 欢迎进入服务器论坛讨论 CPU稳压模块IBM CPU稳压模块 还有一种情况,在Nehalem之前,服务器平台的两路和四路扩展通常需要CPU稳压模块(VRM)。以IBM产品为例,当单路服务器升级为多路时候需要添加一个对应CPU型号的稳压模块,这个稳压模块是随原包的CPU套件提供的。而四路的服务器(例如X3850M2)则有对应的4个稳压模块,这也同样是包含在CPU套件里的。而本身为两路的服务器(例如X3500或X3650)在只有一个CPU的时候是不需要稳压模块的,只有在扩展为两路时候才需要添加稳压模块(且只能添加一块)。HP CPU稳压模块这个VRM可是"非行货"多发配件 抛砖引玉,请大家务必在选购升级服务器时候充分了解关于配件的种种问题。 内存篇 大家都知道服务器内存与普通PC机的内存有所区别,一般都带有ECC校验功能。通常情况下我们会选择与服务器品牌相同的内存品牌。但是实际上内存都是由现代,美光,尔必达,三星等厂商为服务器厂商生产的。所以我们一般情况下不用太在意内存颗粒,但是几乎所有的服务器厂商都会建议用户采用自身服务器品牌的内存进行更换升级。不同的内存条 升级时候还有一点不能忽略,除了选择同样频率的内存,既DDR3-1333Mhz,DDR2-667Mhz等。还应注意,服务器内存通常来说是成组购买升级的。既每个内存通道内,尽量要使用相同品牌、相同颗粒、相同频率、相同电压、相同校验技术(chipkill,ecc)、相同型号(udimm rdimm)的内存条。 这点尤其重要,否则服务器可能会报错。 服务器内存与普通内存有什么区别? 内存校验技术 一般来说也就是后面两种区别较大,通常来说服务器内存都带有校验技术,而普通PC机内存是不具备的。相对传统的ECC校验技术,chipkill又是何方神圣呢?“探路者”探测器登陆火星 在十几年前,相传在遥远的火星上出现了名为“探路者”的怪物…… IBM引入大型机的技术为美国航天局(NASA)的"探路者"探测器赴火星探险而研制了Chipkill。它是IBM公司为了弥补目前服务器内存中ECC技术的不足而开发的,是一种新的ECC内存保护技术。 ECC内存技术虽然可以同时检测和纠正单一比特错误,但如果同时检测出两个以上比特的数据错误,则无能为力。但基于Intel处理器架构的服务器的CPU性能以几何级的倍数提高,而硬盘驱动器的性能同期只提高了5倍,因此为了保证正常运行,服务器需要大量的内存来临时保存从CPU上读取的数据。这样大的数据访问量就导致单一内存芯片在每次访问时通常要提供4(32位)或8(64位)字节以上的数据。一次性读取这么多数据,出现多位数据错误的可能性会大大提高,而ECC又不能纠正双比特以上的错误,这样就很可能造成全部比特数据的丢失,系统就会很快崩溃。IBM的Chipkill技术是利用内存的子结构方法来解决这一难题的。 随着技术的发展,这些年已经出现了关于内存更多的保障技术。 热备内存—Sparing热备内存技术 进行内存热备时,做热备份的内存在正常情况下是不使用的,也就是说系统是看不到这部分内存容量的。每个内存通道中有一个DIMM不被使用,预留为热备内存。芯片组中设置有内存校验错误次数的阈值, 即每单位时间发生错误的次数。当工作内存的故障次数达到这个“容错阈值”,系统开始进行双重写动作,一个写入主内存,一个写入热备内存,当系统检测到两个内存数据一致后,热备内存就代替主内存工作,故障内存被禁用,这样就完成了热备内存接替故障内存工作的任务,有效避免了系统由于内存故障而导致数据丢失或系统宕机。这个做热备的内存容量应大于等于所在通道的最大内存条的容量,以满足内存数据迁移的最大容量需求。 内存镜像—Mirroring内存镜像是将内存数据做两个拷贝,分别放在主内存和镜像内存中。系统工作时会向两个内存中同时写入数据,因此使得内存数据有两套完整的备份。由于采用通道间交叉镜像的方式,所以每个通道都有一套完整的内存数据拷贝。 在系统芯片组中设置有 “容错阈值”。如果任意内存达到了“容错阈值”,其所在通道就被标示出来,另一个通道单独工作。但仍然保持双通道的内存带宽。内存镜像技术 内存镜像有效避免了由于内存故障而导致数据丢失。从上图中可看出,镜像内存和主内存互成对角线分布,如果其中一个通道出现故障不能继续工作,另一个通道仍然具有故障通道的内存数据,有效防止了由于内存通道故障导致的数据丢失,极大提升了服务器可靠性。镜像内存的容量要大于等于主内存容量,当系统工作时,镜像内存不会被系统识别。因此在投资方面,做内存镜像数据保护的投资是没有内存保护功能的一倍。 随着芯片组的发展,和内存通道技术的改变,热备内存和内存镜像实现的方式也在做着改变。像上文介绍的方式已经不适用于Nehalem这代产品的三通道内存和四通道内存产品了。而以上的两种方式为了实现更高的可靠性都会给整个系统带来在内存方面较大的花费,以及由此带来的整个内存系统可用数量下降。 关于UDIMM和RDIMM UDIMM(Unbuffered Dual In-Line Memory Modules)无缓冲双信道内存模块。控制器输出来的地址和控制的信号直接到达DIMM的DRAM芯片上。UDIMM的最大配置 不能支持服务器满配内存,也就是说不能达到最高容量。使用UDIMM内存时最大使用每通道只能用2个插槽,但支持3通道,所以只能每边插6条,一共12条内存,不能满配。性能相对会有下降,但是对于预算控制,是个不错的选择。 RDIMM(Registered Dual In-line Memory Module)带寄存器的双信道内存模块。
DELL 戴尔第13代的服务器出厂默认的iDRAC8是Express版,没有办法启用远程虚拟控制台,需要通过升级文件升级到 iDRAC8 Enterprise企业版 才可以,启用远程控制台就可以在远端像在管理本地计算机一样管理服务器了;可以远程开关机、远程安装系统、查看远程桌面,远程调试BIOS,远程调试RAID,将本地文件远程挂载到服务器中,远程产看服务器硬件健康状况等功能,也就是把服务器的显示器键盘鼠标通过网线呈现到你的面前!
升级成 Enterprise版,才能彻底开启 iDRAC8 的完整功能,实现可以真正意义的服务器远程管理
宝塔Linux面板作为一款Linux服务器的入门级面板,一向以简洁,实用,方便的功能深得大众SEO站长的芳心。它不但可以 通过WEB管理页面对服务器进行管理,并且还可以一键部署LNMP与LAMP建站环境,同时对服务器进行实时监控,防火墙,部署SSL证书,服务器文件在线管理等操作 ,而且宝塔Linux面板目前现有的各种免费的功能几乎能满足大多数SEO站长的需求,还有更多实用的功能可以通过付费使用。
但是前段时间阿南发现宝塔Linux面板偶尔出现CPU负载状态过高,导致站点加载速度时间过长,,给大家的浏览体验带来了一定的影响。后来阿南在网上查阅相关资料发现解决问题的方法五花八门,各种各样的说法都有,让你无从下手。最后还是通过某位服务器运维的大牛指点,才把这个问题解决,并且得到了反馈很好。接下来阿南就把这个方法分享出来,希望能够帮助到各位站长。
阿南的云服务器安装的是宝塔Linux面板, 建站环境所使用的是LNMP,Nginx 115、MySQL 55、PHP-72 ,基本情况了解了下面直接看操作。首页,进入php72的管理页面,选择安装一个opcache缓冲器,用于加速PHP脚本,如下图:
接着在配置修改选择 将最大脚本运行时间修改为60,最后将并发方案设为30并发 ( 注意 :宝塔面板通常会自动根据你的服务器配置给你设置合适的并发,如果你觉得不够用可以自己设置),接着在性能调整中将最大空闲进程数设置为20。如下图:
按照以上这个方法优化,阿南的云服务器发现并没有出现CPU负载状态过高了,也就是说这个方法是非常有效的。但是,对于服务器这块阿南并不是专业的,所以不能够保证这个方法对于大家都是有效的,如果此方法效果不明显建议大家可以通过升级服务器配置解决此问题。
升级原则
1 服务器升级的目的是解决系统某一方面的瓶颈,但是升级的结果不能造成新的系统瓶颈。
升级时应该考虑针对的是服务器哪一方面的瓶颈,但是从应用来说,不能因为简单的升级某一部件,而造成其他性能的瓶颈。简单举一个例子,单CPU服务器可以配置256MB内存,但是如果双CPU服务器配置256MB内存,内存肯定会成为系统的瓶颈。
2 服务器升级的前提是系统硬件配置可以提供用户升级的空间。
服务器的升级是在服务器硬件配置有升级能力的前提下进行的,所以在网络规划的初期,网管人员应该对应用的需求和增长有一个初期的估计,在选择机型时,为今后的扩展预留一定的空间。
3 升级必须针对具体的应用,而不是简单的增加硬件。
服务器的应用往往是专机专用,一台服务器主要针对一种应用,这样当服务器出现性能上的瓶颈时,升级应该是针对这种应用的升级,而不是针对某一种部件。不能认为简单升级单一硬件就可以满足应用对性能的需求。
升级故障及其解决
升级可分为在线升级和离线升级。
1 在线升级:系统在不关机的情况下,升级某一部件,系统不受任何影响。在IA架构服务器上,热插拔硬盘的升级和RAID级别的迁移是不用系统重新启动的。
2 离线升级:系统需要关机,升级需要在不带电的情况下进行。这主要指CPU、内存的升级。例如CPU的升级,无论是扩展CPU还是更换CPU,都建议系统重新安装。扩展CPU时候,尤其单CPU扩展到多CPU,系统需要重新安装SMP内核,这样对于UNIX系统来说需要升级系统内核重新编译,对于Windows系统来说,则需要重新安装操作系统。又比如内存的升级,内存增加后,系统性能参数和数据库应用参数必须进行调整。
升级案例
一台单CPU的数据库应用服务器(支持双CPU系统),随着数据量的增加和客户端人数的增加,系统需要升级,安装的是Unixware操作系统,如何进行?
根据用户的应用分析,需要升级系统中的很多部件,如:CPU、内存、硬盘等。这样的话升级应该包括以下几个步骤:
1 备份系统数据(防止误操作导致系统数据丢失)。
2 断电,离线状态下实现硬件的升级,安装CPU、内存和硬盘,注意保证硬件的规格和原主板硬件的规格一致。
3 重新启动操作系统,增加CPU的License。
4 利用RAID的特性,整合新加入的硬盘。
该台式机主板使用IntelG31芯片组,可以支持771硬改775的XeonL5420/E5440、E5450处理器。但需做如下处理:1、由于L5420/E5440处理器,安装到755pin插座上,要转向45度,其定位缺口与插槽的凸起定位冲突,需用刀片细心将原插座的凸起部分切掉,才能正常安装到位;2、上面操作很容易出现失误,损坏插座内的针脚,因此最好多花点钱买那种已经切好定位缺口的CPU,直接安装使用。如下图示;3、有些G31主板BIOS中,缺少支持服务器版CPU的微代码,安装后可能会遇到出错提示,或无法识别问题。此时需要去主板官网下载最后一版BIOS更新ROM,刷机后即可完全支持771pin的CPU。
0条评论