生信分析平台搭建(十七):服务器配置

生信分析平台搭建(十七):服务器配置,第1张

熟悉完虚拟机配置服务器之后,就可以尝试上手搭建实体服务器了,如果要选购服务器,应该考虑哪些因素呢?如果不差钱,那就好办了,直接选最贵的就好了。在预算有限的条件下。CPU,内存,硬盘如何取舍,达到最佳性能,是否需要购买UPS,显卡是否有必要?这些问题,我们一文解决这些疑问。

二十二:服务器配置

1、CPU

CPU是计算机的大脑,计算机的计算主要就是靠CPU来完成,所以,CPU非常重要,CPU的计算速度决定了计算机的计算能力。也就是水桶效应中最上面的那块木板。比如序列拼接这个工作,需要将测序的reads切成更小 的片段,然后将这些小片段根据序列间的关系,连成更长的片段,那么这些片段有数百万至数千万,需要非常大的计算量。如果数据复杂,计算量就更大了。

另外,CPU还需要支持多核心,CPU是大脑,一个核心是一个心眼儿,所以,我们知道心眼越多的人越聪明。多核心就可以进行并行计算,在生物信息分析中,有些工作,可以进行并行计算。相当于原来一个人的工作,现在由100个同样的人来做,理论上速度快了100倍。因此,在硬件配置中,选择CPU是非常重要的。

2、内存

内存是CPU和硬盘之间数据交流的媒介,计算机需要将存储在硬盘上的数据读取到内存中,CPU才能用来计算,而CPU不能直接读取硬盘上的数据,必须通过内存这个缓冲区,举个例子,CPU是大脑,内存是脖子,脖子以下是硬盘。内存往往就是“瓶颈”。

假设一个人的全基因组测序数据,采用二代测序的方法,人的基因组3G,10被数据30G,那么这30G的碱基,在切成更小的kmer,假设数据增加到了100G,还不算存储序列的一些其他信息,序列拼接的时候必须一次将所有数据同时存入内存,如果内存达不到100G,拼接根本无法完成。

3、硬盘

硬盘其实是计算机硬件配置中非常重要的一环,但是硬盘往往容易被大家忽略掉,认为硬盘用来存储数据,只要需要足够大就行了,这是不对的。

首先大存储量是必须的,因为生物数据往往都称为生物大数据,非常消耗存储空间,包括原始的数据存储,中间分析结果,最终结果,数据备份等,尤其是在样品量大的时候,就会非常占据存储空间,一般都是以T为单位的。

其次,硬盘的读写速度,这个也是非常重要的因素,因为目前CPU计算速度和内存已经足够大了,这样的条件下,硬盘成为限制计算机整体性能的因素。因此使用SSD硬盘会明显改善计算机性能。由于目前SSD过于昂贵,可以选择SSD+机械硬盘的方案,硬盘要做成RAID提高读写速度和数据安全性。

4、显卡

可以选配显卡,这个并不是必须的,因为很多分析工作都是文本操作,显卡适合于图形计算,例如计算蛋白质空间结构,构建系统网络等,可以选择配置显卡。

5、不间断电源UPS

UPS相当于一个大的移动电源,为了防止突然断电,导致数据丢失。UPS还是非常重要的。有些生物计算需要持续很长时间,例如拼接一个大的基因组,构建一个大的系统发育树等可能数十天时间,一旦断电,损失非常大,不要心存侥幸心理,灾难往往就发生在那些心存侥幸心理的人身上。

6、其他

冷却系统,如果是大型计算系统,设备会产生大量热量,需要建设冷却系统。

---------- END ----------

欢迎订阅我们的微信公众号,更多精彩内容等你发掘!

选择云服务器的配置的话就要主要参考这几个因素:CPU,内存,硬盘,带宽,线路,操作系统和地区。下面分别说一下:

CPU就代表了云服务器的运算能力,如果网站流量较大,如果网站流量较大,动态页面比较多,建议选择2核以上CPU,而且目前的云计算厂商提供云服务器的配置还可以随时增加,也就是当你觉得业务量增长了,需要更强的运算能力了,那么就可以直接在官网上进行资源扩充。

内存是数据的中转站,也是决定网站打开速度的重要因素,内存越大,可用缓存越大,打开速度也就越快。根据你网站的规模选择合适配置的空间,假如是一般的个人博客,或者企业展示网站类,就可以选小一点的,若是商城类,新闻类就要相对大一点的空间,针对于各种应用场景,需要采取不同规格的配置,总之,最适合的才是最好的。

硬盘是存储数据的地方,硬盘的大小要根据网站的数据大小决定,在选择时应该考虑到剩余空间。另外硬盘的I/O读取速度直接决定文件读取的快慢,云服务器硬盘的读取速度比其他网站快很多,一般情况下都够用。

根据网站的性质选择合适的带宽,看你的网站类型、结构和访问量等指标或者预计,一般新的网站,不多,也做了处理的,有2M足够了。带宽只要真实,不用多,够用,合适就好;或者,先选择2M,不够再加,这样比较稳妥。如果是普通的网站。比如文字网站,网站,论坛等,占用的带宽非常小。5000的访问量可能也占用不到2M的带宽。如果是视频,下载等为主的网站。可能几百个人同时在线都需要占用10M以上的带宽。

操作系统的选择和个人的熟悉情况和网站具体情况有关,对哪种操作系统比较了解就选择哪种操作系统,另外windows系统对asp程序支持较好,不过占用内存较多,而Linux系统对PHP程序比较友好,更省内存,并且有的程序可能只支持某个操作系统。现在比较主流的云服务器,像阿里云的ECS就提供的各个版本的操作系统的镜像,还能非常便捷地获取由云市场提供的各种应用软件的镜像和工具等,甚至可以实现免安装和一键部署。

线路的选择对于我们来说有的时候十分纠结。如果我们是针对于本地用户,那么我们本来可以选择单线路的服务器,但是双线服务器的优势一般在于双IP,并且对于一个城市来说,宽带有电信、网通不同的。

地区,即云服务器所在地区,最好选择在你目标用户所在的区域内,这样网站等打开速度更快。最好选择的云服务提供商有能力在多地部署数据中心,这样可以提供更好的容灾性还能帮助降低访问网站的网络时延。

最后总结:云服务器的配置选择,和网站或应用的类型、访问量、数据量大小、程序质量等因素有关,建议和网站或应用的开发技术人员沟通,选择最适合自己业务场景的配置。 如果没有技术人员可提供建议,不妨参考云服务器厂商提供的配置方案,像1核1GB 1M的入门型适用于个人网站初始阶段;1核 2GB 1M的基础型适合流量适中的网站应用,或简单开发环境、代码存储库等。另外,像阿里云还有专门针对网站、电商、游戏、移动app等不同行业的解决方案供参考。

相信在未来,更多的网站会选择上云,云服务器的作用和价值也会更大地显现出来。

  不想被设备供应商牵着鼻子走的信息主管,在购买服务器前需从自身角度出发,通盘考虑业务、技术、投资成本、节能环保等各方面因素,确定最合适的需求。 服务器选购不当会带来很多

尴尬:

――服务器用了一段时间后需要增加网络接口,却发现插槽数量不够;

――CPU急需扩容时被告之早期的型号已经停产,买原来型号的CPU比新购一台设备还贵;

――服务器电源风扇这样的“配角”失灵,没有冗余备份造成宕机。

所有这些,都是信息主管最头疼、最不愿意遇到的事情。服务器是搭建企业应用系统硬件平台的核心设备,它必须在安全性、可靠性、灵活性、可扩展性等方面都具有优势,但更高的要求预示着更高的服务器采购成本。如何能够选择适合企业需要的服务器,更好地保护企业投资?信息主管需从业务、技术、投资成本、节能环保等角度综合考虑。

第一技

需求越细越好

服务器按运行的软件和承担的功能不同可以分为数据库服务器、应用服务器、网管服务器、邮件服务器、文件服务器、DNS服务器、计费认证服务器等。采购方可以根据应用软件用户数、数据量、处理能力的要求,将多个功能部署在同一台服务器上,或者将同一个功能按照特定规则(如: 不同模块、不同的用户群等等)分别部署在多台服务器上。对一个特定用户而言,不同应用系统的重要性不尽相同,系统越重要,对其硬件平台的稳定性、可用性要求也就越高。

如果单位已经部署了应用系统,在服务器扩容前应对现有系统进行评估,可以用资源监视程序或管理软件监控一段时间,记录系统资源消耗的峰谷情况,再结合拟新增加的应用和对系统今后一定时期负荷的增长预测,确定是通过扩容还是新购机器来实现。

一般按处理能力和市场定位将服务器由低到高分为入门级、工作组级、部门级、企业级等几个级别。采购方应根据应用系统处理能力需求来选择不同级别的服务器以及服务器具体性能指标。

第二技

服务器需“开膛”选

服务器的选购,并不仅仅是确定一个品牌、一个型号这么简单,要综合考虑服务器的组成部件性能。

CPU和内存

CPU作为计算机系统的核心,其主频、缓存、数量、技术先进性决定了服务器的运算能力,这些指标的提高,会增强系统性能,但并非线性提升,具体要参考一些测试指标以及实际应用的情况。Unix服务器中,CPU能否支持混插、热拔插将直接影响系统的可用性。扩大内存能够减少系统读取外部存储,提升系统处理性能。实践中需要根据不同的应用系统选择CPU与内存的配比,对耗用内存比较大的应用软件和数据库,需要配置更大的内存。

一些中高端Unix服务器中,厂商将CPU槽和内存槽位按一定比例组合集成在一个处理板上,安装CPU和内存的处理板作为一个整体,能够支持热拔插,从而提高了系统扩容升级和维护的方便性、灵活性。

对于中高端小型机,部分型号可以支持分区技术,能通过软硬件配合将系统划分为多个独立的服务器,用于部署不同的应用,IBM逻辑分区甚至能将一个物理CPU分成多个逻辑CPU。

硬盘

服务器内置硬盘用于安装和存放系统软件、应用程序以及部分数据,可以选择支持内置硬盘较多的服务器来存储数据或者作为文件服务器,不够存储的部分再通过购买磁盘阵列解决。硬盘的主要技术指标包括容量、转数及支持的技术。为提高磁盘系统稳定和可靠性,厂商一般会通过RAID技术来增加磁盘容错能力。服务器支持的硬盘主要有SCSI、SAS、SATA等, SATA支持的硬盘容量大,但硬盘转速低,性能不及SCSI和SAS盘; SAS和SCSI的稳定性和转速高,但容量相对小一些。

I/0扩展

服务器一般都会集成一定的网络接口、管理口、串口、鼠标键盘接口等,能满足一些基本的应用。但实际应用中可能需要更多外设连接,采购方就需要通过扩展槽增加适配卡来实现。如增加冗余网络接口卡(或增加光纤网卡)、磁盘阵列卡、远程管理卡、显卡、串口卡等等,这些适配卡的选择因网络连接方式、双机、存储系统连接方式、管理需要等需求不同而有所区别。

电源和风扇

对于一些扩容能力较高的服务器,增加一定数量的组件后系统功耗增加,采用多个电源的方式提高了系统的灵活性。另外,电源是有源电子部件,往往还内嵌有风扇这样的“易损件”,它的故障几率也是很高的,加之一些关键业务系统需要双路供电,所以常常采用冗余设计方式来提高系统的可靠性和可用性。

操作系统

各厂商PC服务器对于Windows系统都能够很好支持; 对于Linux系统,服务器厂商会对主流Linux品牌主要版本进行测试并公布支持性,未经测试的品牌及版本需要用户通过其他渠道确认(如Linux系统供应商的成功案例),一般主要涉及驱动程序和补丁包。

Unix服务器的情况比较复杂,主流Unix服务器都绑定自己的Unix系统,厂商之间的软硬件不能交叉安装,所以选择一个品牌的服务器,也就选定了操作系统,如基于SUN SPARC CPU的服务器安装Solaris,IBM Unix服务器安装AIX,HP Unix服务器安装UX。其中IBM P5/P6系列服务器现已支持SUSE Linux和Redhat Linux,基于安腾芯片的HP Integrity服务器能支持Windows和Redhat Linux。

第三技

测试服务器性能

在确定了服务器所要承担的应用之后,采购方应确定采用什么档次和配置的服务器。

如果已经部署了应用,仅仅为了扩容,或者所部署的应用在其他地方有成功案例,则可以结合应用的规模和技术要求进行对比分析,确定新购服务器的档次和配置。例如: 一个10万用户的计费系统使用1台A服务器,服务器CPU、内存等资源利用率正好不超过设计的限额,在相同业务逻辑情况下,现在需要实现一个能够支持20万用户的计费系统,则新购机器处理能力必须达到现在的两倍,那么,我们可以采用两台同样配置的服务器或者采用配置高于以前两倍的服务器。

对于一些定制或者新开发的应用系统,服务器选择就需要借助一些基准测试指标。就是服务器的工业标准基准测试,如TPC、SPEC、SAP SD、Linpack和HPCC等。这些基准测试,可以从处理器性能、服务器系统性能、商业应用性能直到高性能计算机性能等方面,给出一个量化的评价指标供用户选择。这些测试采用不同的模型和测试方法,关注的重点也有区别,所以,选做参照时一定要结合自己的应用需求。针对企业应用常用的参照指标有TPC和SPEC的测试结果。

TPC-C是事务处理性能测试委员会(TPC)设计的一种测试计算机处理能力的基准测试。它是基于联机事务处理模型,测试结果以系统每分钟能够处理的订单或交易量来表示,也就是tpmC。TPC-C能够对服务器的CPU、内存、I/O等各部分综合性能全面考察,所以常用于服务器整体性能的评价,特别是用做数据库服务器选择的参照。TPC-C的指标及所对应的软硬件平台都可以从www省略 网站查询。

SPECjbb(Java业务基准)是SPEC的一个用于评估服务器端Java的性能的基准,为Java用户提供用于评测服务器系统运行Java应用程序能力的最客观、最具代表性的基准。在为基于Java的应用系统选择服务器时,用SPECjbb值是一个很好的参照。SPECjbb测试不涉及I/O。SPECjbb指标及所反应的软硬件环境可以从www省略网站查询。

因为多方面的原因,各厂商不会对每个型号的设备都进行基准测试,所以经常会采用和已测机器相近的型号和配置的机器来估测其他机器的测试指标, IBM的P系列还提供了RPerf相对性能值来计算TPCC值。

在实际工作中,如果有条件,建议联系软硬件供应商能够搭建一个仿真的测试环境,或找到类似的应用案例,将会使选型更迅速和有效。

第四技

合理预留服务器

升级扩容能力

在做系统设计或者设备选型时,有时很难准确估算软件系统负荷,所以都会预留一定的余量或者扩容能力。供应商也会尽量推荐性能更高、扩容能力更强的机器。但从经济性、实用性角度来看,并非预留扩容能力越高越好。

就CPU而言,对于不支持CPU混插的PC服务器和低端小型机,鉴于CPU更新换代频繁,等到需要扩容的时候,也许已经停产无从购买; 如果能买到,以备件的方式,价格一般也会很贵,笔者就遇到过服务器扩容4CPU成本高于购买4CPU新机器价格的案例。所以建议选择一个合适的型号,CPU尽量一步到位。举例来说,如果觉得一颗CPU可能满足不了要求,那就一次性购买配有两颗CPU的服务器; 反之,如果觉得一颗CPU肯定能够满足目前的需要,那么建议直接购买支持一颗CPU的服务器。如果将来服务器不堪系统负荷,可以采用购买一台新的机器运用负载均衡技术扩容系统处理能力; 或者购买更高性能的服务器,而将该服务器用来安装其力所能担的应用系统。对于支持CPU混插的中高端小型机,那就根据对将来业务发展的估计和经费预算,预留大一些的扩容能力。

对于内存,由于槽位限制,为了预留扩容能力,建议尽量选用容量更大的内存条。一般单条容量大的内存,折合到单位容量的价格也高。

对于数据量不大的中小企业,往往采用服务器硬盘而不是盘阵存储数据,在这种情况下需要选择支持硬盘数量和容量比较大的服务器,并根据数据模型估算硬盘扩容余地,还需配置RAID卡。

第五技

应用软件与服务器兼容是关键

对于新增加的应用系统,需要评估应用软件与硬件平台及操作系统能否兼容; 在对现有系统升级扩容时,如果打算更换服务器平台,就必须考虑应用软件迁移移植成本。

在一种操作系统平台上开发运行的应用软件,更换一种新的操作系统平台,需要对现有代码进行重新编译、测试。如果应用软件与操作系统关联度比较大,可能面临修改软件甚至重新开发的情况,对于一些大型软件,将是一项复杂的任务。

第六技

别忽视与机器级别和CPU数量相关的软件成本

采购方在选择服务器时,常常希望购买高配置、高级别的设备,以便提高系统的性能、预留将来的扩容能力。然而,按照软件供应商的商务规则,包括数据库、双机软件、中间件软件、开发软件等等在内的许多软件的价格,要求与服务器CPU数量(有些软件按CPU核数量)或服务器档次直接挂钩,更多CPU、更高的机器档次,将会支出更高的软件费用,有时服务器增加一个CPU,所增加的软件成本将超过硬件增加的数倍。

所以,在满足适当扩容需求的前提下,可以通过选择更高性能的处理器来降低CPU数量和机器级别,合理降低软件系统的投资。

第七技

合理订购服务及续保

服务不仅影响设备的采购成本和未来的运行维护成本,还会影响到服务器上应用系统的业务可靠性。

服务器出厂一般都带有基本服务,如一年或者三年的返修和5天×8小时电话支持。用户可以根据自身需要,购买更高级别的服务,不同厂商对服务级别定义不大一样,有的厂商分为5天×8小时服务,7天×24小时服务,有的厂商定义为金、银、铜,不同级别的服务享有不同的响应速度、备件返修速度、返修时限以及现场支持、电话热线支持、软件升级级别。对于Unix服务器,硬件和软件服务购买的年限和级别不一定相同。在服务器选择时,需要根据自身需要购买相应服务,同时需要让供应商提供设备服务的详细说明。另外,一般购买的服务都是以设备出厂日期计算(考虑到设备运输和渠道因素,有些厂商有一定的后延,如3个月),这些因素都会影响到设备的拥有成本。

随着近年来IT系统的快速发展,各企业都采购了大量的服务器设备,而这些设备自带或购买的服务已经到期,如果需要继续接受原厂或者渠道的保修和技术支持,需要为这些设备续买服务,类似于给设备买保险。设备的续保费用与设备的型号、设备的详细配置、服务级别、原厂服务还是代理提供服务等因素相关,如果设备在购买合同签订时已经超出保修期,部分厂商还要收取设备检测费。原厂和代理通过设备序列号确认该设备的保修期。对于一些停产时间过长的设备,会出现不能继续购买服务的情况。

第八技

重视节能及环保

对于一台7天×24小时运行的服务器,如果能耗差100瓦,一年下来电耗差为876度。对于一个有10台机器的机房,每年将增加电耗8760度。每年几千块钱对于一个企业也许算不上什么,但对于能源紧缺的中国,数十万、数百万的设备,如果都能把电节省下来,长此下去,其经济价值和社会意义也不可小觑。

随着人们健康意识和环保意识的增强,环保标准RoHS规范遵从将作为人们选择电子产品的一个重要因素。RoHS是实现电子电气类产品中有毒有害物质的控制(禁止使用和减量化)的法律规范性文件。服务器在IT系统中被大量部署,如果不能很好地控制有毒有害物质,将对IT系统管理维护人员以及我们生活的环境造成损害。符合该规范的要求,将成为企业服务器选型的基本标准。(作者系亚信科技资深工程师)

链接

选择Unix小型机还是PC服务器

Unix小型机与PC服务器本质的差别是处理器,Unix小型机的CPU一般采用精简指令集计算机(RISC)技术,如SUN的SPARC系列CPU,IBM的Power系列CPU,HP的PA系列CPU等,而PC服务器的CPU是基于复杂指令计算机(CISC)技术,如Intel的处理器和AMD的处理器。

基于RISC架构的服务器采用精简指令系统,与Unix搭档,能有效提高系统处理能力和效率,加之各厂商一贯将其定位于中高端应用,在硬件设计上对可靠性、扩容能力、灵活性、管理方便性方面进行优化,所以它适用于对大型数据库系统、大型计算系统、大型应用软件和稳定性可靠性要求非常高的关键业务系统,如银行证券的交易结算系统,电信计费账务系统,大型企业的ERP系统等等。但其代价是相对昂贵的成本支出。

基于CISC架构的PC服务器,因为采用复杂指令系统,所以其处理效率和稳定性弱于Unix小型机。在安装微软的Windows操作系统时,虽然安全性和稳定性受到不少质疑,但它能够实现更友好的人机界面,可管理性强、操作和维护简易、软硬件兼容性好,而且具有价格优势。对于可以牺牲一些稳定性和效率的非关键业务和中低端应用,采用PC服务器具有更高的性价比。当然,随着技术的发展,PC服务器及Windows操作系统在性能、稳定性、安全性等方面也不断提高和完善,加之PC服务器还可以支持现在流行的Linux、SCO Unix、Solaris for x86等Unix操作系统,所以其应用范围也非常广泛,特别是在中小企业市场占有绝对的优势

选择服务器的话,要具体的做的应用来定配置,不过一般不建议用I7的CPU,I7的CPU价格也不便宜,而且一般都是PC机用,做服务器的在硬件的售后质保,和兼容性等方面都不没有品牌的整机服务器好,具体牌子配置的话,可以根据您的预算,预算多的话,可以用DELL IBM的,质量绝对没得说,如果预算紧张的话,国产强氧的品牌机器性价比还是很高的,可以尝试一发。具体要了解的话可以看下我的资料

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 生信分析平台搭建(十七):服务器配置

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情