高性能液冷GPU服务器中有上亿个晶体管,坏了一个还能工作吗?

高性能液冷GPU服务器中有上亿个晶体管,坏了一个还能工作吗?,第1张

你以为的CPU:漏一个洞船就沉了。

实际的CPU:漏100个洞它都沉不了,更可能的是你连感觉都感觉不到。

工程和技术的典型区别就在于“可靠性”

技术只需要出一个原型就可以申请专利了。

但工程需要的是造出100万个产品,每个产品使用100万次,不出问题

芯片是产品,上亿个晶体管坏一个就得扔,这产品你敢买?

所以生产芯片是工程,是一堆技术的叠加,这是真正的难度。

显卡没有工作。根据查询太平洋电脑网得知,y9000pgpu温度没了是显卡没有在工作,可以重新安装一下显卡的驱动,若步行,需要修理店维修。GPU是Graphics-Processing-Unit的简写,是显卡中非常重要的一个部分,其中文名为图形处理器又称显示核心,视觉处理器,显示芯片。

步骤/方法

1

软件方面:

  1驱动兼容性问题;

  2系统或软件兼容问题;

  3游戏程序问题。

2

硬件方面:

  1显卡接触不良问题;

  2电源问题;

  3超频不稳定;

  4主板与显卡的兼容性问题;

  5显卡温度过高;

  6显卡本身问题。

  所以显卡花屏故障问题的出现大部分还是和显卡本身有关,以下是笔者总结的一些比较有效的解决方法,希望能和各位用户分享一下,学会了这些你以为就不用再求助那些所谓的高手了。

3

接触不良问题:

  1)显卡与主板PCI-E接口接触不良,导致花屏。 解决方法:关机拔插显卡,清理显卡的金手指和PCI-E插槽的灰尘和异物

  2)显示线与显示接口接触不良,导致花屏 显示器信号线问题造成偏色,请更换信号线。信号线与VGA或DVI接口接触不良引起花屏,请重新连接并将接头上的螺丝拧紧。

4

驱动问题:

  显卡驱动安装不完整或驱动本身不稳定都会导致花屏。

  解决方法:请依次进入开始->设置->控制面板->添加/删除程序,卸载Nvidia Drivers(部分驱动包含Nvidia PhysX驱动,重新安装或更换其他版本的驱动(推荐安装一些通过WHQL认证的驱动,如17824等等)。

5

源问题:

  电源功率不足或电源品质不良导致花屏。

  解决方法:检查系统是否已满足显卡的功耗要求:

  1)对于9500系列,单卡设计功率为50W,建议电源额定功率250W,推荐300W或更高。

  2)对于9600系列,单卡设计功率为90W,建议电源额定功率300W,推荐350W或更高。

  3)对于9800GT系列,单卡设计功率为105W,建议电源额定功率350W,推荐400W或更高。

  4)对于9800GTX+/GTS250系列,单卡设计功率为145W,建议电源额定功率400W,推荐450W或更高。

  5)对于GTX260系列,单卡设计功率为223W,建议电源额定功率460W,推荐500W或更高。

  6)对于GTX275系列,单卡设计功率为235W,建议电源额定功率500W,推荐550W或更高。

  7)对于GTX285系列,单卡设计功率为254W,建议电源额定功率550W,推荐600W或更高。

  建议尽量使用一些品质优良的品牌电源,以保证系统供电稳定性。

6

超频不稳定:

  对显卡、CPU、内存进行超频后导致花屏。

  解决方法:

  1)进入主板BIOS设置程序,恢复BIOS默认设置或将CPU和内存恢复为默认值。

  2)检查显卡是否已超频使用,请恢复为出厂默认频率。

7

显卡温度过高:

  显卡GPU或显存温度过高,导致花屏。一般显卡温度过高可能因风扇有灰尘等异物干涉使风扇转速变慢或停转引起。

  解决方法:

  使用软件(如Magic Panel、ATI tool、RivaTuner等)或其它设备(如红外温度探测仪)检测GPU或显存温度(部分3D游戏,将游戏特效全部打开或性能设置过高,GPU温度达到95 ℃左右都算正常)。

8

系统或软件兼容问题:

  系统或软件问题,导致花屏。

  解决方法:

  建议不要使用Ghost版系统,重新安装Windows原版系统和显卡驱动。安装系统补丁,更新显卡驱动。

9

游戏程序问题:

  解决方法:

  重新安装游戏。建议从游戏官方网下载最新的游戏客户端安装并安装游戏补丁,更新显卡驱动。如果仍有问题,建议更换平台测试或将卡送当地经销商处检测。

10

主板与显卡的兼容性问题

  显卡与主板不兼容导致花屏。

  解决方法:

  有条件可更换同型号显卡或其他厂商同型号显卡检查。如果仍然出现问题,请联系厂商协助解决。

显卡本身问题

  由于显卡本身核心出现问题导致花屏。

  解决方法:

  在保修期内,如果出现这种情况,马上通过与厂商进行咨询,看能否直接在本地总代理处更换显卡或者是由厂商进行更换。

  显卡花屏问题经典案例简单分析:虽然说上面网友提出的问题已经是2009年的事,但是显卡花屏问题并不是一朝一夕的事情,下面就由笔者来为大家说说该问题的分析和解决方法。

先搞清楚花屏现象是发现在开机前还是开机后

  网友说得很清楚在更换显卡之后开机就出现花屏,所以先来检查一下显卡是否存在接触不良的问题,关机拔插显卡,清理PCI-E插槽的灰尘和异物,再看看金手指是否被氧化了,然后根据具体情况清理下灰尘,用橡皮擦擦一下金手指,把氧化部分擦亮。再次把显示线重新链接。

查看是否由于超频而引起的不稳定

  进入主板BIOS设置程序,恢复BIOS默认设置或将CPU和内存恢复为默认值;检查显卡是否已经超频使用,恢复默认频率或者降低运行频率,某部分显卡有超频跳线的把超频跳线按照说明书上写的方法调整为较低频率的跳线。

查看是否电源功耗不够而引起的不稳定

  由于前面已经把CPU、内存、显卡等的频率调整到默认频率,如果问题依旧,有条件的朋友可以尝试更换更高功率的品质优良的品牌电源。(条件不足的可以去朋友家借一个,毕竟已经电脑的普及率已经很高了。)

确保显卡温度的正常

  检查风扇是否灰尘过多造成风扇转速慢或停转,建议定期清理风扇和PCB表面的灰尘。也可以更换更强的显卡散热或在显存上加装散热片。但我们并不建议大家在显卡保修期内进行散热器的拆解,因为散热器拆解后会一定程度上影响显卡的散热和还有可能令显卡不能进行正常保修。

确保显卡和主板没有存在兼容性的问题

  这个问题虽然比较少发现,但大家并不能轻易忽视这样的问题。把显卡装到另外一台机器上观察是否有着同样的问题。如果经过以上方法后显卡还是花屏的话,则你可以尝试着刷新显卡的BIOS,去显卡厂商的主页看看有没更新的BIOS下载。对于一些杂牌厂商的显卡来说,你可以试下用大厂商的BIOS刷你的显卡。如果刷BIOS也不能解决的话那么证明你的显卡本身存在着问题,建议把显卡拿去保修或者是维修。

  如果都没有上述的情况出现,那么我们就进入系统再分析。

  

1如果是在玩游戏、处理3D时才出现花屏、停顿、死机的现象那么在排除掉散热问题之后可以先尝试着换一个版本的显卡驱动试下,同时建议使用通过WHQL认证的驱动,因为显卡驱动与程序本身不兼容的原因或驱动存在BUG可能性确实也是很常见的。

  

2倘若上面方法均未奏效,那就只好重装系统,在日常维护中通过重装系统可以解决不少问题。安装系统后还要按正确的顺序来安装驱动程序:WINDOWS XP SP2补丁--主板驱动--显卡驱动--声卡以及其他PCI设备驱动--外设驱动。当驱动安装顺序不正常时,也有可能产生一些问题,驱动的安装顺序与底层设备驱动、注册表键值和Gart映射列表等都是有关系统的。

简单的思路就是:先从硬件再到软件

像当年“9800GTX+ 花屏”案件就是一件很好的显卡GPU核心问题的例子。当年9800GTX+是风光无限好,的确引起了很多高端显卡消费者的关注的关注!不过关注多了,卖的人也多,逐渐的9800GTX+ 花屏的问题浮上了水面。其中所涉及到的显卡品牌相当广泛,一些无法深入了解原因的消费者开始指责显卡厂家产品质量低劣。事情的开端是这样的:NVIDIA在早先提供给AIC的BIOS中2D/3D频率不一样,2D频率被调到很低(300/200MHz),但最初NVIDIA提供厂商的测试版driver并未开启2D/3D分频功能——也就是说,无论显卡是工作在2D环境下,或者3D环境下,显卡始终以恒定的3D频率运行。

  因此,虽然BIOS设置了2D及3D两个频率,但显卡并不会在2D/3D下自动切换频率。因而在研发与工厂测试中,都并未体现出这一问题。在9800GTX+发布后,NVIDIA正式发布18xxx版本驱动程序,而该驱动程序中开启了2D/3D分频功能,驱动程序会读取显卡BIOS中2D与3D环境下的频率设置,并根据操作系统是否调用3D API来判断显卡运行在何种频率上,因此在一些2D环境下,显卡核芯及显存频率被降到非常低的频率上,很容易出现2D花屏。

  解决这个BUG的办法也很简单,只需通过更新BIOS将2D/3D频率设成一样即可,也就是相当于关闭这个自动调频功能。其实这样的BIOS问题是比较少的问题,更深入一下的核心硬件上的问题才是真正的大问题。不过我们熟悉的显卡厂商并不像丰田汽车一样质检轻松,更多的核心硬件问题大多数都是二手或者是维修过的显卡上才会出现的。所以一般的消费者并不用过于担心。

极具趣味的:烤GPU也能挽救显卡花屏

  其实这个极具趣味的:烤GPU也能挽救显卡花屏仅仅是提供大家参考用途,当然这样的方法大家只需要围观看看就行了。别太认真真的去实践,使用烤炉烤显卡还是有一定的危险存在的。

  具体方法是,将显卡的所有散热器拆掉,露出GPU。将显卡正面朝下放置,四角垫起防止GPU和高温直接接触。将烤炉预热到200摄氏度左右,放入显卡,烤5到10分钟,取出自然冷却。如果你够幸运的话,曾经挂掉的显卡已经复活了。

开机黄灯闪按下述方法依次检查。

1、拔下内存条用橡皮擦除尘再换个插槽或者用一根已知是好的内存条替换开机;

2、拔掉硬盘的电源线或者数据线开机(如果是硬盘问题,显示器会有主板的一些基本信息,只是无法进入系统);

3、显卡除尘或者替换,方法类同内存条,开机;

4、替换电源;

5、主板放电,取下电池用一金属物件接触弹片5秒放静电(静电也会影响开机);

6、CPU替换;

7、把主板取下裸机试点(注意垫上绝缘的东西,书,海绵垫都可以)再逐一安上其它硬件依次排除;

如果上述办法均不行,只能去电脑维修部门检测,维修。

一、电脑常见问题

主板不启动,开机无显示,有显卡报警声。

故障原因:一般是显卡松动或显卡损坏。    

处理办法:打开机箱,把显卡重新插好即可。要检查AGP插槽内是否有小异物,否则会使显卡不能插接到位;对于使用语音报警的主板,应仔细辨别语音提示的内容,再根据内容解决相应故障。     

如果以上办法处理后还报警,就可能是显卡的芯片坏了,更换或修理显卡。如果开机后听到"嘀"的一声自检通过,显示器正常但就是没有图像,把该显卡插在其他主板上,使用正常,那就是显卡与主板不兼容,应该更换显卡。  

一般情况下,对于普通的网站运行和开发,没有必要使用GPU服务器。

GPU服务器主要用于图形处理、深度学习、科学计算等需要大规模并行计算的任务。相比之下,网站运行所需的数据处理和计算任务是相对简单的,通常不需要利用GPU的强大计算能力。

然而,一些特殊类型的网站可能会利用到GPU服务器。例如,需要进行图像处理或渲染的艺术类网站、虚拟现实(VR)或增强现实(AR)相关的应用等可能会借助GPU来提供更好的用户体验。

如果您的网站不是高并发网站或视频编解码网站,那么选择轻量应用服务器最合适,轻量应用服务器配置高,价格低,有流量带宽需求,选择4核8G10M带宽就够了 。

方法如下。

第一种症状是按电脑电源键后电脑没有任何反应。

最常见的原因为硬件问题:硬件问题可以具体到各个电脑组成部分与连接线,可以通过以下方法查找。

一是电脑电源老化造成电压不稳,功率不足,常见的症状是电脑电源闪一下就灭了。

这个时候可以尝试将电源线拔掉再插上开机试试。

如果不行继续往下看。

二是连接线问题,既然电源原因不好判别有没有问题,可以尝试重新插在主板上的电脑机箱内的各个硬件连接线,连接线松动也会造成电脑开机没反应。

三是电脑爱护不当,相对老的机子来说,电脑机箱内的灰尘需要定时清理,不然主板上的灰尘、cpu风扇上的灰尘还有电脑电源上的灰尘都有可能让电脑启动不起来。

这个就好解决,使用清洁工具小心吹扫一下电脑上这几个地方的灰尘就可以了。

四是显示器问题,电脑开机没反应有时候也是说电脑机子可以运行,但是电脑显示器没反应,这种只要换一台显示器就能知道是不是显示器的问题。

如果是显示器的问题,那只能拿去维修点修了。

五是电脑显卡的问题,如上第四步换了一台显示器后还是不能显示,那就可能是电脑显卡的问题了。

显卡问题大部分的原因是在电脑内存上,试着打开机箱清理内存上的灰尘和重新插下集成显卡上的电脑内存,或者换一条内存试下。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 高性能液冷GPU服务器中有上亿个晶体管,坏了一个还能工作吗?

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情