常见服务器故障类型及排查方法总结
四,服务器故障排查方法总结
问题描述:
每当出现网站访问不了的时候,估计应该就是服务器出现故障了,这个时候大部分情况都是属于数据库出现问题。
查找步骤:
1、查找top检查服务器负载是否有问题
一般网站访问不了,top显示的负载都是很大的,这个时候可以看到mysql的进程占用资源很高,往往就是mysql发生故障了
2、在服务器中查看网站的访问记录
这些访问记录存储在:/home/对应的网站名/access-logs/对应的网站名
可以先通过tail查看,查看出异常的ip的时候可以通过grep进行过滤查看,在这个文件一般都可以找到恶意爬虫、恶意访问的记录,这些往往有可能是导致mysql数据库挂掉的原因。
3、这个时候先对数据库进行重启,对apache进行重启
service mysql restart
service httpd restart
重启之后一般都可以暂时恢复正常的访问的了。如果是出于恶意访问的话,找出恶意访问的ip把它禁止掉即可,如果是网站数据库出现故障,那么还要进行数据库排查。
4、查找数据库错误日志
首先需要知道数据库mysql的安装目录,可以通过whereis mysql找到,但是这往往没用
还有一种方法,就是通过ps -ef | grep mysql来查看
或者也可以通过进入mysql,使用select @@basedir as basePath from dual来查看mysql安装目录
我们在第二种查找方法ps -ef | grep mysql中对应mysql的几种日志找到其所在目录,然后查看对应文件进行分析
mysql有以下几种日志
错误日志:-log-err
查询日志:-log
慢查询日志:-log-slow-queries
更新日志:-log-update
二进制日志:-log-bin
以上便是对应的数据库错误日志和慢查询日志的查看方法了
在服务器的维修中,线索都会显得扑朔迷离,有的甚至按起葫芦翘起瓢。一般来说不可能一次就可以准确地判断出问题的所在。这样就要求工程师要有信心和耐心。出现错误一般的方法都是根据经验优先使用最简单排错方法测试,如果没有解决问题再找其它因素进行测试。总之,服务器出错后必须一步一步解决,没有捷径可言。
1、无法登陆无线路由器进行设置 硬件故障大多数是接头松动、网线断、集线器损坏和计算机系统故障等方面的问题。一般都可以通过观察指示灯来帮助定位。此外,电压不正常、温度过高、雷击等也容易造成故障。 办法一:检查路由器上面的数据信号指示灯,电源灯间歇性闪烁为正常,如不正常首先检查接入的宽带线路,可以换不同的网线重新插好。在电脑中检查网络连接,重新设置IP地址,如果在自动获取IP地址不成功的情况下,手动设置IP并禁用系统所用的网络防火墙功能。 办法二:在系统IE的连接设置中选择“从不进行拨号连接”,点击“确定”结束。进入“局域网设置”后清空所有选项。再打开IE 输入路由器地址进行连接。 办法三:将路由器恢复出厂设置,重新安装驱动及登录帐号及密码。 如上办法仍未解决请联系厂商并检查硬件之间的冲突问题。 2、能上MSN但无法打开网页 路由器是地址转换设备,当你或与你进行通信的人位于防火墙或路由器之后时, 阻止了双方直接连接到 Internet。此时要求双方所使用的网络地址转换设备支持UPnP技术。关于路由器对该技术的支持情况请看你所用的路由器说明书,并咨询厂商技术支持。 办法一:个别路由器需要在LAN设置中将UPnP设置为“Enable”。 办法二:有可能是病毒所致。可以打开资源管理器查看资源占用和CPU使用情况,如果占用率很高,很有可能是感染了病毒,将其用杀毒软件进行查杀即可。 办法三:IE文件损坏。下载新的IE进行安装或配合操作系统进行修复即可。 3、联网时断时续 一般的无线路由器都会提供三种或三种以上的连接方式,大多无线路由器会默认设置成“按需连接,在有访问数据时自动进行连接”也就是说每隔一定时间它会检测有没有线路空载 ,一旦连接后并没有数据交互,就会自动断开连接。 办法一: 进入无线路由器设置界面,在连接方式出选择“自动连接,在开机和断线后进行自动连接”即可。 办法二:检查网络是否有网络病毒攻击,很有可能是ARP网络攻击。进入网卡属性,手动设置IP,更换新的IP地址,如果继续掉线,请使用专业的抗攻击软件进行防御。 4、网速过慢 首先有可能是WEB服务器繁忙所致,其次有可能是无线信号微弱所致。 办法一:如果是WEB服务器繁忙所致则不是我们用户所能够解决的,您可以过一段时间再试一次。 办法二:在企业和SOHO族使用无线局域网中,无线路由器的位置摆放经常被人们所忽略。无线路由器的位置摆放不当是造成信号微弱的直接原因。解决办法很简单: 第一、放置在相对较高的位置上; 第二、摆放的放置与接收端不应间隔较多水泥墙壁。 第三、尽量放置在使用端的中心位置。 5、状态显示为可以发送数据包,却接受不到数据 首先确保你的物理连接正确。登录路由器。用路由器ping接入提供商的dns地址。如果能ping通,说明路由器到internet的连接是畅通的,否则请检查路由器的配置。然后,用内部网络中的任意一台pc机ping网关(即路由器内部接口地址),如果能ping通,则说明内部网络连接是畅通的,否则就检查路由器配置和pc机配置是否正确以及是否相符合。如果上面两步均能ping通,但是还是上不了网的话,就按照一下步骤排查。 1)、检查内部pc的网关和dns的配置是否正确,确定无误后进行下一步。 2)、检查路由器关于nat方面的设置,看看配置是否正常。如果路由器配置检查不出错误,最好查看一下nat的地址转换表(不知道你的路由器是否支持此功能)。看看内部网络的地址转译是否有相应条目。如果没有证明你nat配置一定有错误,那么将其改正好。 6、硬件故障 当无线网络发生网络故障时,你应该从硬件的问题会导致网络错误,同时错误的配置也会导致网络不能正常工作。 1)、硬件排错 大型无线网络环境中,如果有用户无法连接网络,而另一些客户却没有任何问题,那么很有可能是众多接入点中的某个出现了故障。一般来说,通过察看有网络问题的客户端的物理位置,你就能大概判断出是哪个接入点出现问题。 当所有客户都无法连接网络时,问题可能来自多方面。如果你的网络只使用了一个接入点,那么这个接入点可能有硬件问题或者配置有错误。另外,也有可能是由于无线电干扰过于强烈,或者是无线接入点与有线网络间的连接出现了问题。 2)、检查接入点的可连接性 要确定无法连接网络问题的原因,首先需要检测一下网络环境中的电脑是否能正常连接无线接入点。简单的检测方法是在你的有线网络中的一台电脑中打开命令行模式,然后ping无线接入点的IP地址,如果无线接入点响应了这个ping命令,那么证明有线网络中的电脑可以正常连接到无线接入点。如果无线接入点没有响应,有可能是电脑与无线接入点间的无线连接出现问题,或者是无线接入点本身出现了故障。 你可以尝试从无线客户端ping无线接入点的IP地址,如果成功,说明刚才那台电脑的网络连接部分可能出现了问题,比如网线损坏。 如果无线客户端无法ping到无线接入点,那么证明无线接入点本身工作异常。你可以将其重新启动,等待大约五分钟后再通过有线网络中的电脑和无线客户端,利用ping命令察看它的连接性。 如果从这两方面ping无线接入点依然没有响应,那么证明无线接入点已经损坏或者配置错误。此时你可以将这个可能损坏了的无线接入点通过一段可用的网线连接到一个正常工作的网络,你还需要检查它的TCP/IP配置。之后,再次在有线网络客户端ping这个无线接入点,如果依然失败,则表示这个无线接入点已经损坏。这时你就应该更换新的无线接入点了。 3)、配置问题 无线网络设备本身的质量一般还是可以信任的,因此最大的问题根源一般来自设备的配置上,而不是硬件本身,所以如果上面两种问题都不存在的情况下,请检查一下是不是你的配置问题。 4)、测试信号强度 如果你可以通过网线直接ping到无线接入点,而不能通过无线方式ping到它,那么基本可以认定无线接入点的故障只是暂时的。如果经过调试,问题还没有解决,那么你可以检测一下接入点的信号强度。 5)、试试改变频道 如果经过测试,你发现信号强度很弱,但是最近又没有做过搬移改动,那么可以试着改变无线接入点的频道并通过一台无线终端检验信号是否有所加强。由于在所有的无线终端上修改连接频道是一项不小的工程,因此你首先应该在一台无线终端上测试,证明确实有效后才可以大面积实施。 6)、检验WEP密钥 检查WEP加密设置。如果WEP设置错误,那么你也无法从无线终端ping到无线接入点。不同厂商的无线网卡和接入点需要你指定不同的WEP密钥。 7)、DHCP 配置问题 另一个让你无法成功的访问无线网络的原因可能是由DHCP配置错误引起的。网络中的DHCP服务器可以说是你能否正常使用无线网络的一个关键因素。 有两种解决方法: 禁用接入点的DHCP服务,并让无线客户端从网络内标准的DHCP服务器处获取IP地址。 修改DHCP服务的地址范围,使它适用于你现有的网络。 这两种方法都是可行的,不过具体还要看你的无线接入点的固件功能。很多无线接入点都允许你采用其中一种方法,而能够支持这两种方法的无线接入点很少。 8)、多个接入点的问题 设想一下假如有两个无线接入点同时按照默认方式工作。在这种情况下,每个接入点都会为无线客户端分配一个1921680X的IP地址。由此产生的问题是,两个无线接入点并不能区分哪个IP是自己分配的,哪个又是另一个接入点分配的。因此网络中早晚会产生IP地址冲突的问题。要解决这个问题,你应该在每个接入点上设定不同的IP地址分配范围,以防止地址重叠。
故障定位功能的目的是确定设备中故障的位置。为确定故障根源,常常需要将诊断、测试及性能监测获得的数据结合起来进行分析。故障定位的手段主要有诊断、试运行及软件检查。
1.诊断
故障诊断一般利用专门的诊断程序进行。诊断常常是打扰性的,即在诊断进行期间,被诊断的设备不能运行正常的用户业务。
2.试运行
试运行是将一部分网络设备隔离,利用设备正常的输入输出端口和测试器,系统地测试被隔离网络设备的所有服务特性。
3.软件检查
利用软件进行的检查有核查、校验和运行测试、程序跟踪等。
在排除比较复杂网络的故障时,常常要从多种角度来测试和分析故障的现象,准确确定故障点,在实际应用中通常采用的分析模型和方法如下。
(1)7层的网络结构分析模型方法。从网络的7层结构的定义和功能上逐一进行分析和排查,这是传统的且最基础的分析和测试方法。这里有自下而上和自上而下两种思路。自下而上是从物理层的链路开始检测直到应用,白上而下是从应用协议中捕捉数据包,分析数据包统计和流量统计信息,以获得有价值的资料。
(2)网络连接结构的分析方法。从网络的连接构成来看,大致可以分成客户端、网络链路、服务器端3个模块。
客户端具备网络的7层结构,也会出现从硬件到软件、从驱动到应用程序、从设置错误到病毒等的故障问题。所以在分析和测试客户端的过程中要有大量的背景知识,有时PC发烧友的经验也会有所帮助,也可以在实际测试过程中询问客户端的用户,分析他们反映的问题是个性的还是共性的,这将有助于自己对客户端的进一步检测作出决定。
来自网络链路的问题通常需要网管、现场测试仪,甚至需要用协议分析仪来帮助确定问题的性质和原因。对于这方面的问题分析需要有坚实的网络知识和实践经验,有时实践经验会决定排除故障的时间。
在分析服务器端的情况时更需要有网络应用方面的丰富知识,要了解服务器的硬件性能及配置情况、系统性能及配置情况、网络应用及对服务器的影响情况。
工具型分析方法。有强大的各种测试工具和软件,它们的自动分析能快速地给出网络的各种参数甚至是故障的分析结果,这对解决常见网络故障非常有效。
您好,有几种可能性导致一个IP段无法连接到域服务器。以下是其中几种可能原因:
1 网络故障:这可能是最常见的问题之一。网络故障可能是由于网络设备故障、网络中断、路由配置错误或连接问题等原因引起的。在这种情况下,管理员需要检查网络设备,如交换机、路由器和防火墙等,并确保物理连接是正常的。
2 IP地址冲突:如果两个网络段中的某些主机具有相同的IP地址,可能会导致冲突和网络中断。这通常会发生在两个网络段之间存在路由器或其他设备时。为了解决这个问题,管理员需要检查并更改冲突的IP地址。
3 防火墙设置:防火墙可能会阻止某个IP段访问域服务器。这可能是由于安全策略设置不正确或防火墙配置错误导致的。在这种情况下,管理员需要检查防火墙设置,并确保允许该IP段与域服务器进行通信。
4 域名解析问题:如果域名解析器无法解析特定IP段中主机的域名,则可能无法连接到域服务器。这可能是由于DNS服务器配置错误、DNS缓存问题或主机名称解析错误等原因引起的。管理员需要检查DNS服务器和主机名配置,并确保域名解析正常运行。
5 域服务器故障:如果一个IP段无法连接到域服务器,也有可能是域服务器本身出现问题。这可能是由于域服务器硬件故障、服务宕机或软件错误等原因。在这种情况下,管理员需要检查域服务器并采取相应的措施修复或恢复。
综上所述,当一个IP段突然无法连接到域服务器时,原因可能是网络故障、IP地址冲突、防火墙设置、域名解析问题或域服务器故障等。对于管理员来说,重要的是仔细检查和排除这些可能性,并采取适当的措施来解决问题。
0条评论