武汉工程大学的网站崩溃,第1张

答案:据报道,武汉工程大学的网站崩溃可能是由于服务器负载过高而导致的。

解释:网站崩溃通常是由于服务器无法承受太多的请求而导致的。随着用户数量的增加,服务器的负载也会逐渐增加。当服务器的负载达到极限时,它将无法处理更多的请求,从而导致网站崩溃。因此,武汉工程大学的网站崩溃可能是由于大量的用户访问网站而导致的服务器负载过高所致。

解决方法:为了解决网站崩溃问题,可以采取以下措施:

1 扩大服务器容量,增加带宽和存储空间,以提高服务器的处理能力。

2 采用负载均衡技术,将请求分配到多个服务器上,在各服务器之间分担负载。

3 优化网站代码,减少不必要的请求和数据传输,从而减轻服务器的负载。

4 定期维护服务器,清理无用数据和文件,提高服务器的运行效率。

拓展说明:网站崩溃是一个常见的问题,特别是在高峰期,如新闻爆发时或重要活动期间,网站可能会受到大量的访问。因此,对于网站管理员来说,保持服务器的稳定性和可靠性非常重要。采取一些有效的措施,如扩大服务器容量、采用负载均衡技术、优化网站代码和定期维护服务器,可以有效地减轻服务器的负载,提高网站的稳定性和可靠性。

下列贴士帮助你更快速更轻松地为 Linux 中的硬件排查故障。许多不同的因素可能导致Linux硬件出现问题;在你开始尝试诊断之前,了解最常见的问题以及最有可能找到原因的环节是明智之举。

Linux服务器在许多不同类型的基础架构中运行关键任务型业务应用程序,包括物理机、虚拟机、私有云、公共云和混合云。对于 Linux系统 管理员来说,了解如何管理Linux硬件基础架构很重要,包括与网络和存储有关的软件定义功能、Linux容器和Linux服务器上的多个工具。

排查并解决Linux上与硬件有关的问题可能需要一些时间。连经验丰富的系统管理员有时也要花几小时来解决莫名其妙的软硬件问题。

下列贴士帮助你更快速更轻松地为Linux中的硬件排查故障。许多不同的因素可能导致Linux硬件出现问题;在你开始尝试诊断之前,了解最常见的问题以及最有可能找到原因的环节是明智之举。

1快速诊断设备、模块和驱动程序

故障排查的第一步通常是显示Linux服务器上安装的硬件列表。你可以使用ls命令获取硬件的详细信息,比如lspci、lsblk、lscpu和lsscsi。比如说,这是lsblk命令的输出结果:

# lsblk

NAME    MAJ:MIN RM SIZE RO TYPE MOUNTPOINT

xvda    202:0    0  50G  0 disk

├─xvda1 202:1    0   1M  0 part

└─xvda2 202:2    0  50G  0 part /

xvdb    202:16   0  20G  0 disk

└─xvdb1 202:17   0  20G  0 part

如果ls命令没有显示任何错误,使用初始化进程(比如systemd)查看Linux服务器的运行状况。systemd是启动用户空间、控制多个系统进程的最流行的初始化进程。比如说,这是systemctl status命令的输出结果:

# systemctl status

● bastionf347internal

    State: running

     Jobs: 0 queued

   Failed: 0 units

    Since: Wed 2018-11-28 01:29:05 UTC; 2 days ago

   CGroup: /

           ├─1 /usr/lib/systemd/systemd --switched-root --system --deserialize 21

           ├─kubepodsslice

           │ ├─kubepods-pod3881728a_f2af_11e8_af77_06af52f87498slice

           │ │ ├─docker-88b27385f4bae77bba834fbd60a61d19026bae13d18eb147783ae27819c34967scope

           │ │ │ └─23860 /opt/bridge/bin/bridge --public-dir=/opt/bridge/static --config=/var/console-config/console-c

           │ │ └─docker-a4433f0d523c7e5bc772ee4db1861e4fa56c4e63a2d48f6bc831458c2ce9fd2dscope

           │ │   └─23639 /usr/bin/pod

2深入研究多个日志

dmesg让你可以搞清楚内核的最新信息中的错误和警示内容。比如说,这是dmesg | more命令的输出结果:

# dmesg | more

[ 1539027419] IPv6: ADDRCONF(NETDEV_UP): eth0: link is not ready

[ 1539042726] IPv6: ADDRCONF(NETDEV_UP): veth61f37018: link is not ready

[ 1539048706] IPv6: ADDRCONF(NETDEV_CHANGE): veth61f37018: link becomes ready

[ 1539055034] IPv6: ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready

[ 1539098550] device veth61f37018 entered promiscuous mode

[ 1541450207] device veth61f37018 left promiscuous mode

[ 1542493266] SELinux: mount invalid  Same superblock, different security settings for (dev mqueue, type mqueue)

[ 9965292788] SELinux: mount invalid  Same superblock, different security settings for (dev mqueue, type mqueue)

[ 9965449401] IPv6: ADDRCONF(NETDEV_UP): eth0: link is not ready

[ 9965462738] IPv6: ADDRCONF(NETDEV_UP): vetheacc333c: link is not ready

[ 9965468942] IPv6: ADDRCONF(NETDEV_CHANGE): vetheacc333c: link becomes ready

你还可以查看/var/log/messages文件中的所有Linux系统日志,在这里找到与特定问题有关的错误。如果你对硬件进行改动,比如挂载额外磁盘或添加以太网网卡,有必要通过tail命令实时密切关注信息。比如说,这是tail -f /var/log/messages命令的输出结果:

# tail -f /var/log/messages

Dec  1 13:20:33 bastion dnsmasq[30201]: using nameserver 127001#53 for domain in-addrarpa

Dec  1 13:20:33 bastion dnsmasq[30201]: using nameserver 127001#53 for domain clusterlocal

Dec  1 13:21:03 bastion dnsmasq[30201]: setting upstream servers from DBus

Dec  1 13:21:03 bastion dnsmasq[30201]: using nameserver 19219902#53

Dec  1 13:21:03 bastion dnsmasq[30201]: using nameserver 127001#53 for domain in-addrarpa

Dec  1 13:21:03 bastion dnsmasq[30201]: using nameserver 127001#53 for domain clusterlocal

Dec  1 13:21:33 bastion dnsmasq[30201]: setting upstream servers from DBus

Dec  1 13:21:33 bastion dnsmasq[30201]: using nameserver 19219902#53

Dec  1 13:21:33 bastion dnsmasq[30201]: using nameserver 127001#53 for domain in-addrarpa

Dec  1 13:21:33 bastion dnsmasq[30201]: using nameserver 127001#53 for domain clusterlocal

3分析网络功能

你可能在复杂的网络环境中有成千上万个云原生应用程序为业务服务提供服务;这些可能包括虚拟化、多云和混合云。这意味着你应该分析网络连接是否正常运行,这是故障排查的一部分。分析Linux服务器中网络功能的实用命令包括ip addr、traceroute、nslookup、dig和ping等。比如说,这是ip addr show命令的输出结果:

# ip addr show

1:

lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000

    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00

    inet 127001/8 scope host lo

       valid_lft forever preferred_lft forever

    inet6 ::1/128 scope host

       valid_lft forever preferred_lft forever

2:

eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 9001 qdisc mq state UP group default qlen 1000

    link/ether 06:af:52:f8:74:98 brd ff:ff:ff:ff:ff:ff

    inet 1921990169/24 brd 1921990255 scope global noprefixroute dynamic eth0

       valid_lft 3096sec preferred_lft 3096sec

    inet6 fe80::4af:52ff:fef8:7498/64 scope link

       valid_lft forever preferred_lft forever

3:

docker0: <NO-CARRIER,BROADCAST,MULTICAST,UP> mtu 1500 qdisc noqueue state DOWN group default

    link/ether 02:42:67:fb:1a:a2 brd ff:ff:ff:ff:ff:ff

    inet 1721701/16 scope global docker0

       valid_lft forever preferred_lft forever

    inet6 fe80::42:67ff:fefb:1aa2/64 scope link

       valid_lft forever preferred_lft forever

结束语

Linux硬件故障排查需要具备相当扎实的知识,包括如何使用功能强大的命令行工具、解读系统日志。你还应该知道如何诊断内核空间,可以在内核空间找到许多硬件问题的根本原因。请记住,Linux中的硬件问题可能由许多不同的方面引起,包括设备、模块、驱动程序、BIOS、网络,甚至是旧硬件故障。

服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。

有一台HP LH6000R服务器,配置为双PIII XEON 700带2M高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module (VRM) over/under-voltage 288V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它LH6000R上的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。

FIRMWARE升级方法是,在服务器的NAVIGATOR(导航光盘)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序为FLASHEXE,然后将从网上下载的LH6KCBIN(CPU管理板的FIRMWARE)拷贝到一张DOS启动盘上,用这张盘启动服务器。然后在DOS下运行”FLASH /CMC A:LH6KCBIN”,刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。

任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,而应该经常更新服务器的FIRMWARE及BIOS,只是在升级之前应该小心谨慎,错误的升级方法会导致严重的后果。

目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。

当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是否还是异常。由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以WINDOWS NT4为例,就首先在管理工具服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有问题的话,就以安全模式进入系统,看是否正常。但是需要注意的是,在安全模式中,系统速度变慢是正常的(特别是磁盘I/O方面)。

服务器的管理人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。

相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。

曾经有一位朋友告诉我说,他有一台浪潮的服务器无法安装SQL SERVER 2000,已经重装N次NT了,排除是系统故障。而这唯一的服务器又将作为非常重要数据库服务器,因此非常着急。于是我陪着朋友去了他的公司查看。

这台服务器所在的机房是非常标准、完善的机房,我检查了这台服务器的情况,发现并没有硬件上的故障,于是排除了光驱读盘力差的可能。但是,朋友刻的SQL SERVER 2000光盘引起了我的怀疑,我让他拿出了正版的SQL SERVER安装,结果还是不行。

在安装的过程中,没有出现丝毫错误,可就是在运行的时候会自动退出,没有任何提示。但是,我在管理工具中的事件查看器的系统日志中却发现了一条信息:windataexe导致一个无效的数据溢出。Windata是朋友自己编写的一个程序,而且是随操作系统启动而启动的程序。我立即结束掉这个进程后,再运行SQL一切正常。

对于此类软件故障,操作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。

还有一种软件故障是人为因素造成的,它一般是人为误操作(包括没按操作流程的操作)、意外关机(包括电源突然不供电)或非正常关闭应用程序造成的。

人为误操作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。

正常关闭系统程序非常重要,尤其是WEB服务器。我的一个朋友就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。我的朋友是使用的HP web hosting server appliance,因此我向他提供了一些使用规则。

这些方法对于服务器的维护非常有效,主要包括了正确的关闭系统程序、怎样避免数据丢失以及非正常关闭系统后的恢复方法。下面以我朋友的HP web hosting server appliance为例(使用的是UNIX,但思路对于其它操作系统均有效)。

正确关机的过程包括通过按动Power键来使系统断电,你应该一直按住电源开关持续几秒钟才能使系统进入正常的关闭过程中。

另外,为了避免数据丢失,你应该按照如下的步骤操作:

· 经常备份Web Hosting Server Appliance的数据,可以通过网络管理界面来完成。

· 安装第二块硬盘并与原来的硬盘设置成镜像,

一旦Server Apliance未能正确关闭,并无法重起,请按如下操作恢复:

1 当appliance已经断电时,连接一条非modem的串口线(可在机盒中找到)到背面的控制口上。

2 连接串口线的另一头到一台运行Windows的PC的串口上。

3 运行超级链接程序(HyperTerminal),并设置端口的参数为19200, n-8-1, Flow control - None 你可以看到appliance的控制提示,并要求你输入管理员口令。

4 重起appliance,等到提示“LILO boot:”,按住Tab键5秒钟,直到提示变为“boot:”。

5 敲入"emergency"并回车。此时需要耐心等待几分钟。然后,登录提示又将出现,此时,LCD屏又能正常工作了。

6 在LCD屏上选择一个随机的密码(此密码只是用于紧急恢复时用)

翻至Defaults… 并按右箭头键选中。

翻至Root Password…并按右箭头键选中。

翻至Random 并按右箭头键选中,会提示一个随机产生的密码。

记下此密码。

翻至Yes并按右箭头键选中,系统密码会立刻更改。

7 回到超级链接的控制屏,登录appliance,用"root"用户名和刚才的密码,此时会出现“#”提示。

8 为修复分区,请按如下方法操作:

对于sa1100,按顺序输入:

[…]#: fsck /dev/hda5

[…]#: fsck /dev/hda6

[…]#: fsck /dev/hda7

对于sa1120,按顺序输入:

[…]#: fsck /dev/sda5

[…]#: fsck /dev/sda6

[…]#: fsck /dev/sda7

当所有的分区都被修复后,应回到“#”提示符下。

9 输入“reboot”重新启动系统。

如果系统仍无法启动,请记录下控制屏显示的内容并求助技术支持。

对于服务器的软件故障,只要平时管理员注意维护,应该是可以避免的。

答案来自百度

服务器硬件故障诊断与排除的十大方法

一、主板

l CMOS清除

l 除了可清除口令外,如果机器使用一段时间后,BIOS自检出现不正常的提示,可以先做CMOS清除试一下。有时系统出现一些提示,CMOS清除会起到意想不到的作用。

l 服务器开机无显,可能与主板有关,需要有经验的工程师作判断。

l 板卡、线缆与主板接触不好,会导致机器不启动。

l 在开机无显时,可以移去内存,开机如果有内存报警的声音(可以查服务器手册判断内存报警提示),一般可以判断主板BIOS可以引导。

二、 硬盘故障诊断

l 检查硬盘的电源电缆插接是否正确,牢固,松动导致检测不到硬盘。

l 如果有多个硬盘,但找不全,排除接触问题,检查硬盘的ID号设置是否相同。

l 感觉硬盘有问题,可以做硬盘的校验,不会破坏数据,如果提示出错或校验时非常不流畅,硬盘一般有问题,具体如何操作参见服务器手册。

l 感觉硬盘有问题,也可以做硬盘的低级格式化,注意会破坏硬盘数据。如果提示出错,硬盘有故障。

l 硬盘原来工作正常,现在发出异常声音,硬盘检测不到或工作不稳定,基本可以断定硬盘有故障。

三、 内存常见问题

l 系统安装不成功或在系统安装过程正常的情况下,安装应用软件困难,无缘无故死机或重起,请检测内存好坏。

l BIOS自检出现奇偶校验错,清除CMOS后,依然如故,内存问题可能性较大。

l 系统持续运行挂起,检测系统资源使用情况,利用率高居不下,内存需要扩充或优化系统(操作系统、应用系统)

4开机无显

四、 网卡常见问题

l 接网线后,网卡指示灯不亮,首先检查网线等网络设备是否有问题,换线,换接口,排除此类问题,可以判断网卡有故障。

l 网卡驱动安装完后,网络不通

l 网卡驱动程序错误

l 网络设置错误,具体细节见网络方面知识。

l 在100M/1000M速率下不能正常工作

l Switch、hub端口和网卡端口设置模式为AUTO

l 网卡与SCSI控制器公用中断

五、 服务器加电不启动

l 请检查电源的转换开关是否符合用户所在国家的用电标准(一般应拨在220V档位上)。

l 请检查插座接触是否良好

l 请检查内存和CPU等是否安装正确,接触良好。

l 请检查所有电缆连接得是否正确。

六、 系统自检时出现错误提示

l 系统在启动过程中进行自检,如果出现错误,系统将给出提示。根据错误提示,分析错误原因,以尽量缩小嫌疑范围。这时请你

l 检查BIOS设置是否正确。

l 所有电缆是否连接正常,外设的连接和固定是否正常。

l 分析出现错误的硬件,有针对性地排除嫌疑硬件的故障

七、 显示器无显示

l 当显示器没有显示,但是服务器启动,键盘,驱动器和其它外设自检正常。

l 确定显卡是否有问题;

l 检查显示器的信号线和电源线插接是否正确,牢固;

l 调节显示器的对比度和亮度显示是否正常;

l 切断服务器电源和显示器的电源,检查显示器的信号线电缆的接头针是否弯曲

八、 键盘和鼠标不工作

l 检查鼠标和键盘电缆的接头是否插接正确,并注意接头针是否弯曲。

l 检查鼠标在操作系统的控制面板中的设置是否正常。

l 清洁鼠标的滚动球和驱动轮

l 更换鼠标或键盘测试

九、 光驱不工作

l 检查是否有光盘在光驱里面。

l 用优质光盘测试

l 检查光驱的电源电缆接插是否正确,牢固。

l 检查光驱在系统设置中是否被正确设置。

十、 服务器系统常见故障分析

案例一:服务器开机无显示

显示器电源;主机电源;主机是否可加电;主机内部件接触问题;主板自检;定位部件

案例二:服务器系统安装不成功

确认操作系统兼容性列表;确认安装方法;检查安装介质;

记录安装方法和错误信息向厂家或技术人员咨询

案例三:服务器系统频繁出错

回忆服务器以前工作情况;察看系统日志中的报错记录;察看任务管理器的异常进程

软件问题排除;硬件问题逐步定位。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 武汉工程大学的网站崩溃

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情