服务器凌晨三点挂了,作为运维的你应该怎么办

服务器凌晨三点挂了,作为运维的你应该怎么办,第1张

top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。

ping 测试主机是否存活

arp 负责将ip地址解析成mac地址

tracepath 路由跟踪

使用场景,当你的网络出现问题的时候,一般运营商会要你提供一份路由跟踪的表 就是用这个命令来实现

CPU

iftop 查看网卡流量使用 不能查询具体的应用程序使用了多少流量

nethogs 查看进程使用了具体的流量 可以查出程序的PID

用法 nethogs eth0(如果外网流量大就填外网,如果内网流量大就填内网)

通过pid使用 ps axu 和lsof查出进程 以及程序文件里面什么问题造成的

凌晨三点 有台机器的读写非常高 导致业务部正常

找出读写最高的进程出来 (pid)

查看IO占用情况

和netstat的功能一模一样,

但是当你服务器的socket连接数量非常大的时候,使用netstat就是浪费你的生命 ss最大的优势就是他比netstat快很多

服务器的运维程度直接影响数据中心能否稳定进行,一般服务器的运维成本占总成本的百分之七十,因而极简运维对数据中心相当重要。浪潮服务器作为全球领先的品牌产品,一直在关注数据中心所面临的运维难题。浪潮最新发布的M6四路服务器采用浪潮自主研发的ISBMC4(服务器远程管理系统),可提供硬件状态监控、部署、节能、安全等系列管理工具,以标准化接口构建更加完善的服务器管理系统。因而能够打造极简运维。

我也马上要上别公司做运维工作的,学习没什么先后之分,防火墙、路由器、 交换机的运行机制和配置,熟悉各种网络协议,这些是要知道的,然后linux的各种命令也必须知道一些,然后架设服务器,构建局域网也要了解,当然现在为了方便C语言了解是最好的。还有些公司打着服务器运维的幌子其实就是给他管理些什么设备,像打印机,电话机这些了解点也很好

1、基础设施的IT运维服务,对IT基础设施进行检测、日常维护以及维修等保障工作。

2、应用系统的维护,对应用系统进行整体设计、集成、维护以及创新和改进。

3、安全管理,IT运维服务公司对网络的环境、应用系统、系统的终端以及网站的内容进行管理。最常见的工作就是对整个系统的安全评估、保护、监控以及预警等等系统进行服务,这关乎着整个网络环境是不是健康,能不能避免意外出现。

4、网络的接入服务,对网络进行接入服务或者对专门的网站进行服务。

5、信息服务,对信息进行采集、发布、编辑以及汇报等等,对各种各样的内容信息进行了解并且对网站提供支持。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 服务器凌晨三点挂了,作为运维的你应该怎么办

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情