如何监测Linux进程的实时IO读写情况
iotop怎么用
1
本经验咗嚛以centos为例演示,首先先安装一下iotop程序。
可以通过yum install intop 安装
如果服务器不能上网,请参考下面经验解决
Linux不能上网ping:unknown host问题怎么解决
http://jingyanbaiducom/article/4d58d54137d2a19dd5e9c050html
2
服务器能上网,通过yum之后找到 iotop相关的程序,选择Y 进行确认安装
3
安装好之后,我们可以通过rpm -qa |grep iotop 确认是否已经安装好, 直接通过io tab补全查看有这个命令
4
怎么检测centos进程负载
直接输入iotop 查看当前系统进程的磁盘读写情况,注意这个是一个动态的显示结果。
5
当然也可以通过输入 iotop -o 直接查看输出比较高的磁盘读写程序。
注意观察发现异常的进程,记录下程序的路径(最后面就是脚本或文件的执行路径)
6
至于iotop的使用方法还有很多命令,具体可以通过 iotop -- help来获取。 一般用 - o这个参数就行
END
其他相关检测诊断
除了上述的磁盘读写的资源情况来看,还需要结合cpu,内存占用资源查看异常进程。
可以通过top 来检测(如果显示都是红色的话,那就要注意了。硬件的资源占用负载比较高要考虑扩容内存了)
对于异常进程的查看,一般都是要确认有没有系统中毒或者恶意数据外发。可以通过netstat来查看服务器网络连接情况。
Netstat -ntlp 根据网络连接情况,最后面一栏是显示的路径\进程的位置。对于发现异常进程处理很有帮助
步骤阅读
3
对于centos系统的安全性查看和检查,以上咗嚛介绍的只是很小的一部分。对于管理员平时的维护,管理员密码要定期修改采用强密码,同时对于不必要的端口不要对外开放,注意平时管理linux服务器最好不要直接用root权限来操作。
这些元素中的每一个都是要不断的跟上他们用户数字化需求。服务器和网络业通过增加能量,并合理的利用那些能量来跟上需求。但是存储却正在成为企业的瓶颈。现在存储的瓶颈已经不再是一个IT问题,而是作为一个整体给把企业组织推向了一个危险的境地。那么什么是引起存储IO瓶颈的原因呢在不断满足日益增长的数字需求的两个因素中,计算能力通过增加性能和核心密度,以及通过服务器虚拟化和扩容集群或网格架构增加智能性。网络也简单的通过增加带宽容量,通过QoS增加容量的智能使用,增加广域网连接使用的有限性和高效性。 与此同时,存储性能并没有跟上。存储性能至少十年都是保留在相同的架构中。一个高性能的SAN或NAS双控制器会带来磁盘数目的增加。虽然增加硬盘驱动器可以提高性能,但对于硬盘驱动器的数目却是有限制的,磁盘数量受到双磁盘控制器的限制,控制器最大支持内部流量总数存在限制。控制器(SAN)或NAS在提高存储性能方面是主要的瓶颈限制。 存储I/O vs多终端(multi-tenant)工作量 为了解决这个问题,现在改变了工作量。工作负荷现在是多终端的,采用多重共享服务器和网络接入存储,当然这种模式已经是过时的。多终端工作量之前,一个单独的服务器中的一个单独应用只能创建一个有限数量的要求。多终端工作量的一种运行方式是在一个单独的物理服务器上的多重虚拟机上运行,另一种方式是跨集群或网格的多个物理服务器,运行在一个单独的可扩展的应用中。这两种运行方式都可以产生成百的存储I/O要求。 影响是这些要求渗入存储控制器,总部(head),和应用,服务器不得不等它赶上,这样就轮流延误了处理,最终使公司成本增加。 多终端工作量是在任何时间点有多重物主或用户。这些多终端工作量的呈现在数量和容量上都在增长。他们不再是企业中的惟一的限制,事实上,在现在的企业中,都是非常普遍的。很多企业现在已经有这些工作量的多重资源。 现在,任何实施服务器虚拟化的公司都有多终端工作量,一个单独的物理服务器内可以有20-30个虚拟服务器。NAS存储系统已经成为更受人欢迎的一个方法。主要应用在传输存储服务到虚拟主机,并且访问虚拟机更随意。在虚拟环境中,随着越来越多的虚拟机开始消耗所有可用的存储I/O资源,主机上所有其他虚拟机的性能也受到影响,在虚拟化项目中,产生了低性能影响,降低信心等一系列连锁反映,这时存储性能缩放已经变得非常重要。 除了普通的虚拟服务器使用,更传统的多终端工作量也有所上升,人们也正在研究多处理服务器。除了在芯片设计或处理SEG-Y数据外,也有许多其他的,如生物信息学中的DNA顺序,制造业中的发动机和推进力测试,政府部门的图像监督,媒体中的高分辨率影像,以及Web 20项目。 存储I/O性能在这些环境中是非常关键的,因为一旦进程或仿真作业完成时,工作基本上就停止了。当这些工作停止时,公司就会创造收益。解决推迟工作时间运行来减少用户所受影响变得非常重要,但即使尽可能的做最好的计划,用户的生产量多少也会受到影响。当生产量受影响时也就影响了公司的收益。 近年来,另一个需要解决的问题是所有的这些数据套件的复杂性增长了,变得更粒状化,转向三维空间,较大的增加了颜色深度。这些粒状不仅增加了需要存储数据的物理大小,而且进程和存储I/O也要求创建,修改,分析或测试数据。 所有可靠的,可预测的情况,可缩放的存储I/O性能是很关键的。 存储I/O瓶颈 解决所有性能瓶颈是很有必要的,计算,网络和存储等环境中的大多数挑战是处理存储瓶颈。计算的瓶颈可以通过技术像集群和网格计算来分配更高更快质量的处理器。网络可以通过线槽等增加带宽。这些技术都适当的处理了计算和网络的瓶颈。 存储架构缺乏的是一个类似向外扩展的模型,因为现在双控制器系统迅速的应用,特别是很多基于NAS的系统。因为这些系统是共享的,NAS对于多终端工作量应该是一个理想的存储平台。不幸的是,因为这些数据的高随机数据接入形式和很高的存储I/O请求,在虚拟服务器中,或者是一个有多重请求的单独的服务器或者是多个物理服务器中应用做了很多请求,都会使集群,NAS以及端口成为一个严重的瓶颈。结果是很多公司转向一个共享的SAN,作为一个单独的NAS文件系统也不是很容易管理,它也会导致性能的瓶颈。它不仅减慢了业务,而且限制了员工生产量,最后造成了公司的损失,使本来已经复杂的环境变得更加复杂。 解决存储I/O问题 随着企业中这些工作量变得越来越普遍,理想的解决方案是解决NAS瓶颈,建立一个易管理、高性能的NAS架构。 一个潜在的解决办法是集群计算存储I / O平台采用同样的方法。建立一个向外扩展的NAS解决方案,并行提高存储I / O性能和存储I / O带宽。随着它要求的工作量,允许环境缩放的。此外在NAS解决方案内允许内存连续使用,创造一个非常大的,但高效的高速缓存。最后,保持固有的NAS环境的简单,而不是更复杂的共享SAN解决方案。(责任编辑:romp)[我来说两句]
cpu/带宽使用正常,磁盘IO占用过高,建议你检查服务器当时时间点是否有读写进程任务导致(Windows服务器任务管理器—性能—资源监控器—磁盘查看磁盘活动进程和磁盘读写,Linux服务器可以通过top,iostat等命令查看),你也可以检查数据库日志检查你的数据库是否存在慢查询、死锁、全表扫描导致,或者你可以通过使用云监控监控进程的磁盘IO读写。如果遇到问题你可以通过阿里云的售后支持-提交工单咨询。
0条评论