记一次解决阿里云服务器偶尔连接不上的问题(由tcp_tw_recycle参数引发的)

记一次解决阿里云服务器偶尔连接不上的问题(由tcp_tw_recycle参数引发的),第1张

阿里服务器偶尔连接不上的问题出现在我做了一些TCP优化之后,出现了公司内网偶尔会出现连接不上服务器的问题,但是切换其他的网络就可以正常连接。

1,登陆服务器查看资源使用top,vmstat等命令查看了一番发现服务器各项指标都没有异常。于是将问题转向了网络层。

2,本地使用ping服务器外网ip正常返回,无丢包,延迟也正常。

3,登录服务器查看tcp相关数据。

发现在卡顿时有大量tcp syn包被丢弃,数值一直在增长。

在查阅资料并结合实际情况后,发现该服务器同时启用了 tcp_timestamps和tcp_tw_recycle参数。

后想起,之前同事为改善time_wait连接数过多问题曾改过该内核参数。

解决办法是,关闭tcp_tw_recycle:

再观察,发现服务已正常,偶尔连接不上的现象消失。

我们先来man一下这两个参数(man tcp):

cp_timestamp 是 RFC1323 定义的优化选项,主要用于 TCP 连接中 RTT(Round Trip Time) 的计算,开启 tcp_timestamp 有利于系统计算更加准确的 RTT,也就有利于 TCP 性能的提升。(默认开启)

关于tcp_timestamps详情请见: https://toolsietforg/pdf/rfc7323pdf

开启tcp_tw_recycle会启用tcp time_wait的快速回收,这个参数不建议在NAT环境中启用,它会引起相关问题。

tcp_tw_recycle是依赖tcp_timestamps参数的,在一般网络环境中,可能不会有问题,但是在NAT环境中,问题就来了。比如我遇到的这个情况,办公室的外网地址只有一个,所有人访问后台都会通过路由器做SNAT将内网地址映射为公网IP,由于服务端和客户端都启用了tcp_timestamps,因此TCP头部中增加时间戳信息,而在服务器看来,同一客户端的时间戳必然是线性增长的,但是,由于我的客户端网络环境是NAT,因此每台主机的时间戳都是有差异的,在启用tcp_tw_recycle后,一旦有客户端断开连接,服务器可能就会丢弃那些时间戳较小的客户端的SYN包,这也就导致了网站访问极不稳定。

主机A SIP:P1 (时间戳T0) ---> Server 主机A断开后

主机B SIP:P1 (时间戳T2) T2 < T0 ---> Server 丢弃

经过此次故障,告诫我们在处理线上问题时,不能盲目修改参数,一定要经过测试,确认无误后,再应用于生产环境。同时,也要加深对相关内核参数的认识和理解。

本文解决灵感来自于 https://blog51ctocom/hld1992/2285410

https://blogcsdnnet/chengm8/article/details/51668992

连不上,大多原因是网络问题。

首先,判断是不是机房网络问题,可以尝试访问其他网站,排除本地线路故障。

其次,针对云服务器IP做路由测试,追踪是不是线路路由中间节点问题,进一步确认是否机房线路问题。

最后,大致可以锁定是机房线路问题,需要联系对方技术人员协助解决。

当然,连不上还有2种情况,一种是系统设置问题,由于系统某个软件设置导致或设置了远程端口号都有可能连不上。另一种是本地问题,如果本地做有策略无法使用远程。

希望中电华联的回答能够帮助到你。

阿里云我真是服了!

登录阿里云现在特恶心!

一、用户名密码

如果用用户名和密码登录,登录后会提示让你打开阿里云APP(没有?那就下载),然后找到安全验证页面,打开安全验证(设置好安全验证),在网页上,你点击发送验证,手机验证后,网页才能登录

二、APP扫二维码登录

你需要先下载阿里云APP(必须是阿里云!支付宝、淘宝?都不行!)然后扫二维码——你以为已经完了?没有!然后让你点击发送验证(这时你得先设置安全验证,然后电脑点击安全验证),验证通过后才能登录

说来说去,必须要下载阿里云APP!!!其实这是我最不能忍的!因为我手机已经很卡了!!又要下载这么个“鸡肋”式的软件,我真是服了Ali(阿里)了!!

其实这么麻烦,我真的不想再用了

唉——

进阿里云控制中心,在那可以重启服务器 远程桌面连不上去,有2种可能,1种是可能服务器卡死了 没反应,另一种可能是阿里云服务器封了你自己电脑的IP,所以可以考虑重启一下路由器或是猫,换个IP,上次我的就是这样被封IP,一直连不上 打阿里服务电话,让他们协助解决问题 在阿里去控制中心,有一个提交工单的地方,让他们协助重启服务器,或是协助解决问题

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 记一次解决阿里云服务器偶尔连接不上的问题(由tcp_tw_recycle参数引发的)

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情