记录一次阿里云服务器故障排查思路
公司网络是nat 环境
问题:
同一个服务有两台服务器 172.19.19.252 172.19.19.187
两台服务器 要连node5 发现172.19.19.252 这台服务器连不通
思路:
1.两台服务器是同一个安全组 环境相同 所以排除安全组 防火墙的问题
2. ping node5 发现可以ping通 telnet 不通
tcpdump 抓包
尝试抓包,主机能收到,但是没有给出响应
经过查找资料找到解决办法:
修改内核参数
在node5 机器上添加参数
vi /etc/sysctl.conf
加入如下内容
net.ipv4.tcp_tw_recycle=0
net.ipv4.tcp_timestamps=0
然后执行systctl -p telnet正常。 接口正常
网上看了下也有遇到这个问题的。
NAT网络下 tcp_tw_recycle 建议关闭
在这里记录下,内核相关的参数在不熟悉的情况下慎重修改。
网站题目:NAT网络下tcp_tw_recycle参数引起的故障
新闻来源:
http://cdxtjz.cn/article/jschcs.html