一光年

[运维笔记] nginx大量TIME_WAIT的解决办法

2019.07.23

在使用nginx做的反向代理和负载均衡时,没有默认的系统TCP参数情况下,常常会有大量的TIME_WAIT状态出现,导致后续请求部分得不到相应。

对于这类问题,可以做以下配置。

首先,查看当前的网络链接状态。

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 

TIME_WAIT 8535
CLOSE_WAIT 5
FIN_WAIT2 20
ESTABLISHED 248
LAST_ACK 14

发现TIME_WAIT状态的连接占了8535个之多,连接一直没有得到释放。

关于各种连接的状态说明,如下:

CLOSED:无连接是活动的或正在进行
LISTEN:服务器在等待进入呼叫
SYN_RECV:一个连接请求已经到达,等待确认
SYN_SENT:应用已经开始,打开一个连接
ESTABLISHED:正常数据传输状态
FIN_WAIT1:应用说它已经完成
FIN_WAIT2:另一边已同意释放
ITMED_WAIT:等待所有分组死掉
CLOSING:两边同时尝试关闭
TIME_WAIT:另一边已初始化一个释放
LAST_ACK:等待所有分组死掉

解决办法

修改内核配置 /etc/sysctl.conf,让TIME_WAIT状态连接尽快得到释放和重用。

...
net.ipv4.tcp_syncookies = 1  
net.ipv4.tcp_tw_reuse=1 #让TIME_WAIT状态可以重用,这样即使TIME_WAIT占满了所有端口,也不会拒绝新的请求造成障碍 默认是0  
net.ipv4.tcp_tw_recycle=1 #让TIME_WAIT尽快回收 默认0  
net.ipv4.tcp_fin_timeout=30
...

重新查看网络连接状态,发现连接已经恢复正常

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 

TIME_WAIT 69
CLOSE_WAIT 4
FIN_WAIT2 15
ESTABLISHED 236
LAST_ACK 1