最近一直在开发移动端的接口,在内部测试的时候发现这么个奇怪现象:
现象:
一部Android手机访问服务器响应没什么问题,当使用两部Android手机同时访问的时候会出现有一部手机访问不了接口的现象。
解决思路:
遇到这种问题首先想到的是使用linux命令查看下TCP连接数量,netstat -n|grep 8888
发现每当两部手机同时打开APP时只有一个TCP连接,那问题应该是在建立TCP连接上,于是带着疑问百度了一下,果然网上有很多这个样的解决方案:
关闭服务器的tcp_tw_recycle,
修改下TCP的参数:echo 0 > /proc/sys/net/ipv4/tcp_tw_recycle,
然后继续测试,问题解决。
总结:这个总结是说明下出现该问题的场景以及解决方法,这个问题大多数出现在nat上网的场景下,原因跟TCP的设计与实现有关系:TCP协议中有个TimeStamp选项,在timewait时间里,如果还有该ip syn包到达服务器,而且timestamp是之前的间,linux会认为是重试的syn包,故而会直接drop掉。