限流的作用


在API对外互联网开放的情况下,是无法控制调用方的行为的。当遇到请求激增或者黑客攻击的情况下,会导致接口占用大量的服务器资源,使得接口响应效率的降低或者超时,更或者导致服务器宕机。


限流是指对应用服务进行限制。例如对某一个接口限制为1秒100次请求,超过这个请求的就放弃


限流可以应对热点业务带来的突发情况、调用方的异常请求、恶意攻击等


为什么要使用分布式限流


我们先看下单节点的限流,如下图所示:

6 分布式限流框架_Cloud

当我们对单个节点进行限流的时候,我们后面所带的资源服务得到了保护。但是我们的应用大多是分布式的应用。如下图所示:

6 分布式限流框架_Cloud_02

服务变为分布式的部署的情况下,我们只对单个节点进行限流的时候,其他节点并未得到限流。后面依赖的资源还是每得到保护。我们再看下分布式限流的图:

6 分布式限流框架_限流_03

基于中间件实现的分布式限流,我们可以方便的控制服务集群的请求限制,这样整个集器依赖的资源也得到了保护。


限流的算法


1.固定窗口计数器


这种算法最简单,就是把时间切割成多个窗口,比如一秒钟一个窗口。每次请求进来计数器+1.如果本窗口内计数器达到限制则进入到下一个时间窗口,并把计数器重置。


固定窗口计数器一般会使实际通过的请求量为限制的2倍。比如说一个场景:如果设置1秒设置限制为5,假如在前一秒的后半秒通过了5,在下一秒的前半秒也通过了5,那么一秒内就通过了10次请求。


2.滑动窗口计数器


我们在固定窗口计数器的基础上对每一个时间窗口再进行时间上的切分,比如我们是按照1分钟100次请求的限制进行限流的,我们再将1分钟切成6份,就是10秒一个时间窗口,在每个细分的时间窗口中记录请求数量,时间从前一分钟的开始到前一分钟的结束为止,到了前一分钟的前10秒,我们的时间窗口从前一分钟的前10秒到下一分钟的前10秒结束。如下图所示:

6 分布式限流框架_滑动窗口_04

这种算法减少了临界值带来的并发超过阈值的问题。Spring Cloud 中的熔断框架 Hystrix,以及 Spring Cloud Alibaba 中的Sentinel 都采用滑动窗口来做数据统计。

该算法时间区间划分的精度越高,算法需要的空间容量就越大。


3.漏桶


我们将每个请求视为一个水滴,然后有个桶装水,并且整个桶以固定的速度往外漏水,当进入请求(水滴)把桶装满,则请求不能再进入。


4.令牌桶算法


令牌桶算法的概念如下: 我们以固定的速率,生成令牌并放入桶中,如果令牌桶满了,生成的令牌将被丢弃。每次一个请求进来,试图从令牌桶中取令牌,取到令牌则请求通过,如果令牌桶空了取不到,则请求将被丢弃。


Google 的开源项目 guava 提供了 RateLimiter 类,实现了单点的令牌桶限流。