Dubbo负载均衡、容错、高可用_服务器

  • Random LoadBalance(默认) 随机,按权重设置随机概率。 
    在一个截面上碰撞的概率高,但调用量越大分布越均匀,而且按概率使用权重后也比较均匀,有利于动态调整 提供者权重。

  • RoundRobin LoadBalance 轮询,按公约后的权重设置轮询比率。 
    存在慢的提供者累积请求的问题,比如:第二台机器很慢,但没挂,当请求调到第二台时就卡在那,久而久 之,所有请求都卡在调到第二台上。

  • LeastActive LoadBalance 最少活跃调用数,相同活跃数的随机,活跃数指调用前后计数差。 
    使慢的提供者收到更少请求,因为越慢的提供者的调用前后计数差会越大。

  • ConsistentHash LoadBalance 一致性 Hash,相同参数的请求总是发到同一提供者。 
    当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。缺省只对第一个参数 Hash,如果要修改,请配置 缺省用 160 份虚拟节点,如果要修改,请配置

1.2配置

1.2.1xml方式

可以在提供方配置也可以在消费方配置. 有如下几种,任选一种

  • 服务端服务级别

 
  • 服务端方法级别

 
  • 客户端服务级别

 
  • 客户端方法级别

 

1.2.2注解方式

  • 提供者配置

 
  • 消费者配置,通过loadbalance属性

 

2.集群容错

2.1集群中容错类型

在集群调用失败时,Dubbo 提供了多种容错方案,缺省为 failover 重试。

Dubbo负载均衡、容错、高可用_xml_02

2.2Dubbo中容错策略

  • Failover Cluster

    失败自动切换,当出现失败,重试其它服务器. 通常用于读操作,但重试会带来更长延迟。可通 过 retries="2" 来设置重试次数(不含第一次)。可以在提供方配置也可以在消费方配置

 
  • Failfast Cluster 
    快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。

  • Failsafe Cluster 
    失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。

  • Failback Cluster 
    失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。

  • Forking Cluster 
    并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。可通过 forks="2" 来设置最大并行数。

  • Broadcast Cluster 
    广播调用所有提供者,逐个调用,任意一台报错则报错 [2]。通常用于通知所有提供者更新缓存或日志等本地 资源信息。

2.3配置

2.3.1xml方式

  • 服务提供方

 
  • 服务消费方

 

2.3.2注解方式

  • 服务提供方

 
  • 服务消费方

 

3.SpringBoot整合熔断器Hystrix

3.1Hystrix概述

Hystrix是一个用于处理分布式系统的延迟和容错的开源库,Hystrix 能使你的系统在出现依赖服务失效的时 候,通过隔离系统所依赖的服务,防止服务级联失败,同时提供失败回退机制,更优雅地应对失效,并使你的系统 能更快地从异常中恢复 .

“断路器”本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝), 向调用方返回一个符合预期的、可处理的备选响应(FallBack),而不是长时间的等待或者抛出调用方无法处理的 异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃 至雪崩。

Dubbo负载均衡、容错、高可用_权重_03

3.2整合Hystrix进行容错

3.2.1提供方

  • 在pom.xml添加Hystrix起步依赖

 
  • 在启动类上面开启Hystrix(@EnableHystrix )

 
  • 在提供的方法上面添加注解@HystrixCommand

 

3.2.2消费者

  • 在pom.xml添加Hystrix起步依赖

 
  • 在启动类上面开启Hystrix(@EnableHystrix )

 
  • 在调用的方法上面添加注解@HystrixCommand

 

4.Zookeeper集群

4.1.Zookeeper集群简介

4.1.1为什么搭建Zookeeper集群

大部分分布式应用需要一个主控、协调器或者控制器来管理物理分布的子进程。目前,大多数都要开发私有的 协调程序,缺乏一个通用机制,协调程序的反复编写浪费,且难以形成通用、伸缩性好的协调器,zookeeper提供 通用的分布式锁服务,用以协调分布式应用。所以说zookeeper是分布式应用的协作服务。

zookeeper作为注册中心,服务器和客户端都要访问,如果有大量的并发,肯定会有等待。所以可以通过 zookeeper集群解决。

下面是zookeeper集群部署结构图:

Dubbo负载均衡、容错、高可用_zookeeper_04

4.1.2Leader选举

Zookeeper的启动过程中leader选举是非常重要而且最复杂的一个环节。那么什么是leader选举呢?zookeeper为什么需要leader选举呢?zookeeper的leader选举的过程又是什么样子的?

看什么是leader选举。其实这个很好理解,leader选举就像总统选举一样,每人一票,获得多数票的 人就当选为总统了。在zookeeper集群中也是一样,每个节点都会投票,如果某个节点获得超过半数以上的节点的 投票,则该节点就是leader节点了。

4.2搭建Zookeeper集群

4.2.1搭建要求

真实的集群是需要部署在不同的服务器上的,但是在我们测试时同时启动十几个虚拟机内存会吃不消,所以我 们通常会搭建伪集群,也就是把所有的服务都搭建在一台虚拟机上,用端口进行区分。

搭建一个三个节点的Zookeeper集群(伪集群)。

4.2.2准备工作

(1)安装JDK 【步骤略】。

(2)Zookeeper压缩包上传到服务器【也可用docker方式】

(3)将Zookeeper解压,创建data目录 ,将 conf下zoo_sample.cfg 文件改名为 zoo.cfg

(4)建立/usr/local/zookeeper-cluster目录,将解压后的Zookeeper复制到以下三个目录

/usr/local/zookeeper-cluster/zookeeper-1

/usr/local/zookeeper-cluster/zookeeper-2

/usr/local/zookeeper-cluster/zookeeper-3

 

(5) 配置每一个Zookeeper 的dataDir(zoo.cfg) clientPort 分别为2181 2182 2183

  • 修改/usr/local/zookeeper-cluster/zookeeper-1/conf/zoo.cfg

 
  • 修改/usr/local/zookeeper-cluster/zookeeper-2/conf/zoo.cfg

 
  • 修改/usr/local/zookeeper-cluster/zookeeper-3/conf/zoo.cfg

 

4.2.3配置集群

(1)在每个zookeeper的 data 目录下创建一个 myid 文件,内容分别是1、2、3 。这个文件就是记录每个服务器 的ID

 

Dubbo负载均衡、容错、高可用_提供方_05

(2)在每一个zookeeper 的 zoo.cfg配置客户端访问端口(clientPort)和集群服务器IP列表。

  • 集群服务器IP列表如下

 

解释:server.服务器ID=服务器IP地址:服务器之间通信端口:服务器之间投票选举端口

4.2.4启动集群

(1)启动集群就是分别启动每个实例

Dubbo负载均衡、容错、高可用_xml_06

(2)启动后我们查询一下每个实例的运行状态

  • 先查询第一个服务, Mode为follower表示是跟随者(从)

Dubbo负载均衡、容错、高可用_服务器_07

  • 再查询第二个服务Mod 为leader表示是领导者(主)

Dubbo负载均衡、容错、高可用_服务器_08

  • 查询第三个为跟随者(从)

Dubbo负载均衡、容错、高可用_xml_09

4.2.5模拟集群异常

(1)首先我们先测试如果是从服务器挂掉,会怎么样

  • 把3号服务器停掉,观察1号和2号,发现状态并没有变化

Dubbo负载均衡、容错、高可用_zookeeper_10

由此得出结论,3个节点的集群,从服务器挂掉,集群正常

(2)我们再把1号服务器(从服务器)也停掉,查看2号(主服务器)的状态,发现已经停止运行了。

Dubbo负载均衡、容错、高可用_服务器_11

由此得出结论,3个节点的集群,2个从服务器都挂掉,主服务器也无法运行。因为可运行的机器没有超过集群总数 量的半数。

(3)我们再次把1号服务器启动起来,发现2号服务器又开始正常工作了。而且依然是领导者。

Dubbo负载均衡、容错、高可用_xml_12

(4)我们把3号服务器也启动起来,把2号服务器停掉(汗~~干嘛?领导挂了?)停掉后观察1号和3号的状态。

Dubbo负载均衡、容错、高可用_zookeeper_13

发现新的leader产生了~

由此我们得出结论,当集群中的主服务器挂了,集群中的其他服务器会自动进行选举状态,然后产生新得leader

(5)我们再次测试,当我们把2号服务器重新启动起来(汗~~这是诈尸啊!)启动后,会发生什么?2号服务器会再 次成为新的领导吗?我们看结果

Dubbo负载均衡、容错、高可用_权重_14

我们会发现,2号服务器启动后依然是跟随者(从服务器),3号服务器依然是领导者(主服务器),没有撼动3号 服务器的领导地位。

由此我们得出结论,当领导者产生后,再次有新服务器加入集群,不会影响到现任领导者。

4.3.Dubbo连接zookeeper集群

  • 修改服务提供者和服务调用者的spring 配置文件

Dubbo负载均衡、容错、高可用_服务器_15