目录

一、准备三台虚拟机,并安装docker

二、在三台主机分别开启以下端口:

三、在主节点上执行swarm命令

四、在从节点上执行join命令

五、创建共享网络

1、查看集群节点

2、查看网络信息

六、各个节点离开集群


背景:容器节点部署在不同的主机上,实现高可用

Swarm是Docker官方提供的一款集群管理工具,其主要作用是把若干台Docker主机抽象为一个整体,并且通过一个入口统一管理这些Docker主机上的各种Docker资源。

一、准备三台虚拟机,并安装docker

如果不知道怎么安装,可以参考我的这篇文章

Docker镜像、容器和数据管理

另外,如果是新启的虚拟机,不能联通网络的话,可以尝试看看网络配置有没有指定网关。

二、在三台主机分别开启以下端口:

这个不能偷懒,三台都要执行,或者嫌麻烦的话,直接关闭防火墙也行,但是生产环境不建议这样做

firewall-cmd --add-port=2377/tcp --permanent #TCP端口2377用于集群管理通信 
firewall-cmd --add-port=7946/tcp --permanent #TCP和UDP端口7946用于节点之间的通信 
firewall-cmd --add-port=7946/udp --permanent 
firewall-cmd --add-port=4789/udp --permanent #UDP端口4789用于覆盖网络流量 
firewall-cmd --reload                        #重新载入刷新修改
firewall-cmd --zone=public --list-ports      #查看开通的端口

docker 容器跨主机通信 docker跨主机部署服务_tomcat

当然liunx也可以使用命令拼接的方式去执行,看这篇文章

shell 多个命令一起执行的几种方法


三、在主节点上执行swarm命令

选择一台服务器作为主节点,创建swarm集群

docker swarm init

此时会输出如下结果

[root@localhost etc]# docker swarm init
Swarm initialized: current node (vkkl57cihhvxip10dlh9391pd) is now a manager.

To add a worker to this swarm, run the following command:

    docker swarm join \
    --token SWMTKN-1-0k2r5mh4ddq63ambeicd40v2opw0pi8yes0tr3bn77cbgwiu2r-ae1fgnl2q2p2pnn6aonl993me \
    192.168.1.18:2377

To add a manager to this swarm, run 'docker swarm join-token manager' and follow the instructions.

[root@localhost etc]#

四、在从节点上执行join命令

在输出结果中,我们可以拿到以worker身份加入集群的命令,只需要把以下命令分别在加入集群的docker容器的服务器里边执行即可

docker swarm join \
    --token SWMTKN-1-0k2r5mh4ddq63ambeicd40v2opw0pi8yes0tr3bn77cbgwiu2r-ae1fgnl2q2p2pnn6aonl993me \
    192.168.1.18:2377

注意:执行命令时,docker必须是启动状态。

执行完成后会提示,该节点以工作节点的状态加入集群。

[root@localhost ~]# docker swarm join \
>     --token SWMTKN-1-0k2r5mh4ddq63ambeicd40v2opw0pi8yes0tr3bn77cbgwiu2r-ae1fgnl2q2p2pnn6aonl993me \
>     192.168.1.18:2377
This node joined a swarm as a worker.
[root@localhost ~]#

五、创建共享网络

1、查看集群节点

在主节点上输入以下命令

docker node ls

可以看到上边加入节点的两台docker

[root@localhost etc]# docker node ls
ID                           HOSTNAME               STATUS  AVAILABILITY  MANAGER STATUS
7wqt60k83sf3jixjexfcv2dpu    localhost.localdomain  Ready   Active        
cbqjwsb40smyg01qn3914sdap    localhost.localdomain  Ready   Active        
vkkl57cihhvxip10dlh9391pd *  localhost.localdomain  Ready   Active        Leader
[root@localhost etc]#

注意,只能在主节点上查看,在从节点上会出现以下错误

[root@localhost ~]# docker node ls
Error response from daemon: This node is not a swarm manager. Worker nodes can't be used to view or modify cluster state. Please run this command on a manager node or promote the current node to a manager.
[root@localhost ~]#

2、查看网络信息

docker network ls

输出结果

[root@localhost etc]# docker network ls
NETWORK ID          NAME                DRIVER              SCOPE
e4c4cb1988ca        bridge              bridge              local
26ca69744e63        docker_gwbridge     bridge              local
40f1bce14fe3        host                host                local
g37dv3lqrxd7        ingress             overlay             swarm
#swarm集群创建出来的共享网络,不是用来给容器与容器之间通信的,是swarm用来管理集群的
91a440523949        none                null                local
[root@localhost etc]#

因此,如果要实现容器与容器之间通信,我们还需要创建一个共享网络:

在主节点的容器中执行以下命令

docker network create -d overlay --attachable sharednet
  • -d:网络驱动类型 
  • --attachable:声明当前创建的overlay网络可以被容器加入
  • sharednet:自定义的网络名称

测试举例:

每个容器中下载tomcat:7的镜像,并指定共享网络运行

docker run -d --name node1 --net=sharednet tomcat:7 
docker run -d --name node2 --net=sharednet tomcat:7 
docker run -d --name node3 --net=sharednet tomcat:7

进入任何一个容器,看能不能ping通其中任意两台(可以使用docker容器的名字,也可以使用docker内置ip,如-10.0.0.2),如果能够ping通,说明集群搭建成功:

[root@localhost ~]# docker exec -it node2 /bin/bash
root@38248553fe52:/usr/local/tomcat# ping node1
PING node1 (10.0.0.2) 56(84) bytes of data.
64 bytes from node1.sharednet (10.0.0.2): icmp_seq=1 ttl=64 time=0.349 ms
64 bytes from node1.sharednet (10.0.0.2): icmp_seq=2 ttl=64 time=0.374 ms
64 bytes from node1.sharednet (10.0.0.2): icmp_seq=3 ttl=64 time=0.445 ms
^C
--- node1 ping statistics ---
3 packets transmitted, 3 received, 0% packet loss, time 5ms
rtt min/avg/max/mdev = 0.349/0.389/0.445/0.043 ms
root@38248553fe52:/usr/local/tomcat# ping node3
PING node3 (10.0.0.4) 56(84) bytes of data.
64 bytes from node3.sharednet (10.0.0.4): icmp_seq=1 ttl=64 time=0.562 ms
64 bytes from node3.sharednet (10.0.0.4): icmp_seq=2 ttl=64 time=2.02 ms
^C
--- node3 ping statistics ---
2 packets transmitted, 2 received, 0% packet loss, time 6ms
rtt min/avg/max/mdev = 0.562/1.293/2.024/0.731 ms
root@38248553fe52:/usr/local/tomcat#

六、各个节点离开集群

管理节点离开集群前,因该把管理节点降级为工作节点再离开,或者是该集群上还有其他Manager节点

注意:如果只有一个Manager节点,而该Manager节点在还有其他工作节点的情况下离开集群,该集群在没有Manager节点的情况下仍然存活,只有把所有工作节点离群后,原Manager节点所在服务器才能创建新的集群。

# 工作节点离开集群
docker swarm leave

# 管理节点离开集群
docker swarm leave --force #必须使用参数--force,强制离开集群,否则会报错

如果想在一个集群中添加Manager节点,在Manager节点输入以下命令,生成对应的token

docker swarm join-token manager

删除失效节点-docker node rm

[root@localhost ~]# docker node ls
ID                           HOSTNAME               STATUS  AVAILABILITY  MANAGER STATUS
4nzf0ken1fpaapo9mqyzw0yl5    localhost.localdomain  Down    Active        
k0qkclnoeixja2ctak2c13n2j *  localhost.localdomain  Ready   Active        Leader
nb1cf8v8cxnw1h32bos6f6t2x    localhost.localdomain  Ready   Active        
[root@localhost ~]# docker node rm 4nzf0ken1fpaapo9mqyzw0yl5 
4nzf0ken1fpaapo9mqyzw0yl5
[root@localhost ~]# docker node ls
ID                           HOSTNAME               STATUS  AVAILABILITY  MANAGER STATUS
k0qkclnoeixja2ctak2c13n2j *  localhost.localdomain  Ready   Active        Leader
nb1cf8v8cxnw1h32bos6f6t2x    localhost.localdomain  Ready   Active        
[root@localhost ~]#

更多详细内容,请看官方文档

https://docs.docker.com/engine/reference/commandline/swarm_init/