Docker Swarm搭建多服务器下Docker集群

对于有多台服务器来讲，如果每一台都去手动操控，那将会是一件非常浪费时间的事情，毕竟时间这东西，于我们而言，十分宝贵，或许在开始搭建环境的时候耗费点时间，感觉是正常的，我也如此，花费大堆时间在采坑和填坑的路上，但是当你踩完后，还通过手动管理的方式去维护，那便是折磨，因此对于多台服务器下的容器编排管理，借助工具将会节省着大把时间，现如今有名的容器编排工具，K8s、Docker Swarm，甚至功能更强大的Rancher，本次我将使用且是我唯一使用过的Docker Swarm工具搭建Docker集群并部署服务。

Docker Swarm官方文档地址：https://docs.docker.com/engine/swarm/

搭建前期工作

在之前的文章中，对于一台新的服务器加入到服务器集群中，通过Docker Machine去管理，配置好Docker Enginee环境，简单也方便，同时在配置时，将本地的私钥发送给了新的服务器，也就配置好了关联关系，如有需要可以查看该文章：https://www.cnblogs.com/CKExp/p/9552272.html

200335421_05a95edd-054d-4928-9fde-fab0aa967e6a 加入进来后对于整个服务器集群来讲，可预见的Swarm方式是这样的，也是最为简便的方式管理，Manager作为容器集群发起者，也是管理者，一般来讲，我会尽可能少的在上面部署服务，通过一些方式过滤掉服务在上面的部署，毕竟它的职责更多的侧重于管理整个容器集群，但是对于一些开支小的且比较稳定的服务，也是可以i直接部署在Manager节点中的，这是一种建议。

这是我当前的服务器下的容器集群，存在一个Leader也就是Manager，也可以设置多个，但是现有场景下，完全满足我的需求了。

200336778_84e9c612-6d71-4af1-9dd3-d69425f08520 我们利用Docker Swarm中的Docker CLI去创建集群、管理集群、动态扩容服务。而对于Swarm的版本，建议是Docker版本要高于1.13，在1.13之上，将Swarm功能集成到了Docker中，而对于1.13之下，需要单独设置Swarm模式，在此建议，使用1.13之上的版本。

在Swarm中有几个名字概念：

Node: 节点，分为Manager Node和Worker Node，在上图中有一个Manager节点和三个Worker节点,这个概念很好理解。
Service: 服务，对于Swarm而言，部署服务是它对外的职责，对于整个集群来讲，都是通过部署服务的形式，并且通过扩容、缩放来动态的决定服务数量。
Task: 服务的具体承载，在于Manager节点将服务分发到具体的Worker节点上，属于下达具体任务概念。相较于Service属于微观概念。

对于Swarm模式下，需要开启几个相关的端口，而在系统中，这几个端口是默认打开的：

TCP Port 2377：用于集群间通信，
TCP 和UDP Port 7946：用于节点间通信，
UDP Port 4789：用于Overlay网络方式下通信，这个是在集群模式下的网络通信方式，单机下采用的是Bridge方式。

搭建Swarm

在需要设置为Manager的节点上输入如下命令，开始容器集群搭建，IP地址写现在服务对外IP。

$ docker swarm init --advertise-addr <MANAGER-IP>

可以获得如下信息，集群创建完毕，复制该命令，在其他子节点上执行完毕，子节点便是加入了该容器集群(可通过docker-machine ssh xxx的方式快速进入到目的节点中执行)。 200337917_46adff24-8690-4fc8-821c-b396fd1946c5 对所有节点加入完毕，通过docker node ls命令查看节点信息，加入的节点和本身节点将会显示出来。

如果有新的服务器加入了，并且已经安装好了docker enginee需要加入到节点中且忘记了这一条token的值，可以通过在manager上执行该命令再次获得这个值

docker swarm join-token worker

200338991_69605fd6-4573-4dc5-9860-2c551936de47 至此，整个容器集群就搭建完毕，Manager节点和Worker节点都接入进来了。

部署服务到集群

进入到Manager节点，开始部署一个服务到容器集群中，通过如下命令创建一个服务：

$ docker service create --replicas 1 --name helloworld alpine ping docker.com

命令解读:

docker service create：用于创建服务；
–replicas 用于确定需要多少个节点容器去运行服务；
对于参数alpine ping docker.com 则是指定alpine镜像，并在容器启动后执行ping docker.com操作；

通过docker service ls查看当前创建的所有服务，可以通过docker service remove 服务名或ID的形式移除服务，这类操作和Docker的操作是差不多的。

200340135_44615122-8db6-44dd-b274-1b60d6b3b7c2 通过docker service inspect –pretty 服务名或ID方式查看服务的详细信息，

200341199_ab69ba05-f3f0-4002-b90d-3bd265ec9fc5 在不带–pretty参数下，可以查看到Json格式的详细信息，

200342236_921a79ed-cf79-46cd-ace0-be975345d4aa

通过命令docker service ps 服务名或ID查看服务运行状态， 200343498_38575b67-f256-4f8b-9a52-1ee0763f57e6

对承载服务的批量容器相关操作

扩容/伸缩现有服务承载容器数量

通过scale命令执行，并再次查看服务运行信息：

docker service scale 服务名或ID=实例数量

200344736_6771ce51-12c0-4ed2-9d4f-8354b2eafb12

滚动更新使用服务使用镜像版本，本次重新搭建一个redis服务,用四个实例承载服务，并通过滚动升级redis版本。

200345934_3554a416-2384-47a0-a054-c6b4980a0d9b 对于–update-delay 为更新前后切换时间，对于后面跟随的时间类型可以有时分秒如10h10m10s，

通过–update -parallelism参数可以指定最大的实例更新数量，如本次中有四个实例，指定为2后将最大允许两个实例更新到新版本中，

更新实例版本规则，当一个实例更新完毕并返回running才继续更新下一个实例，如果有一个实例更新失败，整个更新队列将会中止，可以通过–update-failure-action参数指定更新失败后的解决方式，如docker swarm create或是update服务。

服务创建后实例运行结果结果 200347036_abc3aa32-3bbf-4100-9c73-2384e01eeffa

现在开始更新版本：

docker service update --image redis:3.0.7 redis

200348110_b25811d2-b7e1-4c8d-8d58-27d917620d40 指定新版本镜像及现有服务名称，开始更新，查看当前服务运行情况，四个redis均完成更新。

200349231_2d09d0c2-f98c-47e8-b3f4-053529f2d803 接下来，通过控制worker节点的状态来控制是否承载某一个服务，通过如下命令，将现有节点下的host1不再承载redis服务，命令如下

docker node update --availability drain host1

通过参数–availability指定为drain(置空)来设置host1节点不参与服务承载，如下可以看到原有服务已经移交到manager节点下了。 200350455_f709d2d4-1cf5-4692-a544-4beb4682cd17 然后启用该host1节点恢复为活跃模式,但是该节点不会再去承载redis服务，因为服务现在并不需要它去承载。

docker node update --availability active host1

200351850_294a0c71-cc32-42d5-89e6-7b0bd4a6898c 至此，对于容器集群的搭建就此完成了。

对于容器集群的其他高级用法可以参见官方文档：https://docs.docker.com/engine/swarm/services/#roll-back-to-the-previous-version-of-a-service

2018-10-27，望技术有成后能回来看见自己的脚步。