Docker Swarm搭建多服务器下Docker集群

目录

对于有多台服务器来讲,如果每一台都去手动操控,那将会是一件非常浪费时间的事情,毕竟时间这东西,于我们而言,十分宝贵,或许在开始搭建环境的时候耗费点时间,感觉是正常的,我也如此,花费大堆时间在采坑和填坑的路上,但是当你踩完后,还通过手动管理的方式去维护,那便是折磨,因此对于多台服务器下的容器编排管理,借助工具将会节省着大把时间,现如今有名的容器编排工具,K8s、Docker Swarm,甚至功能更强大的Rancher,本次我将使用且是我唯一使用过的Docker Swarm工具搭建Docker集群并部署服务。

Docker Swarm官方文档地址:https://docs.docker.com/engine/swarm/

 

搭建前期工作

在之前的文章中,对于一台新的服务器加入到服务器集群中,通过Docker Machine去管理,配置好Docker Enginee环境,简单也方便,同时在配置时,将本地的私钥发送给了新的服务器,也就配置好了关联关系,如有需要可以查看该文章:https://www.cnblogs.com/CKExp/p/9552272.html

200335421_05a95edd-054d-4928-9fde-fab0aa967e6a 加入进来后对于整个服务器集群来讲,可预见的Swarm方式是这样的,也是最为简便的方式管理,Manager作为容器集群发起者,也是管理者,一般来讲,我会尽可能少的在上面部署服务,通过一些方式过滤掉服务在上面的部署,毕竟它的职责更多的侧重于管理整个容器集群,但是对于一些开支小的且比较稳定的服务,也是可以i直接部署在Manager节点中的,这是一种建议。

这是我当前的服务器下的容器集群,存在一个Leader也就是Manager,也可以设置多个,但是现有场景下,完全满足我的需求了。

200336778_84e9c612-6d71-4af1-9dd3-d69425f08520 我们利用Docker Swarm中的Docker CLI去创建集群、管理集群、动态扩容服务。而对于Swarm的版本,建议是Docker版本要高于1.13,在1.13之上,将Swarm功能集成到了Docker中,而对于1.13之下,需要单独设置Swarm模式,在此建议,使用1.13之上的版本。

在Swarm中有几个名字概念:

  • Node: 节点,分为Manager Node和Worker Node,在上图中有一个Manager节点和三个Worker节点,这个概念很好理解。

  • Service: 服务,对于Swarm而言,部署服务是它对外的职责,对于整个集群来讲,都是通过部署服务的形式,并且通过扩容、缩放来动态的决定服务数量。

  • Task: 服务的具体承载,在于Manager节点将服务分发到具体的Worker节点上,属于下达具体任务概念。相较于Service属于微观概念。

 

对于Swarm模式下,需要开启几个相关的端口,而在系统中,这几个端口是默认打开的:

  • TCP Port 2377:用于集群间通信,

  • TCP 和UDP Port 7946:用于节点间通信,

  • UDP Port 4789:用于Overlay网络方式下通信,这个是在集群模式下的网络通信方式,单机下采用的是Bridge方式。

 

搭建Swarm

在需要设置为Manager的节点上输入如下命令,开始容器集群搭建,IP地址写现在服务对外IP。

$ docker swarm init --advertise-addr <MANAGER-IP>

可以获得如下信息,集群创建完毕,复制该命令,在其他子节点上执行完毕,子节点便是加入了该容器集群(可通过docker-machine ssh xxx的方式快速进入到目的节点中执行)。 200337917_46adff24-8690-4fc8-821c-b396fd1946c5 对所有节点加入完毕,通过docker node ls命令查看节点信息,加入的节点和本身节点将会显示出来。

如果有新的服务器加入了,并且已经安装好了docker  enginee需要加入到节点中且忘记了这一条token的值,可以通过在manager上执行该命令再次获得这个值

docker swarm join-token worker

200338991_69605fd6-4573-4dc5-9860-2c551936de47 至此,整个容器集群就搭建完毕,Manager节点和Worker节点都接入进来了。

 

部署服务到集群

进入到Manager节点,开始部署一个服务到容器集群中,通过如下命令创建一个服务:

$ docker service create --replicas 1 --name helloworld alpine ping docker.com

命令解读:

  1. docker service create:用于创建服务;

  2. –replicas 用于确定需要多少个节点容器去运行服务;

  3. 对于参数alpine ping docker.com 则是指定alpine镜像,并在容器启动后执行ping docker.com操作;

通过docker service ls查看当前创建的所有服务,可以通过docker service remove 服务名或ID的形式移除服务,这类操作和Docker的操作是差不多的。

200340135_44615122-8db6-44dd-b274-1b60d6b3b7c2 通过docker service inspect –pretty 服务名或ID方式查看服务的详细信息,

200341199_ab69ba05-f3f0-4002-b90d-3bd265ec9fc5 在不带–pretty参数下,可以查看到Json格式的详细信息,

200342236_921a79ed-cf79-46cd-ace0-be975345d4aa

通过命令docker service ps 服务名或ID查看服务运行状态, 200343498_38575b67-f256-4f8b-9a52-1ee0763f57e6

 

对承载服务的批量容器相关操作

  1. 扩容/伸缩现有服务承载容器数量

通过scale命令执行,并再次查看服务运行信息:

docker service scale 服务名或ID=实例数量

200344736_6771ce51-12c0-4ed2-9d4f-8354b2eafb12

  1. 滚动更新使用服务使用镜像版本,本次重新搭建一个redis服务,用四个实例承载服务,并通过滚动升级redis版本。

200345934_3554a416-2384-47a0-a054-c6b4980a0d9b 对于–update-delay 为更新前后切换时间,对于后面跟随的时间类型可以有时分秒如10h10m10s,

通过–update -parallelism参数可以指定最大的实例更新数量,如本次中有四个实例,指定为2后将最大允许两个实例更新到新版本中,

更新实例版本规则,当一个实例更新完毕并返回running才继续更新下一个实例,如果有一个实例更新失败,整个更新队列将会中止,可以通过–update-failure-action参数指定更新失败后的解决方式,如docker swarm create或是update服务。

服务创建后实例运行结果结果 200347036_abc3aa32-3bbf-4100-9c73-2384e01eeffa

现在开始更新版本:

docker service update --image redis:3.0.7 redis

200348110_b25811d2-b7e1-4c8d-8d58-27d917620d40 指定新版本镜像及现有服务名称,开始更新,查看当前服务运行情况,四个redis均完成更新。

200349231_2d09d0c2-f98c-47e8-b3f4-053529f2d803 接下来,通过控制worker节点的状态来控制是否承载某一个服务,通过如下命令,将现有节点下的host1不再承载redis服务,命令如下

docker node update --availability drain host1

通过参数–availability指定为drain(置空)来设置host1节点不参与服务承载,如下可以看到原有服务已经移交到manager节点下了。 200350455_f709d2d4-1cf5-4692-a544-4beb4682cd17 然后启用该host1节点恢复为活跃模式,但是该节点不会再去承载redis服务,因为服务现在并不需要它去承载。

docker node update --availability active host1

200351850_294a0c71-cc32-42d5-89e6-7b0bd4a6898c 至此,对于容器集群的搭建就此完成了。

对于容器集群的其他高级用法可以参见官方文档:https://docs.docker.com/engine/swarm/services/#roll-back-to-the-previous-version-of-a-service

2018-10-27,望技术有成后能回来看见自己的脚步