前言

默认情况下,Pod的调度完全由Master节点的Scheduler组件经过一系列的算法计算得出的,这个过程是不能人工干预的。但是实际情况中我们的业务非常复杂,可能需要自己控制Pod到达某个节点,于是k8s也给我们提供了一些更加细粒度的调度策略设置。如NodeSelector,NodeAffinity,PodAffinity,污点和容忍等。

本文主要介绍定向调度 NodeSelector ,其它调度后续文章更新。

定向调度可以将Pod调度到指定的Node上,这个过程是强制的,如果调度的目标节点不存在,那么Pod会运行失败,并不会调度到其它节点。

定向调度有两种方式

  • nodeName 调度到指定名称的节点,这种方式跳过了Scheduler的调度逻辑
  • nodeSelector 通过 label-selector机制 将Pod调度到指定标签的Node节点上
nodeName

查看当前集群的所有节点

[root@master ~]# kubectl get nodes
NAME     STATUS   ROLES                  AGE   VERSION
master   Ready    control-plane,master   49d   v1.23.9
node01   Ready    <none>                 49d   v1.23.9
node02   Ready    <none>                 49d   v1.23.9

编写 nginx-nodename.yaml 内容如下,通过nodeName调度到node01节点

apiVersion: v1
kind: Pod
metadata:
  name: nginx-nodename
spec:
  containers:
  - name: nginx
    image: nginx
    imagePullPolicy: IfNotPresent
  nodeName: node01

启动Pod,查看Pod详情注意观察NODE信息

# 启动
[root@master scheduler]# kubectl create -f nginx-nodename.yaml 
pod/nginx-nodename created

# 查看Pod详情 已经运行成功并且调度到了node01
[root@master scheduler]# kubectl get pod -o wide
NAME             READY   STATUS    RESTARTS   AGE   IP            NODE     NOMINATED NODE   READINESS GATES
nginx-nodename   1/1     Running   0          11s   10.244.1.69   node01   <none>           <none>

上面是正常流程,前面我们提到,这个调度是强制性的,如果没有该node节点是否运行不成功,下面我们来验证下,修改上面yaml,将 nodeName: node01修改为 nodeName: node03

启动Pod,观察详情

# 查看pod看到Node虽然在node03但是并没有运行成功
[root@master scheduler]# kubectl get pod -o wide
NAME             READY   STATUS    RESTARTS   AGE   IP       NODE     NOMINATED NODE   READINESS GATES
nginx-nodename   0/1     Pending   0          14s   <none>   node03   <none>           <none>

# 等待一会,因为没有节点的原因,该pod会自动删除
[root@master scheduler]# kubectl get pod -o wide
No resources found in default namespace.
nodeSelector

在Pod创建之前,会通过 MatchNodeSelector 调度策略进行节点标签匹配,如果找到对应节点含有此标签,则调度到该节点,如果找到多个挑选一个即可,如果没有找到则Pod运行失败(前面提到了该机制是强制性的)

通过kubectl label命令给node01打上北京机房的标签,给node02打上上海机房的标签

kubectl label nodes node01 area=bj
kubectl label nodes node02 area=shanghai

# 查看标签是否设置成功
kubectl get nodes --show-labels

编写 nginx-nodeselector.yaml 内容如下 通过 nodeSelector指定调度到bj机房

apiVersion: v1
kind: Pod
metadata:
  name: nginx-nodeselector
spec:
  containers:
  - name: nginx
    image: nginx
    imagePullPolicy: IfNotPresent
  nodeSelector:
    area: bj #指定调度到北京机房
北京机房测试

启动Pod,查看Pod详情注意观察NODE信息

# 启动Pod
[root@master scheduler]# kubectl create -f nginx-nodeselector.yaml
pod/nginx-nodeselector created

# 查看详情,调度到了node01
[root@master scheduler]# kubectl get pod -o wide
NAME                 READY   STATUS    RESTARTS   AGE   IP            NODE     NOMINATED NODE   READINESS GATES
nginx-nodeselector   1/1     Running   0          41s   10.244.1.70   node01   <none>           <none>
上海机房测试

修改area为shanghai 再次启动Pod,查看Pod详情注意观察NODE信息

# 删除之前的pod
[root@master scheduler]# kubectl delete -f nginx-nodeselector.yaml
pod "nginx-nodeselector" deleted
# 启动修改后的Pod
[root@master scheduler]# kubectl create -f nginx-nodeselector.yaml
pod/nginx-nodeselector created

# 查看详情,调度到了node02
[root@master scheduler]# kubectl get pod -o wide
NAME                 READY   STATUS    RESTARTS   AGE   IP            NODE     NOMINATED NODE   READINESS GATES
nginx-nodeselector   1/1     Running   0          5s    10.244.2.23   node02   <none>           <none>
无匹配机房测试

修改area为changsha 再次启动Pod,查看Pod详情

# 删除之前的pod
[root@master scheduler]# kubectl delete -f nginx-nodeselector.yaml
pod "nginx-nodeselector" deleted
# 启动修改后的Pod
[root@master scheduler]# kubectl create -f nginx-nodeselector.yaml
pod/nginx-nodeselector created

# 查看详情,并没有启动成功
[root@master scheduler]# kubectl get pod -o wide                                  
NAME                 READY   STATUS    RESTARTS   AGE   IP       NODE     NOMINATED NODE   READINESS GATES
nginx-nodeselector   0/1     Pending   0          12s   <none>   <none>   <none>           <none>

# 查看启动过程,报错了
[root@master scheduler]# kubectl describe  pod nginx-nodeselector|grep -A 100 Event
Events:
  Type     Reason            Age   From               Message
  ----     ------            ----  ----               -------
  Warning  FailedScheduling  64s   default-scheduler  0/3 nodes are available: 1 node(s) had taint {node-role.kubernetes.io/master: }, that the pod didn't tolerate, 2 node(s) didn't match Pod's node affinity/selector.

由于找不到匹配的node几点,前面提到了该机制是强制性的,所以pod是运行不起来的,这种方式调度失败了是不会删除pod,我们需要手动删除下。


如果需要删除节点标签,执行如下命令

kubectl label node node01 area-
kubectl label node node02 area-

Pod的定向调度就介绍到这里,该方式只是一个简单的限制了Pod所在节点的方法,后面我们介绍亲和性调度,它极大的扩展了Pod的调度能力。


欢迎关注,学习不迷路!