【Kubernetes系列】第2篇基础概念介绍（上）

2019 年 10 月 6 日
筆記

1 Pod – 实例

Pod是一组紧密关联的容器集合，支持多个容器在一个Pod中共享网络和文件系统，可以通过进程间通信和文件共享这种简单高效的方式完成服务，是Kubernetes调度的基本单位。Pod的设计理念是 每个Pod都有一个唯一的IP Pod具有如下特征：

包含多个共享IPC、Network和UTC namespace的容器，可直接通过localhost通信
所有Pod内容器都可以访问共享的Volume，可以访问共享数据
优雅终止:Pod删除的时候先给其内的进程发送SIGTERM，等待一段时间(grace period)后才强制停止依然还在运行的进程
特权容器(通过SecurityContext配置)具有改变系统配置的权限(在网络插件中大量应用)
支持三种重启策略（restartPolicy），分别是：Always、OnFailure、Never
支持三种镜像拉取策略（imagePullPolicy），分别是：Always、Never、IfNotPresent
资源限制，Kubernetes通过CGroup限制容器的CPU以及内存等资源，可以设置request以及limit值
健康检查，提供两种健康检查探针，分别是livenessProbe和redinessProbe，前者用于探测容器是否存活，如果探测失败，则根据重启策略进行重启操作，后者用于检查容器状态是否正常，如果检查容器状态不正常，则请求不会到达该Pod
Init container在所有容器运行之前执行，常用来初始化配置
容器生命周期钩子函数，用于监听容器生命周期的特定事件，并在事件发生时执行已注册的回调函数，支持两种钩子函数：postStart和preStop，前者是在容器启动后执行，后者是在容器停止前执行

2 Namespace – 命名空间

Namespace（命名空间）是对一组资源和对象的抽象集合，比如可以用来将系统内部的对象划分为不同的项目组或者用户组。常见的pod、service、replicaSet和deployment等都是属于某一个namespace的(默认是default)，而node, persistentVolumes等则不属于任何namespace。常用namespace操作：

# 查询所有namespaces  kubectl get namespace  # 创建namespace  kubectl create namespace ns-name  # 删除namespace  kubectl delete namespace ns-name

删除命名空间时，需注意以下几点：

删除一个namespace会自动删除所有属于该namespace的资源。
default 和 kube-system 命名空间不可删除。
PersistentVolumes是不属于任何namespace的，但PersistentVolumeClaim是属于某个特定namespace的。

Events是否属于namespace取决于产生events的对象。

3 Node 节点

Node是Pod真正运行的主机，可以是物理机也可以是虚拟机。Node本质上不是Kubernetes来创建的， Kubernetes只是管理Node上的资源。为了管理Pod，每个Node节点上至少需要运行container runtime（Docker）、kubelet和kube-proxy服务。常用node操作：

# 查询所有node  kubectl get nodes  # 将node标志为不可调度  kubectl cordon $nodename  # 将node标志为可调度  kubectl uncordon $nodename

taint(污点) 使用kubectl taint命令可以给某个Node节点设置污点，Node被设置上污点之后就和Pod之间存在了一种相斥的关系，可以让Node拒绝Pod的调度执行，甚至将Node已经存在的Pod驱逐出去。每个污点的组成：`key=value:effect`，当前taint effect支持如下三个选项：

NoSchedule：表示k8s将不会将Pod调度到具有该污点的Node上
PreferNoSchedule：表示k8s将尽量避免将Pod调度到具有该污点的Node上
NoExecute：表示k8s将不会将Pod调度到具有该污点的Node上，同时会将Node上已经存在的Pod驱逐出去

常用命令如下：

# 为节点node0设置不可调度污点  kubectl taint node node0 key1=value1:NoShedule  # 将node0上key值为key1的污点移除  kubectl taint node node0 key-  # 为kube-master节点设置不可调度污点  kubectl taint node node1 node-role.kubernetes.io/master=:NoSchedule  # 为kube-master节点设置尽量不可调度污点  kubectl taint node node1 node-role.kubernetes.io/master=PreferNoSchedule

容忍(Tolerations) 设置了污点的Node将根据taint的effect：NoSchedule、PreferNoSchedule、NoExecute和Pod之间产生互斥的关系，Pod将在一定程度上不会被调度到Node上。但我们可以在Pod上设置容忍(Toleration)，意思是设置了容忍的Pod将可以容忍污点的存在，可以被调度到存在污点的Node上。

4 Service 服务

Service是对一组提供相同功能的Pods的抽象，并为他们提供一个统一的入口，借助 Service 应用可以方便的实现服务发现与负载均衡，并实现应用的零宕机升级。 Service通过标签(label)来选取后端Pod，一般配合ReplicaSet或者Deployment来保证后端容器的正常运行。 service 有如下四种类型，默认是ClusterIP：

ClusterIP: 默认类型，自动分配一个仅集群内部可以访问的虚拟IP
NodePort: 在ClusterIP基础上为Service在每台机器上绑定一个端口，这样就可以通过 `NodeIP:NodePort` 来访问该服务
LoadBalancer: 在NodePort的基础上，借助cloud provider创建一个外部的负载均衡器，并将请求转发到 NodeIP:NodePort
ExternalName: 将服务通过DNS CNAME记录方式转发到指定的域名

另外，也可以将已有的服务以Service的形式加入到Kubernetes集群中来，只需要在创建 Service 的时候不指定Label selector，而是在Service创建好后手动为其添加endpoint。

5 Volume 存储卷

默认情况下容器的数据是非持久化的，容器消亡以后数据也会跟着丢失，所以Docker提供了Volume机制以便将数据持久化存储。Kubernetes提供了更强大的Volume机制和插件，解决了容器数据持久化以及容器间共享数据的问题。 Kubernetes存储卷的生命周期与Pod绑定

容器挂掉后Kubelet再次重启容器时，Volume的数据依然还在
Pod删除时，Volume才会清理。数据是否丢失取决于具体的Volume类型，比如emptyDir的数据会丢失，而PV的数据则不会丢

目前Kubernetes主要支持以下Volume类型：

emptyDir：Pod存在，emptyDir就会存在，容器挂掉不会引起emptyDir目录下的数据丢失，但是pod被删除或者迁移，emptyDir也会被删除
hostPath：hostPath允许挂载Node上的文件系统到Pod里面去
NFS（Network File System）：网络文件系统，Kubernetes中通过简单地配置就可以挂载NFS到Pod中，而NFS中的数据是可以永久保存的，同时NFS支持同时写操作。
glusterfs：同NFS一样是一种网络文件系统，Kubernetes可以将glusterfs挂载到Pod中，并进行永久保存
cephfs：一种分布式网络文件系统，可以挂载到Pod中，并进行永久保存
subpath：Pod的多个容器使用同一个Volume时，会经常用到
secret：密钥管理，可以将敏感信息进行加密之后保存并挂载到Pod中
persistentVolumeClaim：用于将持久化存储（PersistentVolume）挂载到Pod中
…

6 PersistentVolume(PV) 持久化存储卷

PersistentVolume(PV)是集群之中的一块网络存储。跟 Node 一样，也是集群的资源。PersistentVolume (PV)和PersistentVolumeClaim (PVC)提供了方便的持久化卷: PV提供网络存储资源，而PVC请求存储资源并将其挂载到Pod中。 PV的访问模式(accessModes)有三种:

ReadWriteOnce(RWO):是最基本的方式，可读可写，但只支持被单个Pod挂载。
ReadOnlyMany(ROX):可以以只读的方式被多个Pod挂载。
ReadWriteMany(RWX):这种存储可以以读写的方式被多个Pod共享。

不是每一种存储都支持这三种方式，像共享方式，目前支持的还比较少，比较常用的是 NFS。在PVC绑定PV时通常根据两个条件来绑定，一个是存储的大小，另一个就是访问模式。 PV的回收策略(persistentVolumeReclaimPolicy)也有三种

Retain，不清理保留Volume(需要手动清理)
Recycle，删除数据，即 rm -rf /thevolume/* (只有NFS和HostPath支持)
Delete，删除存储资源

7 Deployment 无状态应用

一般情况下我们不需要手动创建Pod实例，而是采用更高一层的抽象或定义来管理Pod，针对无状态类型的应用，Kubernetes使用Deloyment的Controller对象与之对应。其典型的应用场景包括：

定义Deployment来创建Pod和ReplicaSet
滚动升级和回滚应用
扩容和缩容
暂停和继续Deployment

常用的操作命令如下：

# 生成一个Deployment对象  kubectl run www --image=10.0.0.183:5000/hanker/www:0.0.1 --port=8080  # 查找Deployment  kubectl get deployment --all-namespaces  # 查看某个Deployment  kubectl describe deployment www  # 编辑Deployment定义  kubectl edit deployment www  # 删除某Deployment  kubectl delete deployment www  # 扩缩容操作，即修改Deployment下的Pod实例个数  kubectl scale deployment/www --replicas=2  # 更新镜像  kubectl set image deployment/nginx-deployment nginx=nginx:1.9.1  # 回滚操作  kubectl rollout undo deployment/nginx-deployment  # 查看回滚进度  kubectl rollout status deployment/nginx-deployment  # 启用水平伸缩（HPA - horizontal pod autoscaling），设置最小、最大实例数量以及目标cpu使用率  kubectl autoscale deployment nginx-deployment --min=10 --max=15 --cpu-percent=80  # 暂停更新Deployment  kubectl rollout pause deployment/nginx-deployment  # 恢复更新Deployment  kubectl rollout resume deploy nginx

更新策略 `.spec.strategy` 指新的Pod替换旧的Pod的策略，有以下两种类型

`RollingUpdate` 滚动升级，可以保证应用在升级期间，对外正常提供服务。
`Recreate` 重建策略，在创建出新的Pod之前会先杀掉所有已存在的Pod。

Deployment和ReplicaSet两者之间的关系

使用Deployment来创建ReplicaSet。ReplicaSet在后台创建pod，检查启动状态，看它是成功还是失败。
当执行更新操作时，会创建一个新的ReplicaSet，Deployment会按照控制的速率将pod从旧的ReplicaSet移动到新的ReplicaSet中。

8 StatefulSet 有状态应用

Deployments和ReplicaSets是为无状态服务设计的，那么StatefulSet则是为了有状态服务而设计，其应用场景包括：

稳定的持久化存储，即Pod重新调度后还是能访问到相同的持久化数据，基于PVC来实现
稳定的网络标志，即Pod重新调度后其PodName和HostName不变，基于Headless Service(即没有Cluster IP的Service)来实现
有序部署，有序扩展，即Pod是有顺序的，在部署或者扩展的时候要依据定义的顺序依次进行操作(即从0到N-1，在下一个Pod运行之前所有之前的Pod必须都是Running和Ready状态)，基于init containers来实现
有序收缩，有序删除(即从N-1到0)

支持两种更新策略：

OnDelete:当`.spec.template`更新时，并不立即删除旧的Pod，而是等待用户手动删除这些旧Pod后自动创建新Pod。这是默认的更新策略，兼容v1.6版本的行为
RollingUpdate:当 `.spec.template` 更新时，自动删除旧的Pod并创建新Pod替换。在更新时这些Pod是按逆序的方式进行，依次删除、创建并等待Pod变成Ready状态才进行下一个Pod的更新。

【Kubernetes系列】第2篇基础概念介绍（上）

1 Pod – 实例

2 Namespace – 命名空间

3 Node 节点

4 Service 服务

5 Volume 存储卷

6 PersistentVolume(PV) 持久化存储卷

7 Deployment 无状态应用

8 StatefulSet 有状态应用

VirMach 便宜 VPS

QNews

【Kubernetes系列】第2篇 基础概念介绍（上）

1 Pod – 实例

2 Namespace – 命名空间

3 Node 节点

4 Service 服务

5 Volume 存储卷

6 PersistentVolume(PV) 持久化存储卷

7 Deployment 无状态应用

8 StatefulSet 有状态应用

分享此文：

Related Posts

上线稳定性如何保证？开关编程很有用

Python | asyncio：从原理、源码到实现

大数据的“动物管理员” ZooKeeper

【就在今晚】直播课程：一小时完成一篇SCI文章

VirMach 便宜 VPS

QNews

熱門搜尋

【Kubernetes系列】第2篇基础概念介绍（上）