Kubernetes集群部署笔记

本作品Galen Suen采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可。由原作者转载自个人站点

概述

本文用于整理基于Debian操作系统使用kubeadm工具部署Kubernetes集群的操作过程。该集群部署于一组本地虚拟服务器上,用于学习Kubernetes的基础概念和基本操作,并作为今后其他学习内容的实践部署提供环境。

考虑到不同的网络环境,本文中一些步骤会记录两种操作方式,通过镜像等方式加快部署效率、避免部署错误。有关镜像同步的方案,可参考附件内容中的同步所需镜像

随着操作系统和各相关组件版本的更新,笔者将在验证通过后对本文进行补充和更新。

服务器

受限于本地物理服务器的配置,虚拟服务器配置规划如下表。

Host OS IP CPU RAM K8s Roles
k8s-n0 Debian 10.10 10.0.0.50 2 vCPUs 4 GB v1.22.1 control-plane, master
k8s-n1 Debian 10.10 10.0.0.51 4 vCPUs 6 GB v1.22.1
k8s-n2 Debian 10.10 10.0.0.52 4 vCPUs 6 GB v1.22.1
k8s-n3 Debian 10.10 10.0.0.53 4 vCPUs 6 GB v1.22.1

所有虚拟服务器CPU均为amd64架构。

截止本文发布时,笔者基于最新Debian 11 (“bullseye”)部署的集群仍然存在一些问题,故暂且发布基于Debian 10 (“buster”)的笔记。

网络环境

本地网络IP地址范围为10.0.0.0/24,其中:

  • 10.0.0.210.0.0.99为静态分配,供虚拟服务器使用
  • 10.0.0.10010.0.0.200用于DHCP自动分配
  • 10.0.0.20110.0.0.254为静态分配,供负载均衡器使用

其他组件

准备工作

服务器配置

本文假设服务器硬件和操作系统已经配置完毕,所有服务器上都已经正确配置了ssh服务和sudo权限。

作为参考,这里记录笔者配置sudo权限和ssh服务的过程。

  • 配置sudo权限

    如操作人员的登录用户已经被正确配置了sudo权限,可跳过此步骤。

    本示例中,操作人员的登录用户名为tiscs,需要实际环境情况进行替换。

    # 使用root用户登录系统
    # 安装sudo,并配置sudo权限
    apt update
    apt install sudo
    echo "tiscs ALL=(ALL) NOPASSWD: ALL" | tee /etc/sudoers.d/tiscs # 这在生产环境绝不是个好主意,仅仅是为了演练环境操作方便
    
  • 配置ssh服务

    # 安装openssh-server,并配置ssh服务为自动启动
    sudo apt update
    sudo apt install openssh-server
    sudo systemctl enable ssh --now
    

配置过程

安装容器运行时

本文配置的集群选择containerd作为容器运行时。

在所有节点上执行如下操作。

  • 配置模块加载

    cat <<EOF | sudo tee /etc/modules-load.d/containerd.conf
    overlay
    br_netfilter
    EOF
    
    sudo modprobe overlay
    sudo modprobe br_netfilter
    
  • 配置sysctl参数

    cat <<EOF | sudo tee /etc/sysctl.d/99-kubernetes-cri.conf
    net.bridge.bridge-nf-call-iptables  = 1
    net.ipv4.ip_forward                 = 1
    net.bridge.bridge-nf-call-ip6tables = 1
    EOF
    
    sudo sysctl --system
    
  • 配置APT源

    # 安装依赖项
    sudo apt install -y apt-transport-https ca-certificates curl gnupg lsb-release
    
    # 根据网络环境选择官方源或镜像源
    
    # 1. 配置Docker官方源
    curl -fsSL //download.docker.com/linux/debian/gpg \
      | sudo gpg --dearmor -o /etc/apt/trusted.gpg.d/docker-archive-keyring.gpg
    echo "deb [arch=amd64] //download.docker.com/linux/debian $(lsb_release -cs) stable" \
      | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
    
    # 2. 配置Aliyun镜像源
    curl -fsSL //mirrors.aliyun.com/docker-ce/linux/debian/gpg \
      | sudo gpg --dearmor -o /etc/apt/trusted.gpg.d/docker-archive-keyring.gpg
    echo "deb [arch=amd64] //mirrors.aliyun.com/docker-ce/linux/debian $(lsb_release -cs) stable" \
      | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
    
  • 安装containerd

    sudo apt update
    sudo apt install -y containerd.io
    
  • 初始化配置

    sudo mkdir -p /etc/containerd
    containerd config default | sudo tee /etc/containerd/config.toml
    
    # 配置systemd cgroup驱动
    sudo sed -i 's|\(\s\+\)\[plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc.options\]|\1\[plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc.options\]\n\1  SystemdCgroup = true|g' /etc/containerd/config.toml
    
    # (可选)配置阿里云容器镜像源
    sudo sed -i 's/registry-1.docker.io/xrb7j2ja.mirror.aliyuncs.com/g' /etc/containerd/config.toml
    # (可选)配置sandbox image地址
    # 为了方便,这里配置为与kubelet所需相同的版本(可以使用kubeadm config images list命令查看)
    sudo sed -i 's|k8s.gcr.io/pause:.\+|registry.cn-beijing.aliyuncs.com/choral-k8s/pause:3.5|g' /etc/containerd/config.toml
    
    # 重启containerd服务
    sudo systemctl restart containerd
    

安装kubeadm

在所有节点上执行如下操作。

  • 配置APT源

    # 根据网络环境选择官方源或镜像源
    
    # 1. 配置Docker官方源
    curl -fsSL //packages.cloud.google.com/apt/doc/apt-key.gpg \
      | sudo gpg --dearmor -o /etc/apt/trusted.gpg.d/kubernetes-archive-keyring.gpg
    echo "deb //apt.kubernetes.io/ kubernetes-xenial main" \
      | sudo tee /etc/apt/sources.list.d/kubernetes.list
    
    # 2. 配置Aliyun镜像源
    curl -fsSL //mirrors.aliyun.com/docker-ce/linux/debian/gpg \
      | sudo gpg --dearmor -o /etc/apt/trusted.gpg.d/kubernetes-archive-keyring.gpg
    echo "deb //mirrors.aliyun.com/kubernetes/apt/ kubernetes-xenial main" \
      | sudo tee /etc/apt/sources.list.d/kubernetes.list
    
  • 安装kubeadmkubeletkubectl

    sudo apt install -y kubelet=1.22.1-00 kubeadm=1.22.1-00 kubectl=1.22.1-00
    sudo apt-mark hold kubelet kubeadm kubectl
    
  • 安装并配置crictl(可选)

    可以安装并配置crictl,便于在k8s节点上管理容器运行时。

    # 安装crictl工具
    sudo apt install -y cri-tools
    
    # 配置crictl使用containerd运行时
    cat <<EOF | sudo tee /etc/crictl.yaml
    runtime-endpoint: unix:///run/containerd/containerd.sock
    image-endpoint: unix:///run/containerd/containerd.sock
    timeout: 10
    debug: false
    EOF
    
    # 验证crictl配置
    sudo crictl images # 列出所有镜像
    

配置控制平面节点

k8s-n0节点上执行如下操作。

  • 预先下载所需镜像

    # 查看所需的镜像列表
    kubeadm config images list --kubernetes-version=v1.22.1 # --image-repository registry.cn-beijing.aliyuncs.com/choral-k8s
    
    # 1. 使用默认容器镜像仓库
    sudo kubeadm config images pull --kubernetes-version=v1.22.1
    
    # 2. 使用自建容器镜像仓库
    sudo kubeadm config images pull --kubernetes-version=v1.22.1 \
      --image-repository registry.cn-beijing.aliyuncs.com/choral-k8s
    
  • 初始化控制平面节点

    # --apiserver-advertise-address: 当前节点IP地址
    # --pod-network-cidr           : Pod网络地址段(CIDR: //datatracker.ietf.org/doc/html/rfc4632)
    
    # 1. 使用默认容器镜像仓库
    sudo kubeadm init --apiserver-advertise-address 10.0.0.50 \
      --pod-network-cidr=10.244.0.0/16 --kubernetes-version=v1.22.1 
    
    # 2. 使用自建容器镜像仓库
    sudo kubeadm init --apiserver-advertise-address 10.0.0.50 \
      --pod-network-cidr=10.244.0.0/16 --kubernetes-version=v1.22.1 \
      --image-repository registry.cn-beijing.aliyuncs.com/choral-k8s
    

    执行完上述操作后,kubeadm init命令会输出用于添加节点到集群中的说明,请保存该说明中的内容。示例如下:

    sudo kubeadm join 10.0.0.50:6443 \
      --token vafq03.5dl6j1cbcd1yzf3c \
      --discovery-token-ca-cert-hash sha256:6a725d98e0f6bda713c9f93b8441a735cc60e8ec7454fbe960c74ab80683f938
    
  • 添加kubectl配置(可选)

    mkdir -p ~/.kube
    sudo cp -i /etc/kubernetes/admin.conf ~/.kube/config
    sudo chown $(id -u):$(id -g) ~/.kube/config
    
  • 安装网络组件

    # 1. 使用默认镜像仓库(quay.io/coreos)安装
    kubectl apply -f //raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
    
    # 2. 使用给自定义镜像仓库安装
    kubectl apply -f //raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml \
      | sed -e 's|quay.io/coreos|registry.cn-beijing.aliyuncs.com/choral-k8s|g' | kubectl apply -f -
    
    #   2.1 如果访问raw.githubusercontent.com上的文件存在网络问题
    #       可以使用jsdelivr提供的GitHub CDN地址(//www.jsdelivr.com/github)
    curl -s //cdn.jsdelivr.net/gh/coreos/[email protected]/Documentation/kube-flannel.yml \
      | sed -e 's|quay.io/coreos|registry.cn-beijing.aliyuncs.com/choral-k8s|g' | kubectl apply -f -
    

添加工作节点

k8s-n1k8s-n2k8s-n3节点上执行如下操作。该操作中需要的token值和hash值通过上述步骤中的kubeadm init操作获取。

  • 添加工作节点

    sudo kubeadm join 10.0.0.50:6443 \
      --token vafq03.5dl6j1cbcd1yzf3c \
      --discovery-token-ca-cert-hash sha256:6a725d98e0f6bda713c9f93b8441a735cc60e8ec7454fbe960c74ab80683f938
    
  • 查看节点状态

    k8s-n0节点上执行如下操作。

    kubectl get nodes
    kubectl top nodes
    

安装Helm工具(可选)

本文暂不涉及使用helm执行的操作,该步骤可选。

  • 安装Helm工具

    # 下载并安装
    curl -sL //get.helm.sh/helm-v3.6.3-linux-amd64.tar.gz | tar xzf - linux-amd64/helm
    sudo cp ./linux-amd64/helm /usr/local/bin/helm
    rm -rf ./linux-amd64
    sudo chown root:root /usr/local/bin/helm
    sudo chmod 755 /usr/local/bin/helm
    
    # 验证helm安装
    helm version
    

安装Metrics Server(可选)

部署metrics server以启用指标服务,未安装metrics server前,kubectl top命令无法正常执行。

k8s-n0节点上执行如下操作。

  • 执行清单文件

    这里需要注意,为解决证书错误,需要添加metrics-server容器的参数--kubelet-insecure-tls,这里选择通过sed命令修改清单文件后再使用kubectl执行。

    # 1. 使用官方镜像地址直接安装
    curl -sL //github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml \
      | sed -e "s|\(\s\+\)- args:|\1- args:\n\1  - --kubelet-insecure-tls|" | kubectl apply -f -
    #   1.1 为避免特殊网络环境中的清单文件加载问题,可以使用FastGit提供的加速方案
    curl -sL //endpoint.fastgit.org///github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml \
      | sed -e "s|\(\s\+\)- args:|\1- args:\n\1  - --kubelet-insecure-tls|" | kubectl apply -f -
    
    # 2. 使用自定义镜像地址安装
    curl -sL //endpoint.fastgit.org///github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml \
      | sed \
        -e "s|\(\s\+\)- args:|\1- args:\n\1  - --kubelet-insecure-tls|" \
        -e "s|k8s.gcr.io/metrics-server|registry.cn-beijing.aliyuncs.com/choral-k8s|g" \
      | kubectl apply -f -
    
    # 
    

安装负载均衡组件

由云服务商提供的Kubernetes服务,通常会提供内置的负载均衡实现。而笔者部署环境为私有环境,需要一个轻量的负载均衡实现以支撑LoadBalancer类型的服务。

笔者选择MetalLB作为负载均衡实现,配置为二层网络模式。LoadBalancer地址范围配置为10.0.0.201-10.0.0.254,需根据具体网络环境进行修改。

k8s-n0节点上执行如下操作。

  • 安装MetalLB

    # 创建用于部署MetalLB的命名空间
    kubectl create namespace metallb-system
    
    # 创建必须的配置文件
    cat <<EOF | kubectl apply -f - --dry-run=client
    apiVersion: v1
    kind: ConfigMap
    metadata:
      namespace: metallb-system
      name: config
    data:
      config: |
        address-pools:
        - name: default
        protocol: layer2
        addresses:
        - 10.0.0.201-10.0.0.254
    EOF
    
    # 1. 直接执行清单文件
    kubectl apply -f //raw.githubusercontent.com/metallb/metallb/v0.10.2/manifests/metallb.yaml
    #   1.1 为避免特殊网络环境中的清单文件加载问题,可以使用jsdelivr提供的加速方案加速地址
    kubectl apply -f //cdn.jsdelivr.net/gh/metallb/[email protected]/manifests/metallb.yaml
    
    # 2. 替换命名空间。命名空间需要与刚刚创建的ConfigMap相同。
    curl -sL //cdn.jsdelivr.net/gh/metallb/[email protected]/manifests/metallb.yaml \
      | sed -e "s|namespace: metallb-system|namespace: kube-system|g" | kubectl apply -f -
    

安装持久卷供应程序

Kubernetes内置的local-storage存储类无法动态供应卷,为便于基于该环境演练时自动创建持久卷,选择使用local-path-provisioner作为持久卷供应程序。

  • 创建所需的目录

    在所有节点上执行如下操作。

    sudo mkdir -p /opt/local-path-provisioner
    
  • 安装local-path-provisioner

    k8s-n0节点上执行如下操作。

    # 1. 使用官方清单文件地址直接安装
    kubectl apply -f //raw.githubusercontent.com/rancher/local-path-provisioner/master/deploy/local-path-storage.yaml
    #   1.1 同样可以使用jsdelivr提供的加速方案
    kubectl apply -f //cdn.jsdelivr.net/gh/rancher/[email protected]/deploy/local-path-storage.yaml
    
    # 2. 替换命名空间
    curl -s //cdn.jsdelivr.net/gh/rancher/[email protected]/deploy/local-path-storage.yaml \
      | sed \
        -e "1,6d" \
        -e "s/local-path-storage/kube-system/" \
      | kubectl apply -f -
    
  • 配置默认存储类

    kubectl patch storageclass local-path -p '{"metadata": {"annotations":{"storageclass.kubernetes.io/is-default-class":"true"}}}'
    

检查集群工作状态

k8s-n0节点上执行如下操作。

  • 查看节点状态

    kubectl get nodes
    
    kubectl top nodes
    
  • 查看Pod状态

    kubectl get pods -A
    
    kubectl top pods -A
    

附加内容

同步所需镜像

由于特殊网络环境问题,需要同步kubelet所需镜像至其他镜像仓库的,可参考如下操作。

笔者开发环境中使用podman管理容器和镜像,已将docker设置为podman的别名(alias docker=podman)。

  • 同步kubelet所需镜像

    首先,需要创建私有镜像仓库认证凭据。

    # 根据需要将`registry.cn-beijing.aliyuncs.com`替换为私有镜像仓库地址
    docker login registry.cn-beijing.aliyuncs.com
    

    创建一个脚本gcr_mirror_sync.sh,内容如下。

    # gcr_mirror_sync.sh
    # 根据需要将`registry.cn-beijing.aliyuncs.com/choral-k8s/`替换为私有镜像仓库地址
    while read o
      do {
          t=$(echo $o | sed 's|k8s.gcr.io.*/|registry.cn-beijing.aliyuncs.com/choral-k8s/|g')
          docker pull $o
          docker tag $o $t
          docker push $t
          docker rmi $o
          docker rmi $t
      }
    done < "${1:-/dev/stdin}"
    

    该脚本有两种使用方法。

    kubeadm config images list --kubernetes-version=v1.22.1 | bash gcr_mirror_sync.sh
    
    # 列出所需镜像列表并保存到文件
    kubeadm config images list --kubernetes-version=v1.22.1 > gcr-image-list
    # 拷贝该文件至gcr_mirror_sync.sh所在主机,然后执行该脚本
    bash gcr_mirror_sync.sh gcr-image-list
    
  • 同步附加组件镜像

    # 根据需要将`registry.cn-beijing.aliyuncs.com/choral-k8s/`替换为私有镜像仓库地址。
    
    # 同步metrics server所需镜像
    docker pull k8s.gcr.io/metrics-server/metrics-server:v0.5.0
    docker tag k8s.gcr.io/metrics-server/metrics-server:v0.5.0 registry.cn-beijing.aliyuncs.com/choral-k8s/metrics-server:v0.5.0
    docker push registry.cn-beijing.aliyuncs.com/choral-k8s/metrics-server:v0.5.0
    docker rmi k8s.gcr.io/metrics-server/metrics-server:v0.5.0
    docker rmi registry.cn-beijing.aliyuncs.com/choral-k8s/metrics-server:v0.5.0
    
    # 同步flannel所需镜像
    docker pull quay.io/coreos/flannel:v0.14.0
    docker tag quay.io/coreos/flannel:v0.14.0 registry.cn-beijing.aliyuncs.com/choral-k8s/flannel:v0.14.0
    docker push registry.cn-beijing.aliyuncs.com/choral-k8s/flannel:v0.14.0
    docker rmi quay.io/coreos/flannel:v0.14.0
    docker rmi registry.cn-beijing.aliyuncs.com/choral-k8s/flannel:v0.14.0
    

参考资料