Cilium使用 (Cilium 3)

使用k3s測試Cilium,安裝步驟可以參見官方文檔

Cilium安裝使用

docker安裝

使用如下命令安裝最新版本的docker

yum install -y yum-utils \
  device-mapper-persistent-data \
  lvm2

yum-config-manager \
    --add-repo \
    //download.docker.com/linux/centos/docker-ce.repo
    
yum install docker-ce docker-ce-cli containerd.io

啟動docker

service docker start

內核更新

Cilium要求的內核版本比較高,需要對內核進行升級,否則會運行失敗。錯誤日誌如minimal supported kernel version is 4.8.0; kernel version that is running is: 3.10.0"

1、導入key
rpm --import //www.elrepo.org/RPM-GPG-KEY-elrepo.org

2、安裝elrepo的yum源
rpm -Uvh //www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm

3、安裝內核
在yum的ELRepo源中,有mainline頒佈的,可以這樣安裝:
yum --enablerepo=elrepo-kernel install  kernel-ml-devel kernel-ml -y

為了讓新安裝的內核成為默認啟動選項,需要如下修改 GRUB 配置,打開並編輯 /etc/default/grub 並設置 GRUB_DEFAULT=0。意思是 GRUB 初始化頁面的第一個內核將作為默認內核

# cat /etc/default/grub
GRUB_TIMEOUT=1
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=0
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="crashkernel=auto spectre_v2=retpoline rhgb quiet net.ifnames=0 console=tty0 console=ttyS0,11520                                                  0n8 noibrs"
GRUB_DISABLE_RECOVERY="true"

接下來運行下面的命令來重新創建內核配置.

# grub2-mkconfig -o /boot/grub2/grub.cfg

重啟機器並查看內核版本

# uname -a
Linux iZt4n3pfp2quf7ld2pln01Z 5.6.5-1.el7.elrepo.x86_64 #1 SMP Thu Apr 16 14:02:22 EDT 2020 x86_64 x86_64 x86_64 GNU/Linux

安裝k3s

安裝master
curl -sfL //get.k3s.io | INSTALL_K3S_EXEC='--flannel-backend=none --no-flannel' sh -
安裝node(可選)
curl -sfL //get.k3s.io | INSTALL_K3S_EXEC='--no-flannel' K3S_URL='//${MASTER_IP}:6443' K3S_TOKEN=${NODE_TOKEN}
掛載BPF文件系統
sudo mount bpffs -t bpf /sys/fs/bpf
安裝Cilium
kubectl create -f //raw.githubusercontent.com/cilium/cilium/1.7.2/install/kubernetes/quick-install.yaml
查看安裝結果
# kubectl -n kube-system get pods --watch
NAME                                      READY   STATUS      RESTARTS   AGE
cilium-operator-774d8f6d67-8mht6          1/1     Running     0          2m24s
metrics-server-6d684c7b5-qjmd5            1/1     Running     0          2m55s
local-path-provisioner-58fb86bdfd-xmx2r   1/1     Running     0          2m55s
helm-install-traefik-wx88l                0/1     Completed   0          2m55s
cilium-md26c                              1/1     Running     0          2m24s
svclb-traefik-g4mq5                       2/2     Running     0          55s
coredns-6c6bb68b64-gtqm5                  1/1     Running     0          2m55s
traefik-7b8b884c8-79v79                   1/1     Running     0          55s

部署連接測試

該步驟部署一系列deployment,這些deployment將使用各種連接路徑相互連接。連接路徑包括有/無service負載平衡以及各種網絡策略組合。pod名稱表示連接變量,readiness和liveness gate表示測試的成功或失敗:

kubectl apply -f //raw.githubusercontent.com/cilium/cilium/1.7.2/examples/kubernetes/connectivity-check/connectivity-check.yaml

安裝Hubble

Hubble是一個完全分佈式的網絡和安全的觀測平台,用於雲本地工作負載。它構建在Cilium和eBPF之上,可以通過完全透明的方式深入了解服務以及網絡基礎設施的通信和行為。Visit Hubble Github page

安裝helm
wget //get.helm.sh/helm-v3.1.2-linux-amd64.tar.gz
tar -zxvf helm-v3.1.2-linux-amd64.tar.gz
mv linux-amd64/helm /usr/local/bin/helm
安裝Hubble
git clone //github.com/cilium/hubble.git
cd hubble/install/kubernetes

helm template hubble \
    --namespace kube-system \
    --set metrics.enabled="{dns,drop,tcp,flow,port-distribution,icmp,http}" \
    --set ui.enabled=true \
> hubble.yaml

kubectl apply -f hubble.yaml

如果需要通過nodeport的方式訪問,可以創建如下service,訪問//{$Externap_IP}:32000即可看到相關的策略

apiVersion: v1
kind: Service
metadata:
  name: hubble-ui-node
  namespace: kube-system
spec:
  ports:
  - name: http
    port: 12000
    protocol: TCP
    targetPort: 12000
    nodePort: 35000
  selector:
    k8s-app: hubble-ui
  sessionAffinity: None
  type: NodePort

Cilium的網絡模型

同節點訪問

同節點內部的容器之間的連通性依賴內核協議棧二層轉發和BPF程序,不會經過像OVS或Linux bridge這樣的二層設備。這部分功能由Cilium Agent負責,使用BPF規則進行流量的管控。簡單示意圖如下:

官方示意圖如下:

可以看到,同節點的容器之間通信直接走BPF規則即可;不同節點的容器的通信需要通過各個節點上的cilium_host接口進行轉發

容器和所在節點的通信走節點內部的三層路由和BPF轉發,BPF程序連接容器的veth pair和它的網關設備。如下路由中,將cilium_host作為容器的默認網關。容器和容器所在的節點的通信需要經過cilium_host接口

容器:
# ip route
default via 10.42.0.79 dev eth0 mtu 1450 
10.42.0.79 dev eth0 scope link 

節點:
[root@iZt4n3pfp2quf7ld2pln01Z ~]# ip route
default via 172.21.239.253 dev eth0 
10.42.0.0/24 via 10.42.0.79 dev cilium_host src 10.42.0.79 mtu 1450 
10.42.0.79 dev cilium_host scope link 
169.254.0.0/16 dev eth0 scope link metric 1002 
172.21.224.0/20 dev eth0 proto kernel scope link src 172.21.239.198 

cilium_host涉及的iptables表項如下,可以看到對源地址為127.0.0.1的報文進行了SNAT。

Chain CILIUM_POST_nat (1 references)
 pkts bytes target     prot opt in     out     source               destination
 1977  119K MASQUERADE  all  --  *      !cilium_+  10.42.0.0/24        !10.42.0.0/24         /* cilium masquerade non-cluster */
 1521 95679 RETURN     all  --  *      !cilium_host  0.0.0.0/0            0.0.0.0/0            /* exclude non-cilium_host traffic from masquerade */
    0     0 ACCEPT     all  --  *      *       0.0.0.0/0            0.0.0.0/0            mark match 0xa00/0xe00 /* exclude proxy return traffic from masquarade */
    0     0 SNAT       all  --  *      cilium_host !10.42.0.79          !10.42.0.0/24         /* cilium host->cluster masquerade */ to:10.42.0.79
    0     0 SNAT       all  --  *      cilium_host  127.0.0.1            0.0.0.0/0            /* cilium host->cluster from 127.0.0.1 masquerade */ to:10.42.0.79

跨節點網絡

下面是使用Host L3進行跨節點通信的流程圖

下面是使用vxlan進行跨節點通信的流程圖

Cilium cli

使用Cilium後,不會再使用kube-proxy,它會從Kubernetes API服務器獲得Service信息,並存入BPF。可以使用cilium命令行查看相關的信息。如使用# cilium node list查看當前的node節點信息,使用# cilium service list查看service信息等。對於策略的獲取,可以通過命令行# cilium policy get,也可以通過Hubble UI查看,如下:

參考: