Cilium使用 (Cilium 3)
- 2020 年 4 月 19 日
- 筆記
- k8s kubernetes, Kubernetes, 容器
使用k3s測試Cilium,安裝步驟可以參見官方文檔
Cilium安裝使用
docker安裝
使用如下命令安裝最新版本的docker
yum install -y yum-utils \
device-mapper-persistent-data \
lvm2
yum-config-manager \
--add-repo \
//download.docker.com/linux/centos/docker-ce.repo
yum install docker-ce docker-ce-cli containerd.io
啟動docker
service docker start
內核更新
Cilium要求的內核版本比較高,需要對內核進行升級,否則會運行失敗。錯誤日誌如minimal supported kernel version is 4.8.0; kernel version that is running is: 3.10.0"
1、導入key
rpm --import //www.elrepo.org/RPM-GPG-KEY-elrepo.org
2、安裝elrepo的yum源
rpm -Uvh //www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
3、安裝內核
在yum的ELRepo源中,有mainline頒佈的,可以這樣安裝:
yum --enablerepo=elrepo-kernel install kernel-ml-devel kernel-ml -y
為了讓新安裝的內核成為默認啟動選項,需要如下修改 GRUB 配置,打開並編輯 /etc/default/grub
並設置 GRUB_DEFAULT=0
。意思是 GRUB 初始化頁面的第一個內核將作為默認內核
# cat /etc/default/grub
GRUB_TIMEOUT=1
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=0
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="crashkernel=auto spectre_v2=retpoline rhgb quiet net.ifnames=0 console=tty0 console=ttyS0,11520 0n8 noibrs"
GRUB_DISABLE_RECOVERY="true"
接下來運行下面的命令來重新創建內核配置.
# grub2-mkconfig -o /boot/grub2/grub.cfg
重啟機器並查看內核版本
# uname -a
Linux iZt4n3pfp2quf7ld2pln01Z 5.6.5-1.el7.elrepo.x86_64 #1 SMP Thu Apr 16 14:02:22 EDT 2020 x86_64 x86_64 x86_64 GNU/Linux
安裝k3s
安裝master
curl -sfL //get.k3s.io | INSTALL_K3S_EXEC='--flannel-backend=none --no-flannel' sh -
安裝node(可選)
curl -sfL //get.k3s.io | INSTALL_K3S_EXEC='--no-flannel' K3S_URL='//${MASTER_IP}:6443' K3S_TOKEN=${NODE_TOKEN}
掛載BPF文件系統
sudo mount bpffs -t bpf /sys/fs/bpf
安裝Cilium
kubectl create -f //raw.githubusercontent.com/cilium/cilium/1.7.2/install/kubernetes/quick-install.yaml
查看安裝結果
# kubectl -n kube-system get pods --watch
NAME READY STATUS RESTARTS AGE
cilium-operator-774d8f6d67-8mht6 1/1 Running 0 2m24s
metrics-server-6d684c7b5-qjmd5 1/1 Running 0 2m55s
local-path-provisioner-58fb86bdfd-xmx2r 1/1 Running 0 2m55s
helm-install-traefik-wx88l 0/1 Completed 0 2m55s
cilium-md26c 1/1 Running 0 2m24s
svclb-traefik-g4mq5 2/2 Running 0 55s
coredns-6c6bb68b64-gtqm5 1/1 Running 0 2m55s
traefik-7b8b884c8-79v79 1/1 Running 0 55s
部署連接測試
該步驟部署一系列deployment,這些deployment將使用各種連接路徑相互連接。連接路徑包括有/無service負載平衡以及各種網絡策略組合。pod名稱表示連接變量,readiness和liveness gate表示測試的成功或失敗:
kubectl apply -f //raw.githubusercontent.com/cilium/cilium/1.7.2/examples/kubernetes/connectivity-check/connectivity-check.yaml
安裝Hubble
Hubble是一個完全分佈式的網絡和安全的觀測平台,用於雲本地工作負載。它構建在Cilium和eBPF之上,可以通過完全透明的方式深入了解服務以及網絡基礎設施的通信和行為。Visit Hubble Github page。
安裝helm
wget //get.helm.sh/helm-v3.1.2-linux-amd64.tar.gz
tar -zxvf helm-v3.1.2-linux-amd64.tar.gz
mv linux-amd64/helm /usr/local/bin/helm
安裝Hubble
git clone //github.com/cilium/hubble.git
cd hubble/install/kubernetes
helm template hubble \
--namespace kube-system \
--set metrics.enabled="{dns,drop,tcp,flow,port-distribution,icmp,http}" \
--set ui.enabled=true \
> hubble.yaml
kubectl apply -f hubble.yaml
如果需要通過nodeport的方式訪問,可以創建如下service,訪問//{$Externap_IP}:32000即可看到相關的策略
apiVersion: v1
kind: Service
metadata:
name: hubble-ui-node
namespace: kube-system
spec:
ports:
- name: http
port: 12000
protocol: TCP
targetPort: 12000
nodePort: 35000
selector:
k8s-app: hubble-ui
sessionAffinity: None
type: NodePort
Cilium的網絡模型
同節點訪問
同節點內部的容器之間的連通性依賴內核協議棧二層轉發和BPF程序,不會經過像OVS或Linux bridge這樣的二層設備。這部分功能由Cilium Agent負責,使用BPF規則進行流量的管控。簡單示意圖如下:
官方示意圖如下:
可以看到,同節點的容器之間通信直接走BPF規則即可;不同節點的容器的通信需要通過各個節點上的cilium_host接口進行轉發
容器和所在節點的通信走節點內部的三層路由和BPF轉發,BPF程序連接容器的veth pair和它的網關設備。如下路由中,將cilium_host作為容器的默認網關。容器和容器所在的節點的通信需要經過cilium_host接口
容器:
# ip route
default via 10.42.0.79 dev eth0 mtu 1450
10.42.0.79 dev eth0 scope link
節點:
[root@iZt4n3pfp2quf7ld2pln01Z ~]# ip route
default via 172.21.239.253 dev eth0
10.42.0.0/24 via 10.42.0.79 dev cilium_host src 10.42.0.79 mtu 1450
10.42.0.79 dev cilium_host scope link
169.254.0.0/16 dev eth0 scope link metric 1002
172.21.224.0/20 dev eth0 proto kernel scope link src 172.21.239.198
cilium_host涉及的iptables表項如下,可以看到對源地址為127.0.0.1的報文進行了SNAT。
Chain CILIUM_POST_nat (1 references)
pkts bytes target prot opt in out source destination
1977 119K MASQUERADE all -- * !cilium_+ 10.42.0.0/24 !10.42.0.0/24 /* cilium masquerade non-cluster */
1521 95679 RETURN all -- * !cilium_host 0.0.0.0/0 0.0.0.0/0 /* exclude non-cilium_host traffic from masquerade */
0 0 ACCEPT all -- * * 0.0.0.0/0 0.0.0.0/0 mark match 0xa00/0xe00 /* exclude proxy return traffic from masquarade */
0 0 SNAT all -- * cilium_host !10.42.0.79 !10.42.0.0/24 /* cilium host->cluster masquerade */ to:10.42.0.79
0 0 SNAT all -- * cilium_host 127.0.0.1 0.0.0.0/0 /* cilium host->cluster from 127.0.0.1 masquerade */ to:10.42.0.79
跨節點網絡
下面是使用Host L3進行跨節點通信的流程圖
下面是使用vxlan進行跨節點通信的流程圖
Cilium cli
使用Cilium後,不會再使用kube-proxy,它會從Kubernetes API服務器獲得Service信息,並存入BPF。可以使用cilium命令行查看相關的信息。如使用# cilium node list
查看當前的node節點信息,使用# cilium service list
查看service信息等。對於策略的獲取,可以通過命令行# cilium policy get
,也可以通過Hubble UI查看,如下:
參考: