用docker搭建selenium grid分散式環境實踐之路
- 2020 年 3 月 26 日
- 筆記
最近需要測試zoom影片會議,同時模擬100個人加入會議。經過了解,zoom提供了直接通過url鏈接加入會議的方式(只能通過chrome瀏覽器或者FireFox瀏覽器,因為用的協議是webrtc)。
順著這個思路考慮可以通過Selenium自動化,同時啟動多個瀏覽器進程,每個進程代表一個影片會議用戶,達到模擬多方會議的效果。不過有以下兩個難點:
- 需要多個chrome瀏覽器進程同時存活,在電腦上啟動一個chrome瀏覽器進程差不多要消耗220M左右。
- 影片會議的音頻和影片源的問題。
針對影片會議的音頻和影片源的問題,chrome瀏覽器有比較好的支援,在Selenium腳本中初始化Chrome瀏覽器的參數中,只需要加入如下配置:
chrome_options.add_argument("--use-fake-ui-for-media-stream") chrome_options.add_argument("--use-fake-device-for-media-stream")
就能在加入影片會議之後,使用虛擬的影片和音頻。不過有個問題需要考慮,這個虛擬影片和真實的影片會議中的影片品質看上去是有差距的,會不會對測試結果造成影響,我們這裡暫時不討論這個話題。
現在唯一比較頭疼的是怎麼實現100個chrome瀏覽器進程,可能你會覺得,這不就是資源問題嗎?加伺服器不就搞定了?!但是假如有了伺服器資源之後,怎麼做任務調度呢?好在有Selenium Grid,它是Selenium的三大組件,專門用來執行分散式測試。
於是基於Selenium Grid設計了個測試方案:
- 將某台伺服器作為Hub,也就是master
- 將剩下的機器作為node,註冊到hub機器。
- 本地採用多進程執行Selenium自動化腳本(我使用python語言實現的)。
按照上面的設計思路,理論上是能夠模擬出100人同時加入會議的。接下來我們就正式開始用docker搭建Selenium Grid分散式環境的探索之路。
selenium jar包直接啟動節點
其實,最開始我是直接使用jar包啟動節點的,起幾個節點還能接受,但是節點多了之後會特別麻煩,比如:想重啟下節點,則需要手動全部kill掉,然後再一個個啟動。
只要是手動重複的工作,就能腳本化。於是我寫了兩個shell腳本,一個腳本是根據傳參啟動對應數量的節點;另一個腳本是將所有的節點進程全部kill掉。主要腳本如下圖所示:
雖然用腳本也能輕鬆的執行,但還是不方便。首先啟動節點後,會增加好多java進程,並且沒辦法查看單個節點的日誌,因為所有節點的日誌都同時在控制台列印。於是考慮用docker來管理Selenium grid節點。
用docker命令直接啟動
在github上有現成的鏡像: https://github.com/SeleniumHQ/docker-selenium 。然後說明文檔中也列出了所有可用的鏡像名稱,因為我主要使用chrome瀏覽器,所有安裝了: selenium/hub 、 selenium/node-chrome、 selenium/node-chrome-debug 三個鏡像,其中selenium/node-chrome-debug鏡像會啟動一個VNC Server,在腳本執行過程中,本地可以連上VNC Server,通過介面查看伺服器的腳本執行情況。 使用命令:
$ docker pull selenium/hub $ docker pull selenium/node-chrome $ docker pull selenium/node-chrome-debug
啟動hub的命令如下:
$ docker run -d -p 4444:4444 -e GRID_MAX_SESSION=100 --name hub selenium/hub
啟動本地節點(hub和node在一台機器上)的命令如下:
$ docker run -d -p 5555:5555 -e NODE_MAX_INSTANCES=5 -e NODE_MAX_SESSION=5 --shm-size=2g --link hub:hub --name node1 selenium/node-chrome
啟動遠端節點(hub和node不在一台機器上)的命令如下:
$ docker run -d -p port:5555 -e HUB_HOST=remote_ip -e HUB_PORT=remote_port -e REMOTE_HOST=http://ip:port -e NODE_MAX_INSTANCES=5 -e NODE_MAX_SESSION=5 --shm-size=2g --name node1 selenium/node-chrome
這裡需要注意,網上很多教程提供的啟動命令都是hub和node在一台機器上,假如需要hub和node在不同的機器上,按照網上的教程,雖然啟動不會報錯,但是節點和hub之間的網路是不通的。
不過直接使用docker命令雖然可以單獨查看單個節點的日誌,但是卻和使用jar包的方式面對一樣的問題:啟動多個節點,非常不方便,需要手動執行多次命令。有沒有更好的方案呢?當然有,可以使用docker-compose對docker容器進行整合。
docker-compose 啟動
docker compose是docker的一個命令行工具,用來定義和運行多個容器組成的應用。相當於我們可以將多個docker命令放到一個文件里,然後由docker-compose一鍵執行。
同樣的,也需要分兩種情況:
Hub和node在一台機器上
可以使用如下的配置文件docker-compose.yml
version: "3" services: selenium-hub: image: selenium/hub container_name: selenium-hub ports: - "4444:4444" environment: - GRID_MAX_SESSION=50 - GRID_TIMEOUT=900 - START_XVFB=false chrome: image: selenium/node-chrome volumes: - /dev/shm:/dev/shm depends_on: - selenium-hub environment: - HUB_HOST=selenium-hub - HUB_PORT=4444 - NODE_MAX_INSTANCES=5 - NODE_MAX_SESSION=5
然後在控制台執行命令:
$ docker-compose up -d //-d表示在後台運行
如果想同時啟動多個節點該怎麼辦呢?非常簡單:
$ docker-compose up -d --scale chrome=num //num是要啟動節點的數量
如果想關閉節點,可以執行如下命令:
$ docker-compose down
Hub和node不在一台機器上
可以使用如下配置文件docker-compose.yml
version: "3" services: # selenium-chrome-1 selenium-chrome-node-1: image: selenium/node-chrome volumes: - /dev/shm:/dev/shm ports: - "5556:5555" restart: always stdin_open: true environment: HUB_HOST: hub_ip HUB_PORT: 4444 NODE_MAX_INSTANCES: 5 NODE_MAX_SESSION: 5 REMOTE_HOST: http://節點ip:5556 GRID_TIMEOUT: 60000 shm_size: "2gb" # selenium-chrome-2 selenium-chrome-node-2: image: selenium/node-chrome volumes: - /dev/shm:/dev/shm ports: - "5555:5555" restart: always stdin_open: true container_name: node1 environment: HUB_HOST: hub_ip HUB_PORT: 4444 NODE_MAX_INSTANCES: 5 NODE_MAX_SESSION: 5 REMOTE_HOST: http://節點ip:5555 GRID_TIMEOUT: 60000 shm_size: "2gb" # selenium-chrome-3 selenium-chrome-node-3: image: selenium/node-chrome volumes: - /dev/shm:/dev/shm ports: - "5557:5555" restart: always stdin_open: true environment: HUB_HOST: hub_ip HUB_PORT: 4444 NODE_MAX_INSTANCES: 5 NODE_MAX_SESSION: 5 REMOTE_HOST: http://節點ip:5557 GRID_TIMEOUT: 60000 shm_size: "2gb" # selenium-chrome-4 selenium-chrome-node-4: image: selenium/node-chrome volumes: - /dev/shm:/dev/shm ports: - "5558:5555" restart: always stdin_open: true environment: HUB_HOST: hub_ip HUB_PORT: 4444 NODE_MAX_INSTANCES: 5 NODE_MAX_SESSION: 5 REMOTE_HOST: http://節點ip:5558 GRID_TIMEOUT: 60000 shm_size: "2gb" # selenium-chrome-5 selenium-chrome-node-5: image: selenium/node-chrome volumes: - /dev/shm:/dev/shm ports: - "5559:5555" restart: always stdin_open: true environment: HUB_HOST: hub_ip HUB_PORT: 4444 NODE_MAX_INSTANCES: 5 NODE_MAX_SESSION: 5 REMOTE_HOST: http://節點ip:5559 GRID_TIMEOUT: 60000 shm_size: "2gb"
啟動節點的命令是(前提是hub需要提前啟動):
$ docker-compose up -d
關閉節點的命令是:
$ docker-compose down
遺留問題
按照我上面這種方式搭建Selenium Grid環境,本地節點可以正常執行,但是遠端的節點卻經常超時,不過從http://hub_ip:4444/grid/console介面上看到的節點網路全部都是通的。
之前查過一些資料,貌似需要使用Docker Swarm,它是一個docker集群管理工具, 將若干台 Docker 主機抽象為一個整體,並且通過一個入口統一管理這些 Docker 主機上的各種 Docker 資源 。不過目前還沒研究它,後面如果用Docker Swarm有結論之後,我再寫文章同步給大家。
總結
用docker搭建selenium grid分散式環境,非常方便,基本是一行命令就能啟動或者關閉節點。希望我這篇文章能給大家提供一些思路,幫助大家在平時的工作中解決一些問題。
還是那句話,任何技術,只要能幫你解決實際的問題,就是好的技術!