《SeleniumBasic 3.141.0.0 – 在VBA中操作瀏覽器》系列文章之一:SeleniumBasic的下載和部署
Selenium是一種非常流行的瀏覽器和網頁自動化技術,開發人員可以使用C#、Java、Python等語言來操作Chrome、Firefox等瀏覽器。
VBA語言可以直接操作訪問Microsoft Internet Explorer(IE)瀏覽器,但是IE瀏覽器的問題很多,最近不再受歡迎。
Chrome等瀏覽器有著速度快等優勢,使用群體非常多。習慣用VBA編程的人們如何自動操作IE以外的瀏覽器呢?
在網上可以找到一個SeleniumBasic v2.0.9.0的軟體,作者是Florent BREHERET。在電腦中安裝了該軟體後,可以在VBA、VBS、VB6等Basic系列的語言中調用Selenium的功能。
然而,在很多電腦上會出現「無法創建對象」、「自動化錯誤」等異常,再加上這個軟體一直沒更新,於是最近我自己從頭開發了SeleniumBasic 3.141.0.0,以下簡稱V3。
在該系列文章中我會陸續講解工具的部署、Selenium環境的搭建、使用VBA操作瀏覽器的基本語法、Selenium中高級技巧等知識。
友情提示:Selenium是一項繁瑣而強大的技術,如果你沒足夠的耐心,請繞道,以免浪費您的時間。
SeleniumBasic 3.141.0.0
- 支援的程式語言:VBA、VB6、VBS等。同時支援32和64位VBA。
- 支援的瀏覽器:Chrome、Firefox、Microsoft Edge、Internet Explorer、Opera、Safari、QQ和360等瀏覽器。
- 主要功能:創建瀏覽器、定位元素、窗口和框架切換等最常用功能。
- 適用人群:熟悉VBA方面的語言,有Selenium部署和開發經驗更佳。
接下來講一下V3的構成和部署方法。首先到騰訊微雲找到我分享的SeleniumBasic.zip,下載並解壓到方便找到的本地文件夾中(別放在桌面)。
會看到8個文件,功能如下:
- SeleniumBasic.dll和SeleniumBasic.tlb:這兩個是類型庫,提供了VBA環境中用到的SeleniumBasic命名空間中的對象、成員。在VBA工程中需要添加引用SeleniumBasic.tlb。
- RegAsm.bat:用於註冊dll,因為釋放到你電腦以後,只是把文件放到磁碟上了,要讓dll和tlb發揮作用,還需要向註冊表中寫入內容。因此需要用管理員許可權運行該bat文件。
- UnRegAsm.bat:反註冊。當你不再需要V3時,用管理員許可權運行這個bat,可以從註冊表中移除寫入的內容。相當於軟體的卸載。
- WebDriver.dll和WebDriver.Support.dll:.NET語言所需的動態鏈接庫,V3也依賴這兩個庫,因此也是必需的。
- Config.xml:配置文件。由於Selenium可以創建多種類型的瀏覽器,具體是啟動Chrome還是Firefox,由這個配置文件來指定。該文件中指定了瀏覽器的安裝位置、驅動文件的位置、是否隱藏cmd窗口等。
我的壓縮包中提供的Config.xml,可以用記事本打開查看。其中默認輸入了4個瀏覽器的配置資訊,需要注意的是V3創建瀏覽器時只讀取最上面第一個browser的資訊。
例如Chrome瀏覽器,binarylocation屬性指明了瀏覽器的安裝位置,driver的name和directory指明了驅動文件的位置等,如果某些屬性不明確,可以設置為空字元串。
<config> <browser name="Chrome" binarylocation="C:\Program Files (x86)\Google\Chrome\Application\chrome.exe"> <driver name="chromedriver.exe" directory="E:\Selenium\Drivers"/> <options HideCommandPromptWindow="true"/> </browser> <browser name="Firefox" binarylocation="C:\Program Files\Mozilla Firefox\firefox.exe"> <driver name="geckodriver.exe" directory="E:\Selenium\Drivers"/> <options HideCommandPromptWindow="true"/> </browser> <browser name="Edge" binarylocation=""> <!--"msedgedriver.exe" rename to "MicrosoftWebDriver.exe"--> <driver name="MicrosoftWebDriver.exe" directory="E:\Selenium\Drivers"/> <options HideCommandPromptWindow="true"/> </browser> <browser name="IE" binarylocation=""> <driver name="IEDriverServer.exe" directory="E:\Selenium\Drivers"/> <options HideCommandPromptWindow="true"/> </browser> </config>
了解了以上概念以後,接下來動手進行實際操作。
- 第一步:註冊dll
選中regasm.bat,右鍵菜單選中以管理員身份運行。稍後彈出一個黑色窗口,提示註冊成功。
- 第二步:VBA中添加引用
啟動Excel或其他Office組件,打開VBA編程環境,點擊菜單「工具/引用」,在引用對話框中點擊「瀏覽」。
彈出的選擇文件對話框中,過濾器換成「所有文件」,找到前文所述的SeleniumBasic.tlb,打開。
這樣,引用中就出現了一條SeleniumBasic
VBA中按下F2,對象瀏覽器中切換到SeleniumBasic,可以看到很多類型和方法。
該類型庫包含3個主要對象
WebDriver:瀏覽器對象
WebElement:網頁元素對象
SelectElement:網頁中特指select標籤形成的下拉框元素
- 第三步:書寫程式碼 在VBA插入一個標準模組,頂部聲明公有變數WD,下面的程式演示了定位百度一下的關鍵字文本框和按鈕。
Public WD As SeleniumBasic.WebDriver Sub Baidu() On Error GoTo Err1 Set WD = New SeleniumBasic.WebDriver WD.Start WD.URL = "//www.baidu.com" Dim form As SeleniumBasic.WebElement Dim keyword As SeleniumBasic.WebElement Dim button As SeleniumBasic.WebElement Set form = WD.FindElementById("form") Set keyword = form.FindElementById("kw") keyword.Clear keyword.SendKeys "好看影片" Set button = form.FindElementById("su") button.Click Debug.Print WD.Title, WD.URL Debug.Print WD.PageSource MsgBox "下面退出瀏覽器。" WD.Quit Exit Sub Err1: MsgBox Err.Description, vbCritical End Sub
程式碼雖然寫完了,但是。。。
在您的電腦上運行上述過程,估計出不來瀏覽器,也看不到百度一下。別急,這是因為上面的操作只是把編碼這一側搞定了,瀏覽器和驅動,以及配置文件還沒設置好呢,下節課再見。