Excel竟然還有這種操作:自動同步網站數據
有時我們需要從網站獲取一些數據,傳統方法是通過複製粘貼,直接粘到 Excel 里。不過由於網頁結構不同,並非所有的複製都能有效。有時即便成功了,得到的也是「死數據」,一旦後期有更新,就要不斷重複上述操作。
能否製作一個隨網站自動同步的 Excel 表呢?答案是肯定的,這就是 Excel 里的 Power Query 功能。
1. 打開網頁
下圖這個網頁,是中國地震台網的官方頁面(//news.ceic.ac.cn/)。每當有地震發生時,就會自動更新到這裡。既然我們要抓取它,就要首先打開這個網頁。
2. 確定抓取範圍
打開 Excel,點擊「數據」→「獲取數據」→「自其他源」,將要抓取的網址粘貼進來。此時 Power Query 會自動對網頁進行分析,然後將分析結果顯示在選框內。以本文為例,Power Query 共分析出兩組表格,點擊找到我們所需的那個,然後再點擊「轉換數據」。片刻後,Power Query 就會自動完成導入。
▲建立查詢,確定抓取範圍
3. 數據清洗
導入完成後,就可以通過 Power Query 進行數據清洗了。所謂「清洗」說白了就是一個預篩選過程,我們可以在這裡挑選自己所需的記錄,或者對不需要的列進行刪除與排序操作。其中右鍵負責刪除數據列,面板中的「保留行」用來篩選自己所需的記錄。清洗完成後,點擊左上角的「關閉並上載」即可上傳 Excel。
▲數據「預清洗」
4. 格式調整
數據上傳 Excel 後,可以繼續進行格式化處理。這裡的處理主要包括修改表樣式、文字大小、背景色、對齊、行高列寬,添加標題等等,通俗點說就是一些美化操作,最終我們便得到了下圖這個表。
▲對表格進行一些美化處理
5. 設置自動同步間隔
目前表格基礎已經完成,但和複製粘貼一樣,此時得到的仍然只是一堆「死數據」。想讓表格自動更新,需要點擊「查詢工具」→「編輯」→「屬性」,並勾選其中的「刷新頻率」和「打開文件時刷新數據」。處理完成後,表格就可以自動同步了。
▲設置內容自動同步
註:默認情況下數據刷新會導致列寬變化,此時可以點擊」表格工具「→「外部表數據」→「屬性」,取消「調整列寬」前面的複選框解決這個問題。
▲防止更新時破壞表格式
寫在最後
這個技巧很實用,特別是在製作一些動態報表時,能夠大大減輕人工提取所產生的麻煩。好了,這就是本期要和大家分享的一個小技巧,是不是很有用呢!