【必殺】免費體驗 PowerBI Premium 旗艦版
- 2019 年 10 月 6 日
- 筆記

本文8K字,60圖,需要30分鐘閱讀,1天實踐。
前言
PowerBI 戰友聯盟,是中國範圍內由 PowerBI 從業者發起的專業學習現代商業智能的組織,我們以 PowerBI 為主題研究如何幫助企業和個人提升數字化生產力,面向 PowerBI 的國際最前沿資訊和技術,PowerBI Premium 作為 PowerBI 的企業級扛把子產品,必然要研究透徹,而可惜的是:
每月 3W 元RMB,讓絕大多數個人和企業無法體驗。而我們當然要想辦法來體驗這個終級事物。
本文介紹如何免費體驗和使用 PowerBI Premium,並滿足:
- 免費體驗(通過領取200美元的免費額度)
- 所有 PowerBI Premium 能力的體驗
- 個人也能體驗(學會)
- 不需要任何代碼
本文特別適合:
- PowerBI 發燒友
- 企業商業智能負責人
- 試圖推進企業數字化轉型的決策人
下面詳細介紹,如果希望體驗,您需要至少一個整天來跟隨操作和對照理解,以獲得沉浸式的體驗。
有人說可以永久免費嗎?Premium要佔有微軟的雲端大量資源,這種佔了資源不想給錢的價值觀並不提倡。尤其是很多代表企業的個人。
概述
PowerBI Premium 很多人已經聽過,但都因為其價格而望而卻步,很多個人都希望天下都是免費的午餐,作為微軟也確實為個人提供了永久免費的分析工具 PowerBI Desktop 以及 PowerBI Service 免費賬號,然而,當個人代表企業的時候,那就不是個人的行為,而是企業的行為,往往包括提出這樣的需求:
- 可以處理上億(甚至更大的)數據嗎?
- 可以整合所有數據分析在一個集中的平台嗎?
- 可以增量更新數據嗎?
- 可以性能檢測調優嗎?
- 可以分配更多的內存和算力來計算模型嗎?
- 可以整合機器學習和AI功能嗎?
- 可以免費嗎?
微軟的答案是:ALLEXCEPT( 能 , 除了最後一條 )。
作為身在企業的數據分析師,可能您和我一樣,有一顆希望幫助企業改進的心,但畢竟我們可以使用的資源是有限的,在業務和老闆沒有見到和感受到 PowerBI 的變革力量前,很難推廣,而本文將幫助所有人可以免費試用 PowerBI Premium 的能力,讓您親身感受並演示給你的老闆和業務夥伴。
揭秘 PowerBI 戰略
先開門見山給出一句惡狠狠的話:PowerBI的能力幾乎代表了現代商業智能的能力。如果你要零成本用PowerBI,沒有問題,下載安裝建模發佈分享使用。
先開門見山給出一句惡狠狠的話:沒有用過PowerBI Premium,就不可能真正理解PowerBI到底是啥。如果你要應對企業級的複雜挑戰,沒有問題,只要不差錢,那你上Premium就對了。
很多人說會用PowerBI,實則不然,PowerBI是一個非常龐大的體系,承載了微軟在數據領域巨大的遠景。這個遠景,PowerBI教父已經在PASS大會說的非常清楚,這個遠景是由PowerBI Premium來承載的,尤其是沒有體驗過的人也無法理解超越時代的新東西。
PowerBI教父Amir,在很多年前就相當清晰的構建了現代商業智能的宏大設計,而能在微軟這麼大的體系推進PowerBI並達到目前的程度,真的很值得欽佩,作為微軟商業智能企業級扛把子旗艦產品的SSAS,已經在PowerBI的體系下了,PowerBI已經成為了微軟企業級扛把子旗艦產品SSAS的超集(意思是包含SSAS的所有功能,並有更多提升),這些多年來的基礎,將支撐PowerBI的終極遠景:
這裡看出 PowerBI 戰略的三大任務:
- 自助BI和企業BI的統一
- 承載所有數據準備的數據湖
- AI和BI的統一
自助BI和企業BI的矛盾與統一
自助BI和企業BI往往形成一種矛盾:
- 自助BI靠業務;企業BI靠IT;
- 自助BI要效率;企業BI要性能;
- 自助BI要靈活;企業BI要統一;
- 自助BI要自由;企業BI要規則。
微軟商業智能經過10多年的演化,已經逐漸解決了這些矛盾並加以統一,那就是:將基於世界標準的Excel的簡單與將基於SSAS的強大,取其平衡,用內置DAX引擎的PowerBI配合相關技術形成一個體系作為SSAS的超集面向企業及企業內的所有個人提供一站式終極商業智能能力。
簡單理解到底什麼是 PowerBI Premium
首先要理解到底什麼是 PowerBI Premium,這個真的是一個難題,甚至連微軟自己的人都很難說清楚這件事,下面給出一個近似的公式來幫助大家理解:
PowerBI Premium 相當於以下內容的合集:
- 桌面工具(PowerBI Deskto)
- 雲端工具(PowerBI Service)
- 獨立計算資源
- PowerBI 報表服務器
- 企業級的特殊功能
這裡不難通過 PowerBI 官方文檔得知,很多對 PowerBI Premium 的能力的開放都是基於獨立計算資源的,而為了獲得獨立計算資源,其本質是可以在Azure中開啟一個獨立的給到PowerBI的資源。 因此,我們的問題就轉化為如何使用一塊Azure中獨立的計算資源。
國際版 Azure 提供一定的免費額度
我們利用國際版 Azure 提供的免費額度,來做這件事即可,其流程非常簡單,只需要在國際版 Azure 中註冊就可以享有這些免費額度。
進入:www.azure.com,然後可以免費開始使用:
微軟提供了200美元(約1300元RMB)的額度,這樣就可以利用這些額度來體驗Azure中的各種應用,當然也就包括本文所說的 PowerBI Premium,請再看下前面對 PowerBI Premium 的解釋。繼續操作:
然後你就得到了價值200美元的Azure資源費用。接下來就是在Azure中啟用獨立計算資源的問題了。這裡Azure採用一項叫做Power BI Embedded的獨立計算資源。
使用PowerBI嵌入式的A4容量級別
這裡簡單介紹流程,原因就不再贅述:
- 在Azure中創建一個資源組
- 在資源組中創建一個PowerBI嵌入式的A4容量
- 選擇地區時,優先使用東亞香港以保持一個比較近的物理位置
選擇 A4 容量級別:
這裡解釋下原因:只有達到一定級別,才能支持PowerBI的雲端所有能力,如分析報表,AI等。創建好以後可以看到:
這是可以隨時調整的,但為了試用PowerBI Premium的能力,應該選擇至少 A4 級別。一個月接近 4W RMB,個人是真的用不起的,幸好可以試用。
這樣就好了。可以進入PowerBI來設置了。
開啟了PowerBI高級版
在完成上述內容後,在PowerBI中就可以看到:
這裡可以看出,我們實際上並沒有購買 PowerBI Premium,而僅僅是開啟了 Azure 中的獨立計算資源,這在 PowerBI 看來,本質是一樣的,所以它認為你購買了 PowerBI Premium,才彈出這樣的歡迎界面,以彰顯鑽石級的尊貴企業級別。
將工作區裝入高級容量
在閱讀本文之前,大家都知道PowerBI的工作區,那就像是共享經濟,微軟把全世界的小白和免費用戶以及pro用戶都裝入一個共享的超級大內存,就像1W人共享1K G內存,總有很多人不同時登陸,這樣PowerBI就形成了一個共享經濟。
我們的工作區默認就在這樣的共享生態下,處於像地鐵一樣的人人可用的環境下。而在我們購買了高級容量後,就像是我們打車了,現在只要告訴說,哪個工作區(乘客)可以不坐地鐵,而改做尊貴的專車呢,只需要簡單配置,如下:
這裡就將這個工作區裝入了位於東亞香港地區國際版Azure的專車中。如果使用了新的工作區風格(準確講,底層物理結構不同了),建議使用新的工作區風格(模式),則有:
我們將這個 Excel120 工作區放入了專用的容量,也即是獨立的計算資源,這個資源的地址就是工作區連接,可以在DAX Studio之類的工具進行連接:
這足以說明這是專屬於你的專車了,因為只有專車才讓你連,地鐵是不讓你連接的。然後就可以看到令人激動的鑽石了:
我們為工作區(新工作區風格)還可以設置LOGO,更加有個性,以彰顯我們的高級調性。標記鑽石的工作區就會使用在Azure中已經初始化的A4獨立計算資源。
用DAX Studio進行性能監測
PowerBI Premium 管理門戶
默認情況下,進入專車的工作區僅僅是在默認計算能力上增強了,但工作區內是仍然無法使用 PowerBI 體系的高級功能的,如:機器學習,AI,分頁報表都算是高級功能,默認並不能使用。
為了可以使用 PowerBI體系 的高級功能,必須滿足兩個條件:
- PowerBI 高級專有容量的級別,也就是說,需要的不是僅僅是專車,而是高級專車。
- 主動對 PowerBI體系進行 配置,啟用高級特性。
這也就解釋了為什麼我們一開始說在 Azure 中要使用 A4 級別的高級容量,具體的等級劃分和功能特性說明可參考微軟官方文檔。
現在,我們就來設置高級專車。我們進入 PowerBI 管理門戶(必須是PowerBI管理員),可以看到:
【購買】二字赫然在此,可惜個人真的買不起啊,因此我們點擊【Power BI Embedded】就可以了:
哈哈,有了。這是因為我們登錄註冊Azure和管理PowerBI的是同一賬號。
在容量設置中可以看到:
然後可以開啟工作負載和數據流等高級企業級服務:
值得強調的是,如果你用了低於 A4 級別的容量就會是上面的樣子,看不到分頁報表的高級功能,如果是 A4 級別的容量,就可以看到:
這樣,就可以在 PowerBI 中承載企業級分頁報表了。來看看健康產業是幹嘛的:
原來是性能監控。這個翻譯【健康產業】也是醉了。至此,我們就徹底解鎖了 PowerBI 的所有高級能力。
從 PowerQuery 到 數據流
Power Query 是一套非常簡單的工具,由於其設計機制,它可以將對數據的操作以及操作的流程完全映射為對應界面按鈕的操作,Power Query 的優勢和劣勢很清楚:
- Power Query 易於操作,可以由業務人員完成。
- Power Query 沒有可以落地的中間平台(莫不是傳說中的企業中台)。
Power Query 的運行環境決定了它可以處理的工作,讓我們一起來看看企業級的 Power Query會是怎樣的呢。
理解數據流就可以構建企業中台
數據流,是在整個PowerBI體系中非常重要的環節,它是統籌整合企業內所有數據的工具,數據流是這樣的:
如果不夠直觀,再來看:
如果還不夠直觀,那麼讓數據流和傳統ETL對比一下:
可以看出一件事,那就是 Power Query 作為了數據流的關鍵組件,已經承載了戰略級任務。
熟悉 PowerBI 的夥伴都知道一件事情,在 PowerBI 中,使用編輯查詢(也就是 Power Query)建立的一種端到端的通道,它並不能在中間把數據落地,這樣就導致會產生很多重複,以及性能問題,對於個人的報表可能還好,而對於解決企業級的統一全局式的數據流動,是無法應對的。
微軟基於 Azure 構建了成為 Azure Data Lake Gen 2 (Azure 第二代數據湖),數據湖,顧名思義,就是為了讓數據流入的海量存儲體,它同時可以為機器學習以及AI提供數據基礎。數據流是通過 Power Query 定義的,而數據流就像是一條條的小溪,匯聚進入其他小溪,最終進入數據湖,而這僅僅是剛剛開始。
在數據流中落地的對象,叫做:實體,顧名思義,他是落地了的實實在在的數據。現在就一起來展開實踐。
創建數據流
在 PowerBI 雲端選擇工作區,並點擊創建,選擇數據流:
可以看出,要麼直接從數據流構建最終的實體,要麼從其他數據流構建的實體出發再進行進一步操作。
這裡點擊【添加新實體】,可以看到:
這和 Power Query 可以獲得的數據源真的完全一樣,這樣就可以將 Power Query 的目標結果導向雲端。這裡建立一個示例:
由於數據來自於本地,必須使用數據網關,這些在【PowerBI商業智能基礎系列】的課程已經非常詳細的說明,此處就不再贅述了,可以看到:
完成。
構建數據實體 – 實實在在的存在
鏈接的實體 – 用已經做好的實體
我們使用【訂單】來提取最後的刷新日期:
這裡注意,如果是在PowerBI Desktop中:
- 訂單作為查詢,會從數據源加載一遍數據(訂單數據)
- 最後刷新日期作為查詢,會從數據源加載一遍數據(訂單數據)
這在企業級是不適用的,必須可以存儲中間環節,可以注意這裡的【最後刷新日期】有一個閃電的標記,它表示基於已經存在的實體構建,夠快,夠強。
設置增量刷新
當數據流從本地刷新數據,必然可能涉及到大量數據,所以必須提供增量刷新的能力,如下:
這樣,我們每次的定時刷新只會刷新最近60天的數據。
直接使用機器學習模型
在構建好實體和增量刷新以外,我們可以直接針對實體進行機器學習,非常簡單:
我們可以利用已有的機器學習模型,或者單獨構建,這塊我們會在未來的內容中說明。大家只需要知道這裡可以機器學習就好。
基於數據流的數據流
我們再來構建另一種數據流:
這種數據流選擇從鏈接的實體進行。我們選擇剛剛構建的數據流中的兩個實體:
然後建立一個合併查詢,就像在Power Query中完全一樣:
製作聚合數據:
形成了聚合的數據:
可以看到,這樣就有了一個叫【產品訂單】的被聚合過的數據。不難發現:
- 產品 和 訂單 作為實體,只存在一份。
- 產品訂單 是基於兩個實體進行處理後得到的聚合數據。
- 這非常適合有效降低數據量被提供給PowerBI作為數據源。
問題來了:如果【產品訂單】依賴的【產品】和【訂單】中的數據發生了變化,怎麼辦?
形成級聯數據流
我們回到數據流,對【Excel120】這個數據流點擊刷新,可以觀察到【匯總數據流】也會跟着自動刷新:
這是為什麼呢?
級聯數據流在這裡是非常重要的概念,當【Excel120】這個數據流刷新的時候,由於【匯總數據流】是依賴於此的,因此【匯總數據流】就會自動刷新。這正如PowerBI教父Amir所言:」這就像Excel,當Excel的一個單元格值變化時,所有引用該單元格的Excel數據都會重新計算並得到新值。「
而級聯數據流就像在企業中把所有的數據都當成了數據單元,形成彼此的依賴和引用,當底層數據流發生變化時,依賴於此的數據流也會由於級聯關係,而發生連鎖反應,這個鏈條連綿不絕,形成了終極的企業級數據流層次結構。
在數據流中集成AI功能
數據流中有數據,我們希望對數據進行機器學習或者AI都可以,這裡再來演示AI的能力:
識別客戶的語言:
結果如下:
如果你的餐廳有外國人來就餐,那麼都可以識別。
再來識別客戶評價所反映的客戶的心情,也就是滿意度的一種近似表示:
結果如下:
可以看出,上述使用AI功能的方式,都是通過 Power Query 提供的,可見 Power Query 未來將在整個數據的過程中扮演的角色。
不要試圖代替數據科學家,數據科學家可以通過R或Python編寫機器學習算法並運行在Azure平台,作為高級資深數據分析師應該面向業務,只需要通過 PowerQuery 使用這些算法即可。
PowerBI Desktop 使用數據流進行數據建模
打開PowerBI Desktop,直接獲取數據:
請仔細留意這個數據源的排序,Excel是第一;PowerBI數據集是第二;PowerBI數據流是第三。這已經充分說明問題了。未來,Excel,PowerBI數據集,PowerBI數據流將是非常重要的地位。
然後,不做任何可視化的工作,可以建模或建立度量值,然後發佈。
發佈到享有高級容量的工作區。
形成雲端數據集
此時,這個數據集依賴雲端數據,而這個數據集本身就是一個模型,也等價於:SSAS,CUBE,小型數據倉庫,數據集市,叫什麼都好。從某種意義上,這種模式的不斷擴大,就會形成一個多種數據集的平台。
PowerBI Service 端製作純PowerBI報表
現在要做的事情,就是製作PowerBI報表,這可以直接在數據集上進行操作:
PowerBI Desktop 端製作純PowerBI報表
或者直接從 PowerBI Desktop 端製作純 PowerBI 報表:
選擇我們構建的數據集即可,如下:
可以看出,這裡只有一個純可視化的區域,並顯示實時連接到 Power BI 數據集。
這樣就可以進行可視化的報告設計了。
問題來了,如果模型沒有提供需要的度量值怎麼辦?哈哈,不用怕。
微軟居然在PowerBI的純可視化中提供了新建度量值的能力,這樣既沒有破壞模型,又可以增加自己需要的度量值,可謂:非侵入式設計的典型表現。
總結
至此,我們終於完全概覽了 Power BI Premium 給我們帶來的能力,這裏面由於篇幅和工作量,對於 CDM,第二代數據湖還有企業級分頁報表並沒有深入介紹,這些會在未來的文章中再做介紹。
從數據流到最後展現的整體流程為:
簡單總結如下:
- 通過數據流的能力,將任意數據整合進入企業數據湖。
- 在數據湖中,通過數據流的能力,將數據做任意變換,形成數據實體。
- 數據實體可以經過機器學習訓練模型。
- 數據實體可以經過AI加以豐富。
- 數據實體可以增量加載以加快速度。
- 數據實體在高級容量中以得到加速和專門的算力。
- 數據實體為數據建模提供了公共的基礎。
另外,值得強調的是:
數據準備,數據建模,製作報告三大部分已經徹底解除耦合,專業的人可以做專業的事,可以專門有人負責:梳理數據及制定標準;負責數據建模並編寫DAX;負責製作符合標準的商業可視化報告。對於這三個部分,我們已經提供了非常強大和成熟的課程,這裡就不再贅述。
從而,我們可以看出:PowerBI Premium 非常之兇殘,只要你不差錢,把容量開起來,只當雇了一個年薪50W的IT而已,整個企業的數據全部可以得到集中的整合,並為企業中所有成員提供前所未有的分析能力,對於一個年銷售額達到億級的企業,將銷售額的3%作為IT預算,也就是軍事預算,這實屬標配。
當你的競爭對手,還在用 Excel 做刀時,你完全可以使用 PowerBI Desktop 做槍; 當你的競爭對手,試圖用 普通商業智能 做槍時,你完全可以使用 PowerBI Desktop 做槍,分析服務做炮; 當你的競爭對手,竟敢用 大數據大中台 做啥時,你完全可以使用 PowerBI Premium 做數字軍隊並配備系統化大殺器。
PowerBI Premium,徹底滅了他。當然,您千萬不要做那個被傻傻被滅的企業老闆。
PowerBI Premium,一切才剛剛開始。
可惜的是,居然在中國不能用。
說了半天,微軟在中國竟然並沒有提供 PowerBI Premium 服務,那麼,可以選擇國際版服務,也可以考慮很多可替換的方案,我們在未來的文章中為大家分享。