打破深度學習局限,強化學習、深度森林或是企業AI決策技術的「良藥」
- 2019 年 10 月 4 日
- 筆記
演算法、算力和數據是人工智慧時代的三駕馬車,成為企業賦能人工智慧的動力,但它們自身的特性也為企業和高校在研究和落地應用過程帶來了重重挑戰。比如,訓練演算法的成本高昂,數據從採集、處理到存儲已面臨瓶頸,目前針對演算法的加速晶片已成為硬體開發商的一大趨勢。但問題是,這些加速晶片是否能對不斷適應提出的新演算法?在這些挑戰下,降低演算法成本,加速訓練,推進決策,已成為所以高校、企業共同迫切的需求。
8月31日,英特爾第二期AI實踐者之聲夏令營活動走進南京大學。南京大學人工智慧學院教授俞揚、英特爾(中國)人工智慧行業客戶總監孫宇和創新工場南京國際人工智慧研究院執行院長馮霽圍繞打破理論與實踐的壁壘,助力企業高效應用落地,推動未來人工智慧服務新架構等內容進行了技術分享與探討。
提高演算法效力,打破強化學習落地門檻
機器學習中一個經典的分類是監督學習、非監督學習和強化學習。監督學習是預測的過程,而強化學習即為決策的過程。現在,人工智慧的識別與預測任務已經得到了廣泛落地。但實際應用場景中,如推薦系統其實是一個決策過程,並非預測任務,因此系統僅有識別與預測並不夠,還需要完成大量目標任務,採取一系列動作或行為使之具備決策能力。
南京大學人工智慧學院教授俞揚分享了《強化學習決策》主題演講。他談到基於強化學習技術的人工智慧系統已在圍棋、影片遊戲等領域展示出了可超越人類的決策能力。不過除了可以玩遊戲,強化學習系統是否可以在實際應用中發揮超越人類的決策能力,幫助人們更好的解決問題?
俞揚談到,目前除了在遊戲場景,強化學習難以看到應用成果,這與決策學習演算法的局限性有很大關係,演算法需要和環境進行多次交互,決策過程需要海量樣本,其失敗的代價現實中無法承受,導致其在真實場景中很難落地。
演算法效率如何提高成為該領域一大主流研究問題。經過多方嘗試,南京大學與英特爾合作,將遊戲當做演算法的效力檢驗平台,通過一台伺服器4個CPU48個盒子,用了4天的時間完成了很多強化學習功能,打敗了內置遊戲 AI bot,減少了訓練所需開銷,提高了效率。

零試錯是強化學習在實際場景中落地難的一大門檻。俞揚認為,打破這個門檻需要提高演算法效力,構建一個高精度的模擬器。讓演算法走出虛擬環境,需要上百年,現在我們要把現實事件虛擬化。在真實數據中還原模擬器,在不同環境中實現,產生更多的數據積累,得到泛化能力更強的模擬器。未來,他希望人工智慧的決策能力可以應用於現實場景中。
從軟體到硬體,英特爾助力企業人工智慧落地
夏令營活動現場,英特爾(中國)人工智慧行業客戶總監孫宇以《英特爾人工智慧戰略》為題,向大家介紹了英特爾人工智慧的產品、技術、相關工具以及生態環境,闡述了英特爾人工智慧的發展戰略。

要打破人工智慧與現實的屏障,英特爾廣泛的布局覆蓋至人工智慧應用的各方面。社區、軟體與硬體是戰略布局的三個重要方面。首先,英特爾需要集合各方力量培育新興用例、吸引和培養頂尖人才,來培養生態系統並推動其發展,引領人工智慧發展的前沿;其次,英特爾需要塑造開源軟體堆棧,優化客戶軟體,構建統一的API方便開發者應使用,然後釋放硬體的潛力;最後,英特爾基於廣泛的數據中心基礎架構,交付最佳的人工智慧平台,包含拓展的CPU,完整的產品組合,高集成度的平台。
現在部署一個人工智慧應用過程繁瑣而複雜,從數據收集、處理、分析、訓練、上線、到推理、回饋,各環節架構也不盡相同,需要消耗高昂成本,性價比不高。第二代英特爾®至強®可擴展處理器無論是加速計算、還是決策過程,都顯著提升了性能;同時搭配面向多樣推理的硬體組合,強大的軟體工具,加速開發部署,為企業提供最高效、性價比最好的解決方案。
只有算力的提升是不夠的。算力之上,英特爾也注重計算圍繞的數據,打破數據從產生、處理、到存儲過程的瓶頸,做到更快傳輸、更大存儲、更全的計算。
英特爾還提供了豐富的框架庫套件幫助開發者快速開發與部署。數據核心MKL-DNN,支援各種主流框架,經過優化後,開發者可以直接調用;面向ApacheSpark,有深度學習框架BigDL可以使用,訓練各類人工智慧任務;工具包的一部分——模型優化器OPENVINO,可用於導入經過訓練的模型並將其轉為中建模型。

深度森林技術,神經網路之外的里程碑式探索
創新工場南京國際人工智慧研究院執行院長馮霽圍繞《深度森林技術簡介》進行了主題演講,並向大家介紹創新工場的人工智慧實踐,以及英特爾技術如何幫助企業進行並行訓練與決策。
深度森林是周志華教授在2017 年提出的一項有望探索神經網路技術之外的一項重要技術。在深入理解深度森林技術與應用之前,還要先從深度神經網路講起。馮霽在演講中講到,深度神經網路主要是利用一個多層的可微分的學習器進行模型訓練,但是經過這幾年技術落地的過程發現,深度神經網路並不能解決所有任務,其中一個挑戰就是無法很好的對離散或表格數據進行模型訓練。
用一句話總結深度森林的優勢就是其用不可微分的樹模型,不通過BP訓練,其超參數數目遠少於DNN。以金融風控平台建模為例,目前仍在使用一些不可微分的數據模型。基於對這類問題的分析,對學術界來說,構建一個多層的分離器成為一個重要課題,這在工業應用中也是非常值得探索的問題。
應用方面,通過與螞蟻金服合作構建一個用於判斷交易是否是套現行為的模型,在離散數據下,使用深度森林模型的解決方案比決策樹、深度學習解決方案的效果有所提升。其中,基於深度森林進行分散式學習是一個重要方法。以前大家認為只要深度學習才能進行分散式學習,而目前英特爾提供的一種高性能解決方案是基於CRADIENTBOOSTING進行多層表示學習,如果再將CRADIENTBOOSTING在拓展的CPU上集成,不僅有對表格數據的優秀的計算能力,同時對這類數據還能學習分散式表示,這也成為目前很多金融科技公司最常用的解決方案。
不過,在實際工程中會遇到既有影像數據,也有表格數據的情況,此時需要建立一個混合模型,同時又可以輸出一個決策,這就讓我們在構建過程中,把不同構成單元組合成混合的學習系統,這個系統可以由神經網路構成,也可以由深度森林構成,來支援對不同類型的數據進行建模。

最後他強調,對於深度森林這類較深入的技術,大家還需要考慮數據集性質本身,而在任務中採用基於決策樹為構建單元的模型,可以發揮出立竿見影的效果。
AI實踐者之聲夏令營活動第三期——深圳站活動預告
大數據、AI時代,在實現智慧化轉型的道路上,各行業企業面臨著海量數據處理、機器學習和深度學習技術支撐、高昂計算成本以及技術人才緊缺帶來的挑戰。
金融行業作為目前AI技術落地最重要的行業之一,一直在尋求可以不斷提高效率、降低成本,加強數據隱私保護的生產線,這就需要開發者不斷增長技能,緊跟技術發展,幫助企業解決工程實踐中的挑戰,從而完成轉型之路。為此,英特爾將和平安科技為廣大開發者們準備一場AI技術交流沙龍,幫助開發者們在企業AI轉型中的最新技術,掌握核心技能。
本次技術沙龍,我們將帶領開發者了解AI 技術與區塊鏈技術、聯邦學習技術在金融行業的最新應用,讓開發者們掌握最新的技術與工具,更有英特爾技術專家親自帶領現場開發者進行兩小時的技術實操,助力開發者煉就硬核技能。乾貨滿滿,不容錯過!
掃描二維碼,報名加入 AI 實踐者之聲夏令營,成為 AI 實踐者之一!

重磅嘉賓介紹
平安科技聯邦學習技術部總經理
王健宗

王健宗博士,平安科技聯邦學習技術部總經理,深圳市金融智慧機器人研究中心常務副主任,中國人工智慧開源軟體發展聯盟副理事長,平安科技副總工程師,資深人工智慧總監,平安聯邦學習平台和AutoML平台總設計師,美國佛羅里達大學人工智慧博士後,深圳市領軍人才,高級工程師。現任中國電腦學會大數據專家委員會委員,高級會員,YOCSEF深圳副主席,曾任美國萊斯大學電子與電腦工程系研究員,專註於聯邦學習和人工智慧在金融、保險、投資、醫療等領域的研發工作,發表深度學習、雲計算、大數據等領域國際論文30餘篇,以及專利100多項。多屆中國知名大數據人工智慧和聯邦學習會議出品人。
平安科技聯邦學習團隊資深產品總監
盧春曦

盧春曦,平安科技聯邦學習團隊資深產品總監,本科畢業於美國華盛頓州立大學,獲得澳大利亞悉尼大學碩士學位,負責研發設計和落地多項金融保險領域人工智慧產品,包括AI翻譯、AI農業、聯邦學習蜂巢平台以及寵物識別等。
議題:平安科技AI實踐案例聯邦學習
議題介紹:隨著數字經濟蓬勃發展,全面智慧化技術正推動傳統生產要素全面轉向智慧化生產要素,助力金融產業鏈加速向跨界融合、融通發展、共享共贏的生態圈演進,最終推動數字經濟邁向智慧經濟。本次演講從平安科技豐富的金融業務場景出發並結合實踐案例,深入探究人工智慧和聯邦學習如何便捷高效地賦能行業發展。
Intel中國金融行業客戶總監
王東方

王東方先生(Wang, Dongfang) ,現任Intel中國金融行業客戶總監,負責金融、保險、證券行業11年,曾負責教育政府行業兩年、IT行業從業20年,曾推進金融移動展業、金融業務創新,和金融行業客戶一起共同推進了金融行業技術創新、移動業務及交叉混業業務的發展。
英特爾中國區人工智慧銷售經理
Leon Lu 陸禮明

擁有超過16年的行業經驗。2010年加入英特爾,負責過包括PC客戶端,穿戴式設備,數據中心,人工智慧專用晶片等多個產品線的技術支援和市場銷售工作。
議題:英特爾人工智慧產品和戰略分享
議題介紹:隨著人工智慧技術的演進,能否順利實現方案落地成為其發展的關鍵。英特爾的人工智慧軟硬體解決方案可以幫助企業實現方案快速部署,計算資源的彈性使用,易於維護的整體方案,成熟的雲服務等,最終幫助企業將人工智慧方案順利落地。
英特爾中國區平台安全產品規劃總監
李志強

李志強現任英特爾中國區平台安全產品規劃總監。加拿大卡爾頓大學電腦系統和安全碩士。先後任職於朗訊科技、黑莓和英特爾。在通訊和數據網路,移動安全,和晶片級平台安全方面有著近20年的產業經驗。在基於晶片的端到端的平台安全架構中,從產品規劃、市場拓展、實際部署等不同維度,有著業界領先的的見解和貢獻。
議題:英特爾助力區塊鏈
議題介紹:英特爾對於區塊鏈技術一直緊密跟進。除了不斷提供基於晶片的各種硬體加速能力外,還創新性地提出了可信執行環境的具體實現。這些都為區塊鏈的研究和發展提供了底層支援。同時通過與各種區塊鏈聯盟和行業組織的協作和參與,英特爾適時地推出了先進的鋸齒湖(Sawtooth)項目以及隱私數據對象架構來解決區塊鏈在安全、隱私和可擴展性等方面所面臨的挑戰和機遇。
英特爾亞太研發有限公司高級技術諮詢顧問
羅毅

現任英特爾亞太研發有限公司高級技術諮詢顧問,主要工作為在IntelOpenVINO平台上提供各類技術方案,協助開發者完成產品研發與性能優化。曾獲多項專利授權,在騰訊等頭部互聯網公司有多年研發經驗。長期關注電腦圖形學、機器視覺與深度學習等技術領域,擁有澳大利亞伍倫貢大學電腦碩士學位。
Hands on lab 環節
Intel hands on lab:從模型訓練到推理,打造AI最佳落地實踐
本次實操內容主要分為兩部分。一是訓練模型階段,包括準備和可視化數據集、超參數調整、培訓和驗證。二是部署到邊緣並進行推理,這一部分將介紹英特爾®OpenVINO™工具包的功能和優勢,使用模式;其次是模型優化器:優化模型,為預構建和自定義模型生成與硬體無關的中間表示(IR)文件;最後是推理引擎:部署到CPU,集成GPU、FPGA和英特爾®Movidius™神經計算棒。
hands on lab 參與要求:
1、請自行攜帶無線上網功能的筆記型電腦電腦+充電器
2、通用版網頁瀏覽器
3、Intel® AI DevCloud帳號(活動現場創建免費帳號)
*特別福利:參與 Intel hands on lab 還可獲得 Intel 認證 !

附活動詳細日程
時間:9月17日 09:30 – 19:15
地點:深圳市南山區科技南十二路20號平安科技一層
