WAIC|高精準、低成本，九章雲極DataCanvas突破AutoML難題

2021 年 7 月 13 日
AI
強化學習, 深度學習

在2021 年世界人工智慧大會（WAIC）上，九章雲極DataCanvas董事長方磊受邀參加由世界人工智慧大會組委會主辦、機器之心承辦的「2021 WAIC·AI開發者論壇」，並發表「Hypernets：自動化機器學習的基礎框架」主題演講，圍繞AutoML框架的重要性和基本抽象、Hypernets的概念模型和重要特性、Hypernets的具體示例三部分**向廣大開發者奉獻了一場乾貨滿滿的技術福利。

AutoML框架的本質是空間搜索

AutoML技術的研發與應用是一個持之以恆的課題，隨著對其研發的深入，很多AutoML工具的各部分高度耦合，只能針對特定問題，難以擴展。方磊表示，AutoML框架的本質就是空間搜索，在這裡面很重要的思想就是抽象性和層級的必要。

AutoML框架是對AutoML領域面對的問題解構和抽象後形成的基礎性支撐，無論是超參數優化、Full-Pipeline搜索還是神經網路架構搜索(NAS)問題，主要圍繞3個基本部分：搜索空間(Search Space)、搜索策略(Search Strategy)和評估策略(EstimationStrategy)。AutoML框架應對各部分高度解耦以實現各部分自由擴展，開發者可以在此之上不斷豐富搜索演算法，設計多樣搜索空間，避免共性問題重複開發，針對非共性問題實現靈活擴展，加速迭代效率，大幅低於降低自動機器學習的准入門檻，能夠讓開發者快速實現自動機器學習的搜索。

Hypernets——開發者的朋友

一款優秀的AutoML框架應當在上述三個部分具有：富有表現力的搜索空間描述語言、支援高維空間的高效搜索演算法和高性能的評估策略。Hypernets作為一個自動機器學習的底層通用框架，滿足單節點及分散式高性能的模型訓練需求，可以在不同的空間進行搜索與訓練，結合各種機器學習和深度學習框架開發專用自動機器學習工具，幫助用戶快速開發專用領域的AutoML工具。同時，Hypernets支援最新的神經網路架構搜索（NAS）演算法，可以實現深度學習的網路架構設計自動化。

方磊表示，Hypernets與目前眾多的機器學習、深度學習框架相結合更快更好的生成自動機器學習工具。用5-10行程式碼完全可以搜索模型，因此Hyperents一個定位就非常清晰，不管開發一個訓練框架還是開發應用模型，都是開發者的朋友。開發訓練框架可以讓框架使用Hypernets很容易結合出框架本身的自動機器學習能力；如果是開發應用模型，可以組合不同學習訓練框架的同時，在上面使用Hypernets，端到端整個pipeline上進行自動機器學習的參數搜索，就會得到非常較好的模型。經過大量在行業上的應用，在特徵豐富情況下，Hypernets在搜索能力包括分散式計算能力體現出來很多優勢，搜索時間短，算力僅需普通訓練的20-30倍，就能夠得到一個性能大大提升的模型。

簡單快速精準的自動機器學習開發過程

開發者通過Hypernets設計不同的模組空間(Module Space)和相應的參數空間(Parameter Space)，通過不同的連接方式(Connection Space)將各個模組空間組合成為一個高維的豐富動態搜索空間(Search Space)。遺傳演算法作為搜索策略的一個例子，是一種非常有效的尋找局部最優的方法，也可以與其他各類演算法組合使用，實現更為強大的策略，例如在空間切分搜索的時候，使用遺傳演算法加速子空間中的迭代。評估策略的核心在於高效：在評估不精確的情況下，通過指導搜索方向、節省預處理時間、防止過擬合三種方式，減少計算量，高效地利用自動機器學習找到更好的模型。作為Hypernets的一個具體實例，HyperGBM在多個公開數據集上和真實業務場景上，超過或達到了人類專家和其他AutoML工具的水平。

強大的自動機器學習開源框架：Hypernets家族

Gartner在2020年十大科技趨勢中，將以AutoML為代表的AI普及化作為數據與分析領域的重要戰略技術之一。作為幫助用戶快速開發專用領域的AutoML工具，Hypernets於2019年在GitHub進行開源，結合各種機器學習和深度學習框架開發專用自動機器學習工具，率先突破了機器學習建模過程中不均衡數據、概念漂移、模型泛化能力和大規模數據等諸多挑戰，提供開放的訓練服務框架，降低了AutoML工具的開發門檻，實現深度學習的網路架構設計自動化。

方磊提到，AutoML的核心內容是降低門檻構建模型。基於Hypernets框架，九章雲極DataCanvas自主研發的HyperGBM不僅能夠解決生產化困擾，同時實現了數據預處理、特徵衍生、特徵篩選、模型超參數優化、模型選擇、模型融合全過程的全自動機器學習，僅需5行程式碼就可以實現高品質的模型，擁有開箱即用、簡單易用等特點，解決企業在結構化數據建模的需求。

為避免共性問題重複開發，其研發的HyperKeras支援神經網路架構搜索和超參數優，專註非共性問題，實現靈活高效擴展。此外，九章雲極DataCanvas對AutoML技術不斷探索，開源項目DeepTables榮獲全球知名國際性競賽第一名，全新定義了深度學習技術在結構化數據分析領域的價值。

Hypernets家族開源地址

Hypernets

//github.com/DataCanvasIO/Hypernets

HyperGBM

//github.com/DataCanvasIO/HyperGBM

**HyperKeras**

//github.com/DataCanvasIO/HyperKeras

隨著人工智慧時代對於AutoML需求的增加，九章雲極DataCanvas將運用Hypernets框架融合更多的深度學習框架，推動神經網路架構搜索的前沿發展，助力實際應用場景中的深度學習模型落地，並且通過在AutoML、AutoDL領域不斷的技術創新，為金融、通訊、政府等眾多行業實現數智化升級提供新動能。

Tags: 強化學習深度學習

WAIC|高精準、低成本，九章雲極DataCanvas突破AutoML難題

AutoML框架的本質是空間搜索

Hypernets——開發者的朋友

簡單快速精準的自動機器學習開發過程

強大的自動機器學習開源框架：Hypernets家族

Hypernets家族開源地址

VirMach 便宜 VPS

QNews

WAIC|高精準、低成本，九章雲極DataCanvas突破AutoML難題

AutoML框架的本質是空間搜索

Hypernets——開發者的朋友

簡單快速精準的自動機器學習開發過程

強大的自動機器學習開源框架：Hypernets家族

Hypernets家族開源地址

分享此文：

Related Posts

資料 | 流暢的Python

大咖面對面 | 移動機器人定位專場—俞毓鋒博士

東京奧運會遭遇尷尬！重要場館還沒使用就漏雨了

全網唯一開源java開發的支援高擴展，高性能的Mqtt集群broker！

VirMach 便宜 VPS

QNews

熱門搜尋