機器人學習大會CoRL 2020 最佳論文出爐!華為諾亞、上海交大獲最佳系統論文獎
- 2020 年 11 月 27 日
- AI
最佳論文展示獎由南加州大學團隊獲得。
CoRL大會介紹
CoRL是一個新的以機器人學和機器學習為主題的年度國際會議。第一次會議已於2017年11月13日至15日在加利福尼亞州山景城舉行,旨在匯聚約250名從事機器人學和機器學習領域的最優秀的研究者參會。 機器人技術,自主感知和控制領域正在經歷一場機器學習革命,現在正是時候提供一個將機器學習的基本進展與機器人應用和理論的實證研究相結合的場所。 我們的目標是使CoRL成為機器人(機器)學習研究的首選大會。
下圖為自2017年-2020年CoRL論文接受率變化圖:
最佳論文獎
本次榮獲CoRL最佳論文獎的是來自斯坦福大學和弗吉尼亞理工大學合作的《Learning Latent Representations to Influence Multi-Agent Interaction》。
-
論文鏈接://arxiv.org/pdf/2011.06619.pdf
-
作者: Annie Xie, Dylan P. Losey, Ryan Tolsma, Chelsea Finn, Dorsa Sadigh.
獲獎理由:
本文提出了一個令人信服的解決方案,解決了包括競爭性物理機器人環境在內的多個領域的難題。
論文介紹:
智慧體與人類或機器人的無縫交互很困難,因為現實環境是動態變化的,並根據自智慧體的行為更新策略,而自智慧體必須預測這些變化以隨機應變。
受人類行為啟發,我們認識到機器人不需要顯式地為另一個智慧體要進行的每一個低級動作建模;相反,我們可以通過高級表徵來捕捉其他智慧體的潛在策略。
我們提出了一個基於強化學習的學習框架來學習一個智慧體策略的潛在表示,其中自智慧體識別其行為與另一個智慧體的未來策略之間的關係。
最佳系統論文獎
-
論文鏈接://arxiv.org/pdf/2010.09776.pdf
-
開源程式碼://github.com/huawei-noah/SMARTS.
Learning的方法可以為解決這個問題提供很多幫助,但是這一方法需要一個現實的多智慧體模擬器,該模擬器會產生多種多樣且有效的駕駛交互。
為了滿足這一需求,我們開發了一個專用的模擬平台:SMARTS (Scalable Multi-Agent RL Training School):可擴展多智慧體強化學習學校。
上圖是SMARTS 模型架構,其交互方案是使用特定領域語言(DSL)定義的。Social智慧體是從「 Social智慧體Zoo」中實例化而來。橙色車輛由學智慧體控制、深藍色車輛由 Social智慧體控制、淺藍色車輛由交通服務提供商控制。
原則上,所有提供程式和智慧體都可以在自己的進程中運行,也可以遠程運行。
SMARTS支援訓練、積累和使用道路用戶的各種行為模型,這些反過來又可以用於創建越來越現實和多樣化的交互,從而可以對多智慧體交互進行更深入、更廣泛的研究。
在本文中,我們描述了SMARTS的設計目標,解釋了SMARTS的基本體系架構和關鍵功能,並通過在交互場景中進行具體的多智慧體實驗來說明其用法。
最後,我們開源了SMARTS平台以及相關的基準測試任務和性能評估指標,以鼓勵和支援針對自動駕駛的多智慧體學習的研究。
最佳論文展示獎
本次榮獲CoRL 2020最佳論文展示獎的是來自南加州大學的一篇論文:
《Accelerating Reinforcement Learning with Learned Skill Priors》。
-
論文鏈接://arxiv.org/pdf/2010.11944.pdf
-
項目主頁://clvrai.github.io/spirl/
然後,我們擴展常見的最大熵RL方法以使用先驗技能來指導下遊學習。我們在複雜的導航和機器人操縱任務上驗證了我們的方法SPiRL(Skill-Prior RL),並證明了學習先驗技能對於從豐富數據集中進行有效技能遷移至關重要。
最佳論文展示獎提名:
點擊閱讀原文,直達EMNLP小組!