直播丨CVPR最佳學生論文一作王鑫,帶來視覺語言導航最新工作分享!
- 2020 年 7 月 31 日
- AI
視覺語言導航(Vision-Language Navigation),顧名思義,就是讓智慧體跟著自然語言指令進行導航,即智慧體需要結合理解自然語言指令與視野中可以看到的影像資訊完成線路規劃,從而到達目標位置。
2019年,一篇關於視覺語言導航的論文拿下CVPR2019 最佳學生論文獎,讓這一新興研究方向,迎來高光時刻。
論文的一作王鑫,當時還是加州大學聖塔芭芭拉分校王威廉組的博士生。在拿下CVPR2019 最佳學生論文獎之後,他跟他所在的王威廉實驗組仍一直在視覺語言導航這個研究方向深耕,先後在 ICCV、CVPR、ECCV 等高峰會上再度發表了多篇相關的研究,包括跨語言視覺-語言導航、視覺-語言導航的泛化能力等等,成為視覺語言導航領域的一大研究主力。
其中,泛化能力問題原本就作為深度學習研究中最難以跨越的鴻溝之一,在視覺語言導航研究中尤甚。
對於這一大難點,這一年多的時間裡,王鑫及其所在研究小組又提出了什麼新的方法呢?
2020年8月4日中午12:00點,AI 科技評論專門邀請到了王鑫本人,親自為大家分享他們在泛化能力問題上的最新工作進展,具體包括:
-
將環境不可知的多任務導航學習框架;
-
用於反事實導航的對抗數據增強方法;
-
基於多模態文字風格轉換的室外遷移導航學習。
值得一提的是,王鑫本人在今年夏天也完成了身份的轉變,從加州大學塔芭芭拉分校分校博士畢業,正式加入加州大學聖克魯茲分校擔任電腦科學與工程系終身制助理教授。
對學業和職業規劃存在疑惑的同學,也不妨來找這位「大學長」答疑解惑、取取經哦~
分享主題:視覺語言導航的泛化學習
分享嘉賓:王鑫,加州大學聖克魯茲分校電腦科學與工程系終身制助理教授
分享時間:2020年8月4日中午12:00
分享背景:深度學習的泛化能力一直為人詬病,在新興的視覺語言導航領域尤甚。三維環境重建和數據收集過程費時費力。我們旨在提出有效的方法解決視覺語言導航的泛化和數據稀缺問題。
分享提綱:
環境不可知的多任務導航學習框架;
用於反事實導航的對抗數據增強方法;
基於多模態文字風格轉換的遷移導航學習。
如何加入?
掃碼關注[ AI研習社高峰會小助手] 微訊號,發送關鍵字「ECCV 2020+直播」,即可進群觀看直播和獲取課程資料。