吳佳俊的獲獎論文是「Learning to See the Physical World」,此前,該論文還獲得 2019 ACM 博士論文榮譽提名獎。今年7月,一年一度的 ACM 博士論文獎發布,畢業於特拉維夫大學的 Dor Minzer 獲得該獎項。吳佳俊和瑞士洛桑聯邦理工學院(EPFL)博士 Jakub Tarnawski 獲得榮譽提名獎。相關鏈接://awards.acm.org/about/2019-doctoral-dissertation吳佳俊獲獎論文:Learning to See the Physical World論文地址://jiajunwu.com/papers/dissertation.pdf論文摘要:人類的智慧超越是模式識別的,我們可以從一張影像中解釋所看到的內容,以3D形式重建場景,預測將要發生的事情並相應地計划行動。儘管在過去十年中人工智慧取得了驚人的發展,但與人類智慧相比,人工智慧(尤其是深度學習)在某些方面仍然不足:它們通常只能解決特定問題,需要大量的訓練數據,並且在泛化至新任務或新環境時很容易失敗。在這篇論文中,我們研究了物理場景理解的問題:構建通用的、數據高效的、可通用的機器,學習如何觀察、推理和與物理世界交互。其核心思想是以逼近模擬引擎的形式,利用真實世界背後的通用因果結構,包括來自電腦圖形學、物理學和語言的知識,並將其與深度學習相集成。在這裡,學習起著多方面的作用:模型可以學習反轉模擬引擎以進行有效的推理;它們還可以學習逼近或增強模擬引擎,以進行更強大的前向模擬。本文分為三個部分,分別研究了這種混合模型在感知、動力學建模和認知推理中的應用。在第一部分中,我們將學習與圖形引擎結合使用,以建立對象中心的場景表示形式,以實現對象的形狀、姿態和紋理。在第二部分中,除了圖形引擎之外,我們還將學習與物理引擎配對以同時推斷物理對象屬性。我們還將探索學習逼近模擬引擎,以提高靈活性和表達能力。在第三部分中,我們通過循環程式執行引擎來利用和擴展在第一部分和第二部分中引入的模型,以進行概念發現和認知推理。增強的模型可以發現對象和場景中的程式式結構,然後將其用於下游任務,例如視覺問答和場景處理。值得一提的是,這篇論文還獲得了麻省理工學院George M. Sprowls人工智慧和決策博士學位論文獎。