吴佳俊的获奖论文是“Learning to See the Physical World”,此前,该论文还获得 2019 ACM 博士论文荣誉提名奖。今年7月,一年一度的 ACM 博士论文奖发布,毕业于特拉维夫大学的 Dor Minzer 获得该奖项。吴佳俊和瑞士洛桑联邦理工学院(EPFL)博士 Jakub Tarnawski 获得荣誉提名奖。相关链接://awards.acm.org/about/2019-doctoral-dissertation吴佳俊获奖论文:Learning to See the Physical World论文地址://jiajunwu.com/papers/dissertation.pdf论文摘要:人类的智慧超越是模式识别的,我们可以从一张图像中解释所看到的内容,以3D形式重建场景,预测将要发生的事情并相应地计划行动。尽管在过去十年中人工智能取得了惊人的发展,但与人类智能相比,人工智能(尤其是深度学习)在某些方面仍然不足:它们通常只能解决特定问题,需要大量的训练数据,并且在泛化至新任务或新环境时很容易失败。在这篇论文中,我们研究了物理场景理解的问题:构建通用的、数据高效的、可通用的机器,学习如何观察、推理和与物理世界交互。其核心思想是以逼近模拟引擎的形式,利用真实世界背后的通用因果结构,包括来自计算机图形学、物理学和语言的知识,并将其与深度学习相集成。在这里,学习起着多方面的作用:模型可以学习反转模拟引擎以进行有效的推理;它们还可以学习逼近或增强模拟引擎,以进行更强大的前向模拟。本文分为三个部分,分别研究了这种混合模型在感知、动力学建模和认知推理中的应用。在第一部分中,我们将学习与图形引擎结合使用,以建立对象中心的场景表示形式,以实现对象的形状、姿态和纹理。在第二部分中,除了图形引擎之外,我们还将学习与物理引擎配对以同时推断物理对象属性。我们还将探索学习逼近模拟引擎,以提高灵活性和表达能力。在第三部分中,我们通过循环程序执行引擎来利用和扩展在第一部分和第二部分中引入的模型,以进行概念发现和认知推理。增强的模型可以发现对象和场景中的程序式结构,然后将其用于下游任务,例如视觉问答和场景处理。值得一提的是,这篇论文还获得了麻省理工学院George M. Sprowls人工智能和决策博士学位论文奖。