从CS小白到侯世达高徒、CS教授、《复杂》作者，她这次再向世界展现 AI 十年思考 | 赠书（王飞跃力荐）

2021 年 3 月 8 日
AI
社区福利

《GEB》启蒙了人工智能的发展热潮，《生命3.0》重构了人工智能的进化框架，《AI 3.0》将开启新一轮人工智能爆发的大戏。

作者 | AI科技评论

《AI 3.0》是畅销书《复杂》的作者、《GEB》作者侯世达的高徒、波特兰州立大学计算机科学教授、复杂系统前沿科学家梅拉妮•米歇尔耗时10年思考，厘清人工智能与人类智能的全新力作。侯世达曾逐章审读本书，并为每一页都写满意见。

本次，AI科技评论联合湛庐文化，为同学们带来这本新书的赠书活动！

1

结缘GEB

米歇尔的学术生涯颇为有趣。她本科是数学专业，毕业后在纽约市的一所预科学校教数学。但她过的并不开心，并一直在苦苦思索内心所爱。

直到有一天，她在《科学美国人》上阅读到了一篇关于《GEB》的热情洋溢的评论文章之后，立刻被买来这本书，如饥似渴地阅读。在阅读过程中，她越来越坚信，自己不但想成为一名人工智能研究人员，并想与侯世达共事。“我从来没有对其他任何一本书或一种职业有过如此强烈的渴望。”

Douglas Richard Hofstadter，中文名侯世达，美国学者、作家。他的主要研究领域包括意识、类比、艺术创造、文学翻译以及数学和物理学探索。

侯世达因其著作《哥德尔、埃舍尔、巴赫》（GEB）获得普利策奖（非小说类别）和美国国家图书奖（科学类别），这本书在人工智能界特别有名，并在豆瓣上获得了9.4高分。

侯世达从数学、逻辑学、生命遗传、大脑思维、人工智能、甚至音乐、绘画等许多不同领域对莫比乌斯带进行了讨论，使人们发现怪圈有着丰富的内蕴，它与自然、科学、人类、艺术都有着深刻的联系。此书也被计算机科学界和人工智能界很多科学家所推荐，影响了一大批研究学者。据说，TensorFlow的logo也参照了这本书的封面设计。

但是，要当侯世达学生就意味着，从未上过哪怕一门计算机科学课程的米歇尔，要去申请印第安纳大学计算机科学系教授侯世达的计算机科学博士学位。

听起来真是异想天开，然而，米歇尔从小对计算机非常熟悉。她父亲是20世纪60年代一家科技创业公司的硬件工程师，作为一项业余爱好，他在家里的书房里组装了一台大型计算机——一台像冰箱一样大的“Sigma 2”机器，上面有一个磁性按钮，写着“我用FORTRAN祈祷”。

“Sigma 2”机器

当米歇尔还是个孩子的时候，她半信半疑地以为它确实是在祈祷，尤其在夜深人静，家人都睡着的时候。20世纪六七十年代，随着成长，米歇尔对当时流行的各种编程语言都略有了解：先是FORTRAN，然后是BASIC，再然后是Pascal，但她对规范的编程技术几乎一无所知，更不用说那些对即将入学的计算机系研究生来说必须知道的知识了。

为了加快计划，米歇尔在学年末辞去了教职，搬到波士顿，开始学习计算机科学的入门课程，来为新职业做准备。

开始新生活几个月后的某一天，她在麻省理工学院（MIT）的校园里等着上课，无意间瞄到了一张关于侯世达讲座的海报，而且举行时间就在两天后。米歇尔相当激动，“我简直不敢相信自己的好运。”

她去听了这场讲座，在一大群崇拜者中排了很长时间的队后，终于和侯世达说上话了。原来他正在麻省理工学院度过他为期一年的学术假期，在这之后他会从印第安纳州搬到密歇根州安娜堡的密歇根大学。

经过不懈的努力，米歇尔成功说服侯世达，成为他的研究助理。先是一个暑假，然后在接下来的6年里，米歇尔又成了他的硕士生、博士生，并最终作为密歇根大学的计算机科学博士毕业（论迷妹的正确追星姿势）。这些年来，米歇尔和侯世达一直保持着密切联系，并曾多次就人工智能进行讨论。米歇尔和侯世达共同创建了Copycat程序，该程序可以在理想化的情境里进行创造性的类比。

如今，米歇尔已成为颇有影响力的人工智能学者。她现在是波特兰州立大学计算机科学教授，主要的研究领域为类比推理、复杂系统、遗传算法等。

在圣塔菲研究所时，米歇尔主导了复杂系统领域的研究工作，并教授了相关的在线课程。她的在线课程《复杂性入门》已经被近30 000名学生选修，成为Coursera排名前50位的在线课程之一。

米歇尔还是知名畅销书作家，著有《复杂》（Complexity: A Guided Tour）（豆瓣评分9.0）、《遗传算法导论》（Genetic Algorithms）等。

2

AI 3.0

有些读者可能读过《复杂》，并且可能会想知道《复杂》和《AI 3.0》之间的关系。米歇尔解释道：《复杂》这本书是对复杂系统科学的一个概述，复杂系统科学研究的是复杂行为如何从相对简单的组成部分之间的相互作用中产生；而《AI 3.0》则是深度聚焦于复杂系统科学中的一些最难的问题，比如智能的本质是什么？研究者是如何创建智能机器的？我们如何评判这一领域目前所取得的成就？今天的机器距离真正像人一样来理解世界还有多远？

在《AI 3.0》中，作者首先从人工智能的发展历程讲起，然后从视觉识别、游戏与推理、自然语言处理、常识判断等人工智能的4个主要应用领域来详细阐述人工智能的原理、当下的能力边界，及其正在面临的关键挑战，书中关于人脸识别、无人驾驶、机器翻译等方面的案例分析都充满了含义丰富的启示。

《AI 3.0》的英文版全名为《Artificial Intelligence：A Guide for Thinking Humans》，2019年，这本书甫一出版，就跻身亚马逊“计算机与技术”畅销书行列。

中文版由中国自动化学会监事长王飞跃领衔翻译，并得到众多名人推荐，包括Robust.AI首席执行官Gary Marcus、财讯传媒集团首席战略官段永朝、联想集团高级副总裁芮勇以及理论物理学家、畅销书《规模》作者杰弗里·韦斯特等。

译者王飞跃教授与梅拉妮 · 米歇尔

段永朝表示，人工智能类的图书可谓汗牛充栋，大致可分为两类：一类是给专业的工程师看的，另一类是给大众的普及读物，米歇尔的这部书介乎两者之间。“它既有专业的技术阐释，更有深刻的思想洞察。”

《AI 3.0》所要传达的观点是：我们人类倾向于高估人工智能的进步，而低估人类自身智能的复杂性。目前的人工智能与通用的、人类水平的智能还相距甚远。我们应该感到害怕的不是智能机器，而是“愚笨”的机器，即那些没有能力独立做决策的机器。相比于机器的“智能”，我们更应关注如何规避“愚笨”机器的潜在风险。

这一观点基于“侯世达的恐惧”。AlphaGo让全世界炒作起了人工智能，并进一步夸张化为“奇点爆炸”、“超级智能”、“数字永生”等概念。侯世达对此不以为然，并直言“很讨厌‘人工智能’这个词汇”，他认为目前的人工智能技术毫无智能可言。

米歇尔的这部《AI 3.0》也以侯世达作为开篇和结语的思想经纬，为侯世达对人工智能的万般忧虑，做了一次深度的技术解析。

对人工智能的种种讨论，特别涉及到技术伦理、社会价值和发展前景的时候，一般总会停留在“悲观”或者“乐观”的选边站队层面，无法进一步深入下去。这不奇怪。技术专家们擅长的话语是数据、算法、模型，社会学者和新闻记者们只能从技术的外部性、代码的背后之手、人性之善恶的角度，捍卫或者反对某种价值主张。对绝大多数非专业人士而言，由于搞不懂隐藏在反向传播算法、卷积神经网络、马尔可夫过程、熵原理这些硬核知识背后的“思想内涵”，对人工智能的理解和评判，就只能以“好与坏”、“善与恶”的视角进行。

讲述技术视角的思想基础，弥合理科生与文科生之间看待人工智能的思想鸿沟，正是米歇尔这部书的价值所在。

米歇尔的论述，有这样一个清晰的线条，她细致分析了人工智能在视觉、游戏、机器翻译等领域最新的进展后指出，迄今为止令人眼花缭乱的智能突破，其实尚未触及智能问题的核心——自然语言理解和意义问题。

内容简介

《AI 3.0》第一部分回顾了人工智能超过半个世界的发展历史。与一般人工智能书籍不同的是，在概要讲述“人工智能的冬天”这一背景之后，米歇尔将注意力集中在“何以如此”这个关键问题上。

第二部分对分析了视觉领域的技术进展，这部分可用来理解人工智能核心算法演变的心路历程。视觉领域广泛使用的专业工具，是所谓“卷积神经网络”，这一领域的创立者包括日本学者福岛邦彦，以及法国计算机科学家Yann LeCun（中文名字杨立昆）。对外行人来说，繁复的算法过程遮蔽了其中包含的技术思想。米歇尔将其“拎出来”展现给读者：所谓视觉识别，无非是训练出某种算法，使得机器可以“识别和命名它所‘看到’的世界”的过程。Geoffrey Hinton开发出的AlexNet在ImageNet竞赛中的强势胜出让深度学习一夜之间成为AI社区的大明星。然而，尽管有着巨大的成功，ConvNets距离真正的视觉智能还很遥远，比如依赖于大数据，受限于长尾效应，缺乏真正的视觉理解能力，存在偏见，容易被愚弄等。

第三部分的讨论主题是游戏人工智能，用人工智能算法练习打游戏，是挖掘算法潜能、理解算法机理的有效途径。米歇尔为我们分析了著名的AI围棋程序AlphaGo，并指出很多人工智能应用的智能表象的背后是强大算力和大数据的支撑，而游戏AI在解决问题时，仍然缺乏对世界的完整理解，转而依赖于目标函数本身。在第四部分讨论的自然语言处理中，尽管语言AI或许更具有智能的表象欺骗性，但AI的语言理解依然逃不出同样的魔咒。

第五部分落到了“意义问题”上。米歇尔指出，理解的背后是意义。意义，是AI的真正障碍。至于是不是不可逾越的障碍，这可以成为激烈争论的话题。但我感觉，米歇尔所阐述的意义问题，并不是说AI无法理解意义，也不是说AI无法创造出新的意义（当然这取决于你怎么定义“意义”），而是说，AI对意义的理解是否在安全边界之内——这其实是全书开篇“侯世达恐惧”的核心。

婴幼儿理解这个世界的过程，是不断地将自己的新奇感受，装入成人的词语世界的过程。这个过程也是绝大多数真实的认知历程。当然也有“漏网之鱼”。比如日益流行的网络用语，就突破了附着在传统词语上面的固有含义。意义的产生，既有漫长、深厚、难以细数的生活积淀，和约定俗成的“能指-所指”的任意配对儿，也有突破词语边界的“类比”和“象征”——按米歇尔的导师侯世达的观点，后者是“思考之源和思想之火”。（参见侯世达《表象与本质》）

借用Gian-Carlo Rota的话，米歇尔提出了这一根本性的问题：“我想知道AI是否以及何时将会打破意义的障碍”。

米歇尔并未直接了当地回答这个艰难的硬核问题。但她毕竟是侯世达的弟子。她从侯世达的思想中汲取营养：这个世界是隐喻式的。我们并非确凿无疑地生活在符号世界中，我们生活在色彩斑斓的隐喻中。

侯世达在40多年前写作伟大的作品《GEB》的时候，针对人工智能自问自答了10个问题，侯世达对这10个问题的思考，更多地指向形式逻辑、符号演算和线性思维天然的不足之处：这一不足之处正在于，符号思维难以超越其内生的逻辑悖论。没办法，这是天生的。

米歇尔从侯世达的10个问题中提取了6个问题——看上去都是迫在眉睫的问题——并尝试给出了自己的回答。米歇尔的回答只是多种意见中的一种。但勇敢面对这些基本问题，并持续展开深入思考和交流的时代，才刚刚开始。