专访吴军:未来10年,AI的发展方向是应用,不会出现重大的理论突破 2020 年 10 月 19 日 AI 作者 | 蒋宝尚、陈彩娴 编辑 | 陈彩娴 我们生逢信息时代,对信息的本质却知之甚少。 大部分人只知道1965年提出的摩尔定律是信息处理能力的描述,它正在以每 18 个月就加倍的发展速度“颠覆”着我们的生活方式。 殊不知,信息技术的发展,是由信息的传输、处理和存储技术这三个维度决定的。 而全世界信息技术的发展,都是沿着“用更少的能量传输、处理和存储更多的信息”这条主线来进行。 为了描述信息发展的规律,吴军博士在他的新书《信息传》中,以信息发展史上的杰出人物及事迹入手,通过故事的方式描述了前人追求上述“主线”所经历的曲折与多彩。 (吴军博士新书:《信息传》) 其过程起承转合,柳暗花明,荡气回肠,但又顺理成章。 所谓起承转合,始于1901年,一位叫伽利尔摩·马可尼(Guglielmo Marconi)的27岁意大利年轻人在加拿大纽芬兰的信号山顶放飞一只巨大的风筝,接收到来自遥远英国波尔社基站发出的信号——摩尔斯电码S,标志人类进入无线电通信时代。 所谓柳暗花明,是世人追寻电和磁共同本质苦苦不解之际,一位叫詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell)的学者发表《电磁场的动力学理论》一文,用 4 个简单的公式,即著名的麦克斯韦方程组,描述了电、磁、光相互作用、相互转化的规律。 所谓荡气回肠,是1937年,一位叫克劳德·香农( Claude Shannon)的22岁麻省理工硕士生跑到美国首都华盛顿进行硕士论文答辩。他的研究成果开启了数字化时代,他所总结的信息论揭示了信息的本质,给人类带来了一种新的世界观。 (克劳德·香农) 顺理成章地,在香农信息论的指导下,人类发展信息几乎从此没有再犯过致命的方向性错误。从1G到5G通信的发展,无非是工程师按照香农第二定律指出的方向,根据各个时代能够获得的技术, 对信息编码和传输技术进行持续改进而已。 如今,我们站在科技发展的风口浪尖上,目睹着风起云涌的社会巨变。 那么,《信息传》是如何理顺信息技术的发展历史,帮助我们进一步了解信息的本质,理解信息技术和经济发展的趋势的呢?基于这个大问题,AI科技评论对吴军博士进行了专访,从回顾过去,描述现在,预测未来三个维度探讨了信息技术的发展规律和商业模式。 在专访中,吴军博士提到:在信息论出现之前,前人的研究是自发的,他们的成功是偶然的,失败是必然的;而信息论出现之后,成功不再是“运气”使然,而开始有迹可循。 特斯拉的失败,因此得以避免。 此外,吴军博士还提到,人工智能未来十年的发展方向是AI技术的应用,理论上暂时不会有重大突破。 1 回顾过去:揭示信息理论发展的规律 AI科技评论:为什么要写《信息传》这本关于信息技术发展的书籍?通过这本书,除了告诉我们“历史”,还想告诉我们什么? 吴军:能量和信息是衡量我们这个世界文明程度的硬性标准。一种文明能够创造、使用和传输的信息越多,手段越有效,其文明水平就越高。 了解信息是什么,了解信息技术是什么,才能帮助我们在日常工作学习中更好地收集和利用信息。 虽然这本书讲述的是信息的历史,但描写历史只是手段,更想呈现的是信息技术发展的规律。 关于规律除了有“用更少的能量传输、处理和存储更多的信息”这条主线脉络,还可以根据理论效果,将信息发展时间分为“自发的阶段”和“自觉的阶段”。 所谓自发阶段是指,人由本能(例如好奇心与探索欲)驱动所激发出来的发明创造。在自发的阶段,技术的发明者有很多随意变更的因素,因此在这一阶段,你会看到偶然的成功往往把人带偏方向,远离目标,例如无线电之父特斯拉就不幸进入了这个怪圈。 (尼古拉·特斯拉) 由于自发的阶段缺少理论支撑,运气成分非重要,每一个成功的背后可能存在着非常多的失败。谈到电报,大部分人只知道莫尔斯的成功,而不知道其他人的失败;谈到电话,大家只知道贝尔,而不知道其他人。而实际上,他们的成功其实有很大的偶然性。 自发阶段持续了很长时间,直到1948 香农提出信息论,用一个被称为“熵”的概念和三个非常简洁的定律,描述了信息科学的本质。才使得我们进入自觉阶段。 自觉阶段的标志是:存在正确的理论支撑。所以那之后信息科学和工程的发展, 人类从此几乎没有再犯过什么大的错误,也没有走太多的弯路,从1G到5G移动通信的发展,无非是工程师按照香农第二定律指出的方向,根据各个时代能够获得的技术,对信息编码和传输技术进行持续改进而已。 现在很多人仍然坚信“偶然性”,在思考问题的时候,仍然在缺乏理论支撑的询问“我能否这样做”,而《信息传》这本书希望让读者知道理论的重要性,也就是说试错固然重要,但不要盲目试错。 AI科技评论:无论是在《信息传》,还是在之前的书中,您都反复提到专利,专利对技术的发展有什么重要作用? 吴军:专利是把双刃剑,一方面它有激励作用,另一方面它也限制着技术的普及。 激励作用在于能够保证发明人受益,毕竟只有受益,大家才愿意投入钱去进行发明创造。尤其在今天,很多研发的成本都很高。例如做一个5G方案,首先就要投入数亿元,而且不能保证是否见效。如果投资者赚不了钱,其开发创造的积极性自然就弱化。当然,也有少数人是完全由兴趣驱动的,大部分人做事其实还是为了图利。 另一方面,技术也要普及,所以现在各国的专利都有一个专利期限。美国的专利期最多是20年,20年过后,这项技术就变成了公共领域的知识,让更多老百姓受惠。 AI科技评论:除了专利这一激励因素,其实早期技术发展与国家的地理位置也有关系,是这样吗? 吴军:科技发展和地理相关的一个重要原因是:经济和地理位置的关系特别紧密。 例如,南美洲与北美洲的气候差异,影响了两个地区的经济发展:南美洲的气候条件要比北美洲好很多,所以南美洲可以通过发展种植业来增加经济收入,另外,南美洲还有许多金矿,因此,这个地区发展工业的动力也不足;而北美洲的气候条件不如南美洲,但最后北美成了一个特别发达的工业地区。 另一个例子是无线电为什么要到英国去进行实验?因为英国是岛国,与欧洲其他地区的通信相比,英国的电缆的成本太高,所以需要发展无线通电。同样道理,无论是马可尼和特斯拉,为什么都到美国跟欧洲进行通信研究?因为虽然可以拿电缆进行研究,但拉电缆不但成本高,而且经常失败,所以后来大家想到无线通信的方式。 2 描述现在:信息技术发展的问题 AI科技评论:当前信息技术的快速发展,虽然给我们带来了许多便利,但是也存在的一些问题:信息太多,导致“泥沙俱下”。目前有没有一些方式有望帮助我们过滤信息、管理信息? 吴军:信息太多让大家广泛受益的同时,也带来一个非常严重的问题:信息泄露和错误信息(谣言)给人们造成的巨大损失。 虽然在古代,也有谣言和信息泄露,但是通常不会带来巨大的系统性的连锁反应。在人们开始广泛地使用现代通信工具大量传输信息之后,信息泄露就会给人们带来雪崩式的毁灭性灾难。 所以,需要考虑的是如何甄别有效信息。目前主要有两个解决方法,一个是交叉验证,另一个是寻找可靠的信息来源。 举个最简单的例子,前段时间关于金正恩有许多假新闻,有些新闻CNN也在报道,其可信度也是非常低,这并不意味着CNN有多糟糕,关键是CNN在朝鲜可能没有记者,大多都是二手信息。其实关于金正恩的信息,一个简单的判断标准是:是否有韩国的正式媒体报道,因为韩国非常关心朝鲜的状况;另一个是日本是否有正式的媒体报道,毕竟日本在北朝鲜有很多侨民。 另外,关于自媒体的信息,一定要看出处。当前有些转载是夹杂了“私货”:95%的内容是一样的,剩下5%的信息是改写的。虽然只有5%,但有可能产生重大真实性、客观性转变。 利用交叉验证和信息来源检查这两个“原理”也催生了相关甄别信息的技术产品,例如我们之前在谷歌开发了一个产品叫做“Google Answer”,就可以利用机器学习对信息进行权威来源检查。 AI科技评论:不仅是《信息传》,在《浪潮之巅》也提到过,有些科研想法如果超越时代背景,那么他有可能失败。这对现在的科研者有何启示? 吴军:首先,科学和技术要先分开。科学的发展常常要领先于技术。一项科学知识的作用,往往要经过几十年才能验证。今天的5G用的基本编码算法,实际上在六十年代就已经有了雏形。3G用的CDMA算法与变频调制,在二战时也有了雏形。从科学到技术,再到产品,中间的间隔可能比较长。 所以,国家一定要大力发展科学,因为有时候,科学产生的结果短时间内看不到,但到关键时刻,你会发现,没有科学基础,后面的技术发展也举步维艰。如今中美关系比较紧张,大家对技术比较关心,但在缺技术时,大家还应该反思:更早的时候,我们可能应该在科学上多做一些投入。 其次,在同一个时代,科学可能会带来技术的进步。技术路线有很多种,最后成功的可能就一两种。一项技术的失败,对投资人来说影响不算大。比如投了10项技术,两项成功,八项失败,成功的两项技术可能就能把投资的钱“回本”,而且还可能有利润。但对创业者来说,一项技术的失败是百分百的”灾难”。 在每个时代,解决同一个问题的技术可能有很多,甚至成功的两项技术也未必是一开始最被看好的技术。成功有很多原因,可能是资金,可能是执行力,等等。所以也不能完全以成功或失败来衡量一项技术水平的高低。 此外,每项技术都有一个发展阶段。这个发展阶段很重要。还有些技术可能很有潜力,但在某个时间段里,大家对这项技术没有需求。例如存储技术,之前的磁带、磁盘等,也只存活了半个世纪。如今,大家可能用网络存储或分布式存储。如果你是磁存储技术的领先者,那么你可能在前十年能凭此获利,过后就被淘汰了。 3 预见未来:5G与人工智能的发展 AI科技评论:根据信息技术发展的特点,您认为未来信息技术的主要发展方向在哪些应用与领域? 吴军:信息技术的发展基本上是三根主线,即信息的传输、存储和处理。 5G是信息的传输,人工智能是信息的处理。更具体一些,电报、电话、手机通信和互联网,都是传输信息的手段,计算机和各种控制系统则是处理信息的工具,纸张、胶卷、磁带、光盘、半导体存储器,则是存储信息的媒介。 全世界信息技术的发展,都是沿着用更少的能量传输、处理和存储更多的信息这条主线来进行的。 在移动通信中,从 1G到 5G,单位能耗的信息传输率提高了 5 个数量级左右,这就是通信发展的根本趋势。处理信息也是如此。尽管 1946 年世界上第一台电子计算机埃尼亚克耗电量高达 150 千瓦,但是进行一次计算依然比机械计算机更能节省能量。 如果扩展的话,信息技术是一项在其他国民经济产业中起叠加作用的技术。 一方面,信息技术本身就是一个产业,而且产业规模不算小;另一方面,如果将信息产业与其他产业叠加,比如汽车信息化以后,汽车可以配备地图、道路识别等,开起来会方便很多;或者,通过可穿戴式的系统与手机,汽车会变成一个移动平台,成为一个生活办公场所,这时候汽车可能就被重新定义了。 同样的道理,今年因为疫情,大家可以在家上班。如果疫情发生在20年前,在家上班就很困难,因为20年前,大多数人的家里没有完善的IT设备。如今,信息技术发展后,我们的家里实际上就是一个信息中心,所以能够在家上班。 因此,信息技术的发展,一方面是基于信息的核心往前发展;另一方面,信息技术的发展还会辐射到许多周边产业。 AI科技评论:能不能对人工智能的技术发展进行预见? 吴军:人工智能接下来的十年发展方向是技术应用,理论上暂时不会有太多的突破了。计算机技术有一个“规律”,也可以说是共识,就是哪一个发明或者技术获得了图灵奖,那么它在短期内就走到头了。 人工智能的主要支撑技术深度学习已经在2018年获得了图灵奖。另外,今天我们使用的深度学习技术其实都是基于20多年前的工作。科学肯定是领先于技术的。虽然目前麻省理工等科研高校也在做一些理论性的研究,但是如果想要变成技术应用至少也是20年以后的事情了。 也不是说现在没有进行一些原创性的理论研究,只不过这些研究大多在科研院所和高校里进行,其理解门槛和进入门槛比较高,在媒体传播中没有优势,只是在学术圈内进行交流。例如学术界对深度学习的可解释性理论非常关注,都在投入大量的时间、经历、金钱,如果有突破,那么将会是重大的理论突破。 AI科技评论:从1G到5G,信息技术的发展对商业的影响有什么特点?在5G时代,信息商业的发展会体现怎样的趋势? 吴军:从1G到5G,其实真正影响我们生活的是阶段3G~4G。1G的用户量很少,从2G开始,大家能够彼此的通过手机来通讯的,但也只是限制在通信本身,能够干的事情非常少。 3G到4G在中国的过渡时间非常短,4G这个时代发生的第一个大事就是和云计算的结合,使得我们能够随时随地的访问信息。这时候手机成为了获取信息的平台。 在4G时代,网络可以分为两个部分:通信的网络和计算机的网络,而这两个网络在手机上是融合的。但从产业的角度看,从技术和商业角度来看,这两个网络都没太融合。举个例子,在家用手机连接WiFi上网是计算机网络,而在外面用“流量”上网是通信网络,这两者并没有打通。 所以,谈到5G,必须和IOT联系到一起,必须讲万物互联,只有将所有网络融合到一起才能克服4G带来的缺陷,打通各方“利益”,进入万物互联的时代。 AI科技评论:3G到4G在中国过渡很快,但是5G的建设这中间似乎脚步很慢,这是什么原因呢? 吴军:有两个原因,第一个是所有技术应用都需要配套,例如要想用5G进行万物互联,其工业设备和管理软件都要同步更新。 这件事情,对于个人来说比较简单,因为如果家庭想要更换5G设备,那么自己就能做主。而在企业、工业里,其在4G时代已经投入了大量的成本进行建设,如果更换成5G,企业会付出大量的成本。 第二个原因是,5G网络建设需要时间,现在虽然个别5G试点网络情况非常好,体验非常舒适,但是“个别”带来的意义不大,因为只有大众都能感受到,才是真正的5G时代。 中国工程院院士邬贺铨是我国通讯方面的专家,他自己估计5G网络建设还需要10年时间,其实10年非常漫长。 雷锋网雷锋网雷锋网 分享此文:分享到 Twitter(在新視窗中開啟)按一下以分享至 Facebook(在新視窗中開啟)按一下以分享到 Telegram(在新視窗中開啟)分享到 Pinterest(在新視窗中開啟)更多點這裡列印(在新視窗中開啟)分享到 LinkedIn(在新視窗中開啟)分享到 Reddit(在新視窗中開啟)分享到 Tumblr(在新視窗中開啟)分享到 Pocket(在新視窗中開啟)分享到 WhatsApp(在新視窗中開啟)按一下即可分享至 Skype(在新視窗中開啟) Related Posts 2020 年 4 月 20 日 腾讯 “绝悟”论文披露技术细节。 【论文阅读】Mastering Complex Control in MOBA Games with Deep Rein … .. 2022 年 3 月 28 日 为什么深度学习是非参数的?