李飞飞,斯坦福人工智能实验室与视觉实验室主任。
撰文:曾毅(中国科学院自动化研究所研究员),王玲(《国家科学评论》特约撰稿人)
翻译:梅宝
李飞飞,一位专注于计算机视觉和人工智能(Artificial Intelligence, AI)的知名学者,之前并没有预料到中国对于人工智能的热情。在对北京的一次访问中,这位来自斯坦福的教授得到了中国学术界和工业界的极大关注。借此机会,《国家科学评论》对李飞飞教授进行了专访。
李飞飞指出,尽管人工智能在过去10~15年中已经有了很不错的进展,但前方还有很多挑战。一方面,人工智能的计算模型,比如目前的深度神经网络,还有理论瓶颈需要克服,如对其进行解释的能力。另一方面,人工智能应该在解决社会问题和加速工业创新,比如医疗、交通控制、农业等方面,提供更多帮助。这或许是实现人工智能、加速人工智能发展的更加实际的道路。与此同时,李飞飞对通用人工智能(Artificial General Intelligence, AGI)保有兴趣但持谨慎态度。
从斯坦福到谷歌
NSR:我们了解到你在早些时候加盟了谷歌,能给我们透露更多细节吗?
李飞飞:实际上这并不意味着我会离开学术团体。我将利用学术假期,在谷歌云计算担任人工智能机器学习(Machine Learning, ML)部门的首席科学家。在这段时间里,我也会继续和斯坦福的同事、博士后、研究生一起工作。
NSR:为什么你会选择谷歌云计算?你实验室的研究和这个公司有重合的地方吗?
李飞飞:如果我们回顾人工智能过去20年的发展,特别是人工智能的重要分支领域,比如机器学习、自然语言处理(Natural Language Processing, NLP)、计算机视觉(Computer Vision, CV)的发展,我们可以看到以互联网为基础的数据成为人工智能越来越强大的推动力。因此,人工智能的下一步是什么?在我看来,现在是时候让人工智能开始帮助其他更广泛的垂直领域,比如医疗、农业、手工业等去转变和升级。谷歌云计算是一个非常好的普适计算的平台,可以加速这个过程,对科技和商业来说都有重要意义。
NSR:你在谷歌云计算将会做什么?
李飞飞:我们正在组建一个具有复合型人才的团队,来提升谷歌云计算的人工智能和机器学习的表现,同时也会和商业部门合作来推动新产品。我们期待与学术团体中的相关专家有更多的互动,也很欢迎他们来谷歌云计算工作。
NSR:运算能力的提升可以促进人工智能模型的进步,包括深度神经网络。你觉得进一步升级运算设备,还可以给人工智能带来哪些改变?
李飞飞:运算能力不仅可以影响计算的速度,也可以影响人工智能模型的结构。例如,机器学习的图模型在20世纪90年代很流行。由于计算能力的限制,专家们设计了很多特性来减少计算的复杂度和时间成本。而当更强大的计算设备出现,手工设计的方法就失去了进一步发展的空间。有了强大的计算能力,更复杂有效的算法才能得以诞生和应用。
NSR:另一个相关的问题是,是否计算规模越大,执行就越好? 例如,为了理解人脑的认知功能和解释人类智力的本质,我们应该建立一个在规模上与大脑神经元总数同数量级的模型吗?
李飞飞:这是一个棘手的问题,但规模确实很重要。我认为,中国人说的“量变引起质变”对于描述机器学习模式,是合适的。
NSR:有人说很多人工智能科学家都在做和统计学家同样的事情。区别仅仅在于,解决同样的问题时,人工智能科学家建立有一百万个参数的模型,而统计学家构建有一百个参数的模型。你怎么看?
李飞飞:我想我不同意这个观点。在我看来,统计算法和人工智能并不对立;相反,它们是互补的,也许可以说人工智能是统计的延续。能够用一个只有一百个参数而不是一百万个参数的模型来解决问题是非常好的。然而要明确的是,AI模型的一百万个参数各有其意义,我们应该支持统计学研究,也应该支持对人工智能模型的进一步解释。美国国防高级研究项目署(Defense Advanced Research Projects Agency, DARPA)去年启动了一个名为“可解释的人工智能”项目,就是要揭示深度学习模型的黑箱。
解读人工智能的可能方法
NSR:许多神经网络模型缺乏可解释性,特别是对于深度神经网络中的隐藏层。你认为脑科学研究可以激发和提升对于这些网络的阐释吗?
李飞飞:虽然人工智能的神经网络和人类的大脑相当不同,但“神经网络”的概念确实来自于神经科学。我们还远远没有理解人类的大脑,而我们在人工智能的神经网络领域处于相同的尴尬境地。神经科学的突破的确可能刺激人工智能的阐释,认知科学是推动人工智能解读的另一个加速器。
NSR:事实上,人工智能科学家和神经科学家的密切合作也是中国的一个新兴现象,最好的例子就是中科院的脑科学与智能技术卓越创新中心(Center for Excellence in Brain Science and Intelligence Technology, CEBSIT)。这个中心遴选并招募领先的科学家去解决脑科学和人工智能领域的跨学科问题。
李飞飞:这太棒了!这种合作在美国可能还不那么明显。我希望全世界有更多的跨学科合作。
NSR:人工智能作为一个研究领域出现已有60多年了。神经网络已经变得非常普遍。人工智能的其他分支发展如何?比如,符号主义,知识表示和推理等,哪些是人工智能的主要方面?我们应该将知识工程和神经网络的研究结合起来吗?
李飞飞:神经网络成功地解决了很多难以想象、几乎不可实现的难题。AlphaGo在围棋中战胜人类棋手是最近最有说服力的证明。符号主义在上个世纪达到顶峰,但似乎现在不太受欢迎。说实话,知识表示是令我好奇的问题。为什么人类形成的语言与符号密切相关?这是第二选择还是出于天然优势呢?实际上在融合符号(如条件随机场)和神经网络方面已经有了一些初步的工作。但我认为促进人工智能进步最实际的方向在于打破瓶颈:解决可解释性的缺失、建立知识框架,以及提高神经网络的训练灵活性。
通用人工智能是个伪命题?
NSR: 通用人工智能(AGI)在工业界已经被追寻很多年了,但目前似乎在学术界没有很好的被接受。有人说AGI是人工智能的终极目标。你怎么看?
李飞飞:我怀疑,AGI的宣传是被商业利益所激发的,而这些人并不了解AGI的真实含义。例如,他们所谓的“我们有能力处理数学”是什么含义?证明费马定理还是别的什么?无人驾驶车辆使用的是AGI吗?它运用多个传感器和多种功能来进行驾驶,可以表现得和人类一样甚至更好。我们发送到火星去建房子的机器人又是否具有AGI呢?我认为,现在学术界对AGI还没有明确的定义。
NSR:从我(曾毅)的观点来看,AGI可以这样阐释,它能够自主确定问题类型,并协调所有人类所拥有的认知功能来解决非常不同的复杂任务。
李飞飞:总的来说,我们目前对AGI还没有很明确的定义。AGI和AI的边界也很模糊。我不清楚在现阶段是不是真的需要做出这样的划分。 人类不只是具备普遍能力的生物; 我们还有爱、情感、同理心; 而这些似乎并不包括在AGI的概念之中。如果需要给AGI下一个定义,或许它应当是一种能够实现多重知识表示,具备多重感知能力,能够进行多重推理和学习的系统。
NSR:作为人类,我们中的许多人都认为自己位于生物进化的顶端,许多人可能会感到害怕,害怕在自己擅长的领域中被机器超越。
李飞飞:汽车比我们跑得快,起重机能提起重物,没有必要去害怕。我们有情感,这是独一无二的。
NSR:针对机器人和机器意识的研究已经有很多。你对于创建一个像我们一样有意识和情感的系统有什么看法?
李飞飞:这更像是一个哲学问题。人类是基于碳元素的生命体,但元素的组装达到什么程度才能产生意识和情感?这是难以回答的。站在科学的角度,我更希望政府和民间有更多的资源投入这些基础科学的研究,去系统地寻求这些问题的答案。
NSR:中国科学院神经科学研究所最近发表的论文表明,通过训练的猴子能认出镜子中的自己,初步表现出部分自我意识,这挑战了猴子没有自我意识的传统观念。
李飞飞:他们是否进行了神经相关性实验?磁共振成像可能太粗糙了,无法证明这一结论。
NSR:是的,他们正在做进一步的实验来支持这一观点。
热情终得回报
NSR: ImageNet是一个很重要的计算机视觉研究项目。你启动这一项目的动机是什么?
李飞飞:我们当初启动ImageNet的初衷是重新从大数据的角度审视机器学习的方法论,因为当时在计算机视觉和机器学习的几种方法中都出现了相当长时间的瓶颈。当我开始构建ImageNet的时候,只有一点点资金,但我坚持了下来。只要我确实享受这个研究过程,就足够了。幸运的是,六年后,一篇里程碑式的论文证明了ImageNet的价值,这篇论文预示着人工智能,尤其是神经网络的另一个的春天的到来。和杰弗瑞·辛顿(Geo?rey Hinton)相比,我感到很幸运,因为他坚持研究了二十多年才获得回报,我等待的时间还没有那么长。我很敬佩他的坚持和热情。
NSR:激情对于科学研究非常重要。那么研究方向的选择呢?
李飞飞:从概率的角度讲,没有任何办法能保证成功,研究尤其如此。即便有时可以避免,失败还是很可能会发生。所以我的经验是选择我有热情的方向,并且享受研究的过程。如果研究令你感到疲惫不堪甚至后悔,那么这个研究方向就不值得你继续花费时间。
NSR:除了激情,还需要勇气。
李飞飞:的确,如果你想追求科学,就必须追求自由和真理。自由选择方向听起来很美,但这有时是会让人害怕的,因为没有经验可供借鉴。你需要靠你自己并承担失败的风险。
NSR:基础科学的突破性工作是中国长期以来的诉求,但结果不是那么令人满意。你对此有何建议?
李飞飞:中国有很多聪明人,研究资金也稳步增长。我认为我的同行们现在有更好的机会做原创工作。也许宽容失败是全社会都应该关注的一个事情,这意味着科学家可以自由地做他们热爱的事情。终身教职制度的发明就是为了保护科学家的好奇心,并支持对未知领域的探索。我听说中国领先的大学已经在逐渐采用这一体系,这是一个好兆头。
如前所述,“量变引起质变”,渐进的研究也很重要。研究深度残差网络(Deep Residual Networks,ResNets)的何凯明,目前已经是计算机视觉领域中的一名重要架构师,深度残差网络在自然语言处理的语音识别等领域表现出巨大的潜力。我希望在中国会有更多的“何凯明”。
人工智能的未来
NSR:如今人工智能大受吹捧,如果一家初创公司声称自己是一家人工智能公司,它就会更容易吸引投资,也可以招聘到更多人才。这一潮流会对人工智能的基础研究有何影响?
李飞飞:对于人工智能,目前至少是一个有趣的时期。人工智能是一个“真货”,却也在许多随意和缺乏严谨性的交流或展示中被强烈地夸大了。我认为人工智能和计算、互联网、可再生能源、新材料等一样“真实”。但在现实中,关于人工智能的轻率发言随处可见。它影响到每个人,从企业家到投资者,从大公司到政府,从科研资助机构到基础研究机构。许多人工智能研究者一再呼吁,要在学术和公共论坛中对人工智能进行均衡合理的讨论。我们会继续这样的呼吁。事实上,目前需要将双倍的精力投入到人工智能的基础性研究中去。现在是支持一些长期项目,以解决人工智能领域中那些最困难、并且尚未解决问题的最佳时期。
NSR:你认为未来几年中,人工智能面临的最重要挑战有哪些?
李飞飞:有很多挑战。对于机器学习,最关键的问题是理解学习过程;机器学习中用于解决问题的模型架构是手工设计的;如果我们不能理解其工作机制,就很难达成目标。对于自然语言处理,我们仍然处于相对表面的水平,缺乏深度交互式对话的能力。对于计算机视觉,虽然基于此的产品正在涌现,但距离实现我们的最终目标还很遥远。如果计算机可以像我们一样观察世界并做出正确的理解和判断,我们的生活将会被彻底改变。
英文原文2017年5月24日发表于《国家科学评论》(National Science Review,NSR),原标题为“Fei-Fei Li: Artificial Intelligence is on its way to reshape the world”。NSR是科学出版社旗下期刊,与牛津大学出版社联合出版。《知识分子》获NSR和牛津大学出版社授权刊发该文中文翻译。