近来,国内出现了一场关于大数据和人工智能(AI)能否重振计划经济的争论,这场争论涉及两个重要的问题。第一个问题是人工智能的产生是从计划来还是从别的地方来;第二个问题是,人工智能发展了之后会把我们带往计划经济吗?
人工智能的基础——大数据
为了回答这些问题,需要从最基本的技术层面开始讨论。首先,我们需要理解人工智能是什么意思,人工智能能做什么不能做什么,大数据和人工智能是什么关系。
大数据的重要性在于它是人工智能的基础。如今,世界上所有发达国家都高度关注人工智能的发展,因为这是一次正在兴起的产业革命。
这个产业革命会引起的后果立即能看到的就是大量的无人工厂会产生、许多无人服务行业会产生、人类历史上从来没有见过的高效率会产生,会有大量的失业。
由于人工智能的技术基础是大数据,因此大数据变成了基础资源,和我们人类历史上经历过的原材料、能源等一样。但是,这个资源与原材料、能源等资源的不同之处在于它不是原来就在世界上存在的,而是我们人工收集得来的。
产业革命的教训
当生产模式发生基本变化的时候,这种全新、全面的自动化会不会从根本上改变制度?对于这个问题,我们要吸取从过去产业革命的教训,不然会重蹈覆辙。
过去的产业革命的一个重要教训就是,当这些产业革命涌现的时候,人们会过高地估计产业革命的前景,进而滥用这些新兴的科学和技术。在历史上,并不乏这样的例子,第一个是在第二次产业革命时期,产生了以国有制为基础的中央计划将经济,这是一个过高估计了人的计划能力和统治能力而设计出来的制度。
另一个例子是对环境的破坏,比如化石原料,化石原料的大规模使用伴随着第一次和第二次产业革命的到来,造成了全球碳排放过高带来全球变暖和其他一系列污染。我们现在已经意识到,必须改变这种现状。
今天,当大数据和人工智能结合在一起的时候,它可能的危险我们还不知道,比如带有垄断性质的大公司利用手中的数据试图控制社会,用于大规模的战争、犯罪,等等。
基于大数据的算法与计算能力
今天人工智能的大发展实际上是以过去半个多世纪的发展位基础的。首先,人工智能第一个重要基础是算法,而对算法的探索早在20世纪50年代就开始,其中奠基人之一是经济学家赫伯特·西蒙教授,他是卡内基梅隆大学的经济学教授、计算机教授、心理学教授,1978年获诺贝尔经济学奖。人工智能这个提法来源经济学、计算机和心理学这三个专业统的结合。
如今,发展得最好的算法是所谓的“神经元模型”,神经元模型使机器可以在人的指导下学习,也就是现在我们讲人工智能时经常会提到的“深度学习”。人工智能的另外一个普遍使用且可探索的方法是“统计算法”。无论是使用人工训练的神经元模型还是统计算法,都必须要大量的数据,这就是为什么大数据是人工智能的基础。
人工智能的第二个基础是计算能力。在过去的半个世纪里,计算速度、计算能力和存储能力基本上是每两年提高一倍(摩尔定律),积累了半个世纪以后,现在超强的能力使得无论使用任何一种计算方法的人工智能,在某些领域都可以大大超过人类。
大数据的基础:可度量数据
既然人工智能的基础是大数据,那么要理解人工智能,我们就需要理解大数据本身的技术基础是什么。首先,大数据产生的基础是传感器、移动设备,传感器和移动设备先检测到一些具体的数据,通过互联网和物联网传送,然后集中起来。大数据的核心就在于收集、传输、储存和处理所有这些传感器和移动设备可以度量的数据。人工智能可以做什么不可以做什么,取决于所收集的数据是否可度量。
另一层面的大数据,是利用历史上积累的大量文献,其中包括各个学科积累的文献,比如说图书馆里有文字的、有图的、有音乐的、有舞蹈的记录,这些全都可以转换为大数据供机器去学习、分析。 所谓“深度学习”的人工智能(也是我们今天讲的人工智能),它的技术基础基本是用大数据训练机器,使之产生识别的能力、推理的能力、规划的能力,等等。
冷识别与热识别、硬数据与软数据
如前所述,所谓的深度学习其实是一种算法。算法与经济学中的决策理论是紧密相关的,换句话说可以认为它是决策理论的一个部分。
作为人工智能的设计者,你要为你的机器人分配一个目的,这和我们经济学家讨论的是一回事,即寻求效益(利益)的最大化。没有任何一个经济学家知道世界上每一个人真实的目的是什么,是什么东西在影响你。这就解释了为什么市场重要。
人工智能的一个核心概念是“识别”。早在20世纪50年代,西蒙教授讨论人工智能的时候,就已经提出“识别”的概念,在那个时代就有了冷识别和热识别的区别和辩论。冷识别是机器能够识别的,热识别是人带着感情的识别,人带着感情的识别机器是学不来的。
人工智能还有一对核心概念是硬数据和软数据。硬数据就是所有可度量可传递的数据;软数据是没有办法用传感器或移动设备度量的,不能度量就无法传递、无法处理。当我们讨论人工智能是基于大数据训练出来的时候,热识别和软数据的问题不包含其中,连基础都没有,又何谈学习,这就是为什么机器终究不是人。
人的智能与人工智能的差别
人的智能和人工智能之间有一道鸿沟。人工智能的基础是可度量、可描述、可传递的数据,满足这几个条件才能训练。
但是人的智能很多是无法度量的。首先,在生物科学上,有一系列基本的人的生命感知,是无法度量的。比如嗅觉、味觉、性欲,这些东西是无法度量的。无法度量的东西,无论你造出来的机器计算能力有多强,算法有多么优秀,因为它没有感知,你造不出来一个机器人来代替品酒师品酒。
其次,人的心理感知也是无法度量的。喜悦、厌烦、痛苦、抑郁、思念、怀旧、贪婪、野心等等,这些心理的内容是怎么演变的、为什么每个人是不一样的等等,都是机器达不到的,因为并不存在这样的数据。
再次,人的智能里有一个非常重要的基本部分就是直觉。直觉是基于人对于硬数据和软数据、冷识别和热识别综合在一起,产生出来的人的一种高度的抽象的跳跃性的反映。这种直觉,不但它依赖的数据不可度量、不可传递、无法机器处理,而且直觉本身也是人无法描述的,这就是为什么师傅带徒弟不一定带得出来,在教学的时候,好的教授之所以好,因为好的教授有更多好的直觉,但是这个直觉传递不过去。
反观机器人、人工智能的社会训练,当不存在这些原始数据的时候,人工智能实际上用的是刻画某些软数据的其他参数,比如说文字、观察某种行为的录像,然后用机器识别出来各种各样的行为,以此来学习。今天我们看到机器人了不起,指的是这个方法。但是这里面也有问题:第一个问题就是片面,第二个问题是静态,也就说你看到的是过去,但不知道将来怎么样。福特不做市场调查,因为当没有汽车的时候,你无法知道消费者的反应;当没有手机的时候,你也无法知道人们对手机的反应。
因此,深度学习的人工智能缺少大量人的基本感知,机器无法通过学习来产生和人相似的效应反射。经济学家并不真知道人真正的效应函数是什么,人分配给机器的效应函数也不可能是人的普遍函数,只能是在一个狭窄范围内定义的、静态的、可预见的效应函数。因此从广义上讲,任何人工智能设备或者机器人的目标函数,不是也不可能代替人类自身的目标。这一想法其实早在西蒙获得诺贝尔经济学奖的时候就提出了,即“有限理性”的概念,这个概念一直影响到今天,而且是经济学发展最前沿的领域。
人工智能能干什么?
人工智能究竟能干什么?能干的事非常非常多,比如它可以规划,也可以执行。但是它能够规划和能够执行的前提必须是,你的目标是清楚设定的。
人工智能会有非常大的革命,它产生在所有你能想象的、能明确规定目标任务的领域,比如说下棋,下棋计算过程很复杂,但目标很简单,就是赢了对方。还有开车、开飞机、开船等等,甚至根据设计制造产品,甚至成体系地设计产品,只有规定的目标就行。在全面自动化的情况下,无人的工厂内,激励机制自然也就消失了。
另一方面。当从事与人有关的工作时,它可以是非常好的助理。它可以是非常好的助教、助理研究院员、金融分析师、医生助理、律师助理、军事参谋。为什么都是助理?因为它没有办法代替人。最近在美国做了个实验,让机器人去经济学系做助教,在不见面的前提下,一个学期过去之后,学生分不出来哪个是真人哪个是机器。但是它必须是助教不能是教授,因为有大量的重要信息,机器没有办法知道。
在最乐观的情况下,如果你有明确规定的狭窄的的目标来执行,机器人都会做,包括战争,当然这是一个严重争议的问题。
用人工智能消灭市场,建立计划经济行不通
人工智能产生以后,计划经济究竟能否代替市场经济呢?答案非常简单,大数据从市场上来,如果把市场消灭了,数据就没有了,人工智能的基础也就没有了。
还有最重要的一点,当你把市场消灭后,试图用人工智能、大数据去解决资源配置也一定会错配,尤其是在跟创新相关的资源配置问题上。在市场中,这些资源配置的大量工作实由风险投资专家做的,因为他们掌握大量的软数据,可以凭他们的直觉做出判断。人工智能只能处理硬数据,没有直觉所以不能产生这个判断。
今天人工智能的人才在哪里?截至今年的第一季度,全球人工智能人才一共190万人,其中中国5万人,而这5万人里面做这行达到十年的不到40%。有85万人在美国,而美国的85万人里,有十年以上经验的占71.5%。原因很简单,在市场的环境下,才能出来这么多的创新能力。你如果把市场的环境搞掉,创新是很难发展的。
本文来源:微信公众号“比较”