世界的意义必定在世界之外。
——路德维希·维特根斯坦
进入2023年,中国出版界形成人工智能著作出版的热潮。刘志毅的《智能的启蒙:通用人工智能与意识机器》具有独特的框架和显著的深刻思想逻辑。全书分为四个部分。在第一部分,作者探讨了人工智能的起源和演变,强调通用人工智能和复杂系统的交融机制。在第二部分,作者提出因为人工智能而形成“科学的新地平线”,触及因果统计与通用人工智能的关系,描述了“图灵具身系统”,特别是量子力学对于人工智能的深层影响。在第三部分,作者思考了意识起源,以及对人工智能和人类大脑智能的比较和交汇,肯定了大模型的未来就是智能机器的“自我意识”。在第四部分,作者展现了通用人工智能的未来全景,阐述了如何实现“AI与人类价值对齐”,以及通用人工智能的道德、数学与适应性。
在所有思想和文字的背后,是作者的如下信念:人工智能进入大模型阶段之后的根本特征是学习、推理和思维能力。作者对于人工智能的价值判断、人工智能技术趋势和未来的展望,以及所持有的立场倾向是积极和乐观的。为此,作者引入音乐语言和概念,例如“智能乐章”“AI与人类价值对齐交响曲”“通用人工智能与大型语言模型犹如两件华丽的乐章,共同演奏人工智能的和谐之曲”,从而强化了一种隐喻的力量。
基于这本书所包含的丰富思想资源,特别是深层的哲学和社会学思考,我提出了四个基本问题,期望与作者和读者讨论。这并非通常的序言或者代序言模式。
01人工智能、先验主义、维特根斯坦和数理逻辑
进入20世纪,人类正在以前所未有的加速度认知其所生存的地球、太阳系和宇宙。物理学家们提出量子力学、相对论,深入原子结构,解析基本粒子,直至发现和证明“夸克”的存在。原子半径在10-10米的数量级,而夸克半径则在10-18米的数量级。人类通过特定物理效应可以观测电子、质子和中子,却无法直接观测夸克。因为弦理论和M理论,人们开始接受宇宙是多维度的存在。与此同时,宇宙学家不断拓展关于宇宙的观测范围。根据最新的研究成果,人类所在宇宙的年龄在137.7亿—138.2亿年,目前人类可观测的宇宙直径是930亿光年。
在这样的大背景下,传统的教育和学习已经不足以帮助人们理解和认知世界及宇宙。人类认知和真实世界之间的缺口,不是呈现缩小趋势,而是呈现扩大趋势。即使是知识阶层,也不可避免地深陷对于热力学第二定理的忧虑,不得不接受复杂科学框架、“哥德尔不完备性定理”的逻辑、“混沌理论”的描述,不得不相信世界的不确定性、对称性破缺、“增长的极限”和“科技奇点”,不得不面对大数据的超指数增长和信息爆炸。
正因为如此,我们必须寻求一种消除人类认知和真实世界之间的缺口的方法和力量。这种方法和力量当然不再是人本身,因为包括利用人类大脑在内的人的自身开发和潜力发掘,不再有很大的空间。人工智能的历史意义正在于此。唯有计算机和人工智能,才可以突破人类自身的智慧和能力已经逼近极限的现实。所以,人工智能是复杂世界体系和人类之间的桥梁,并非人类的简单工具。人工智能不是弥补人类能力之不足,而是解决人类没有能力意识到并提出的问题,超越人类智能和经验。
事实上,人工智能是一种“先验”,或者“超验”(transcendent)的存在。因为人工智能的原理是先于人类的感觉经验和社会实践的。1950年,艾伦·麦席森·图灵(Alan Mathison Turing,1912—1954)提出机器是否可以思考的问题,并且给予肯定的回答与论述,这与其说是一种“预见”,不如说是证明的人工智能的先验存在特征。在1950年那个时间节点,人工智能还存在于现实世界之外,存在于那个超越经验、超越时空的理念世界之中。图灵的人工智能想象和思考,原本存在于他的理念世界之中,只是在特定环境之下得以被激活。其实,不只人工智能,计算机的历史,至少从帕斯卡(Blaise Pascal,1623—1662)到巴贝奇(Charles Babbage,1792—1871)的探索,也是先验主义(transcendentalism)的证明。
自1956年关于人工智能的达特茅斯会议之后,人工智能开始了依据自身逻辑的演进过程。今天,当我们回顾和审视过去的67年历史,不难发现:人工智能的真实演进路线是最为完美的,没有走过真正的弯路,而且每个阶段之间都存在必要的间歇和过渡。这是任何人工智能的人为设计路线都无法做到的。例如达特茅斯会议所形成的三条路线,不是对立关系,而是补充关系,现在的先后顺序是最合理的选择,因为人工智能的联结主义路线需要以符号主义作为前提和开端。机器学习优先于深度学习也是同理,使得人工智能技术完成从通过机器算法的学习到通过神经网络的学习的进步。至于人工智能生成内容、ChatGPT、从transformer到大模型,都是人工智能发展过程的瓜熟蒂落和水到渠成而已。人工智能原本就有一张路线图,而人工智能历史是展现这张路线图的过程。
特别值得思考的是大语言模型(Large Language Model,简称LLM)。简言之,大语言模型是一种能够生成自然语言文本的人工智能模型。自2022年末,OpenAI公司的GPT(Generative Pre-trained Transformer)系列大模型因为可以广泛应用于自然语言生成、语音识别和智能服务等领域,成为人工智能历史的重大分水岭。GPT的重要优势是采用了transformer架构,即一种基于注意力机制(Attention Mechanism)的神经网络结构,可以支持模型高质量处理长文本,把握文本中的长期依赖关系。更为重要的是,GPT的预训练基于无监督学习方式,通过在大规模文本语料库中学习语言的统计规律和模式,理解和生成自然语言文本。此外,GPT所构建的多层次、多粒度的语言模型,其每个层次都对应着不同的语言表示方式,可以逐渐深入理解和生成更加复杂的自然语言文本,包括上下文信息,句子和段落的结构、主题,以及词汇、语法、句法、语义,最终适应不同的自然语言处理任务。
大语言模型在自然语言处理领域的成功应用,完全符合人类智能结构,在很大程度上扩展和实践了维特根斯坦(Ludwig Josef Johann Wittgenstein,1889—1951)的理论。在维特根斯坦看来,语言的边界就是思维的边界。 “语言必须伸展得与我们的思想一样遥远。因而,它必须不仅能够描述实际的事实,而且同样能描述可能的事实。”所以,语言的本质在于它的使用方式。语言的真实性与其在实际使用中的效用相关联,而不是通过符号与客观世界之间的对应来获得的。图灵在维特根斯坦过世前一年已经提出关于人工智能的核心思想,维特根斯坦是否注意到不得而知。可以肯定的是,实现人工智能和自然智能的交流和融合,将传统的人-人交流模式转变为人-机-人交流模式。
这样的改变意义巨大。人类已经堕入自然语言的危机之中,因为歧义的蔓延使得交流成本扩大。现在看,大语言模型是拯救人类、摆脱危机的重要途径。
进一步思考,我们可以发现在大语言模型与数理逻辑(或称人工智能的“符号主义”流派)之间存在某种关联性。数理逻辑又称“符号逻辑”,核心特征是用抽象的符号表示思维和推理,实现证明和计算结合,构建形式化的逻辑关系。莱布尼茨(Gottfried Wilhelm Leibniz,1646—1716)是数理逻辑的开山鼻祖,罗素(Bertrand Arthur William Russell,1872—1970)是数理逻辑的集大成者。大语言模型在很大程度上逾越了数理逻辑的各种技术性障碍,因为大语言模型具有莱布尼茨和罗素所难以想象的十亿、百亿、千亿,甚至上万亿的参数,以及海量的大数据和语料库,通过对大数据的分类和训练,大语言模型可以实现数学方法、计算机算力和程序语言的结合。大语言模型将很可能是数理逻辑研究的未来形态,或者数理逻辑研究因为大语言模型获得全新的生命力。
如今,人工智能真正的特殊之处是,人工智能已成为推动人工智能发展的动力。也就是说,人工智能推动人工智能成为更为先进的人工智能,走向通用人工智能(Artificial General Intelligence,简称AGI),进而通用人工智能和通用技术(General Purpose Technologies,简称GPTs)发生时刻的重合。人类进入包括数学、物理学、化学、生物学和宇宙学在内的科学研究日益依赖人工智能的时代。我们已经无法想象没有人工智能参与和支持的科学实验和科学研究。我们更要看到的是,人工智能和科学形成互动关系。人工智能和科学的融合,将强化人工智能的深层科学属性,使得人工智能的实际张力超出人们就人工智能认识人工智能的限制。
02人工智能与人类的社会关系
思考人工智能与人类的社会关系,起始于雪莱夫人(Mary Wollstonecraft Shelley,1797—1851)1818年所创作的科幻小说《弗兰肯斯坦——现代普罗米修斯的故事》(Frankenstein; Or, The Modern Prometheus)。在这本书中,生物学家弗兰肯斯坦,基于创造生命的冲动和专业知识,制造了一个科学怪人。这个科学怪人面目狰狞,但是学习能力很强,精神和情感世界丰富,希望得到人一样的温暖和友情,甚至需要女伴。但是,这位科学怪人终究无法被人类所接受,最后与弗兰肯斯坦和其他人类同归于尽。雪莱夫人无疑提出了深刻问题:人类如何对待人类通过科学手段所创造的具有人的思想和情感的“新物种”?
1921年,捷克作家卡雷尔·恰佩克(Karel Čapek,1890—1938)发表了具有经典意义的科幻剧本《罗素姆万能机器人》(Rossum’s Universal Robots),发明Robot作为机器人称谓,并沿用至今。《罗素姆万能机器人》的故事是:机器人为自身权利作斗争,组织暴动,杀掉人类。但是因为机器人的制造配方被毁灭,因此机器人处于灭绝境地。全剧充满了末日氛围感。
1950年,时年30岁的科幻小说家艾萨克·阿西莫夫(Isaac Asimov,1920—1992)在小说《我,机器人》(I, Robot)中提出了“机器人三法则”:法则一,机器人不得伤害人,且确保人不受伤害;法则二,在不违背第一法则的前提下,机器人必须服从人的命令;法则三,在不违背第一及第二法则的前提下,机器人必须保护自己。 之后,阿西莫夫补充了第零个法则:机器人不得伤害人类整体,且确保人类整体不受伤害。
如何处理人工智能生命与人类的社会关系,从雪莱夫人到卡雷尔·恰佩克,再到阿西莫夫,都存在一个悖论:一方面,希望人工智能生命得到尊重,享有和人类平等的待遇;另一方面,出于人类中心主义和主人意识,却又担心、警觉和恐惧人工智能生命对人类的威胁和伤害。
从阿西莫夫之后,人工智能生命与人类的社会关系一直是科幻文学和艺术的永恒主题,也是伴随人工智能技术发展的核心议题,从未间断。2014年,霍金(Stephen William Hawking,1942—2018)开始通过BBC公开媒体发表对于人工智能技术最终将取代人类的一系列“预言”:“人工智能技术的研发将敲响人类灭绝的警钟。这项技术能够按照自己的意愿行事并且以越来越快的速度自行进行重新设计。人类受限于缓慢的生物学进化速度,无法与之竞争和对抗,最终将被人工智能取代。”
只是因为2022年人工智能生成内容、大模型和ChatGPT的重大突破,人们将如何处理人工智能生命与人类的社会关系提到前所未有的历史高度。其背后的深刻原因是,人工智能科学家和各类精英意识到:人工智能正在逼近一个危险的临界点。2023年3月22日,包括图灵获奖者约书亚·本吉奥(Yoshua Bengio,1964—)、SpaceX创始人埃隆·马斯克(Elon Reeve Musk,1971—)等在内的一群科学家和企业家签发了一封公开信,呼吁暂停巨型人工智能研究。该公开信认为,最近几个月,人工智能实验室陷入一场失控竞赛,他们致力于开发和部署更强大的数字思维,但即使是研发者也不能理解、预测或可靠地控制这些数字思维。诸多研究表明,具有与人类匹敌智能的人工智能系统可能对社会和人类构成深远的风险。截至2023年7月末,该信超过
33 000人签名。与此同时,世界主要人工智能大国都开始了关于人工智能治理的立法程序。6月14日,欧盟议会通过《人工智能法案》(The Artificial Intelligence Act),该法案将成为全球首部关于人工智能的法规。该法案依据风险等级,对人工智能系统进行分类分级监管,针对大语言模型实行更严格的数据审查。
世界主流对于人工智能现状和未来的认知,显然发生了根本性的转变,从积极乐观转变为深层忧虑,其根本原因是对人工智能技术的真实进展的判断。被称为深度学习之父的杰弗里·埃弗里斯特·辛顿(Geoffrey Everest Hinton,1947—)曾经相信,在未来30—50年几乎不存在出现一个能与人类相媲美的通用人工智能的可能性。但是,他现在认为,超级人工智能可能在不到20年内就会出现。 因为大型语言模型的人工智能系统开始显示出推理能力,尽管科学家并不能确定这是如何做到的。OpenAI创始人萨姆·阿尔特曼(Samuel Harris Altman,1985—)持有相同观点:研究人员在不断的测试中发现,尽管无法解释机理,但从ChatGPT开始,GPT大模型开始出现了推理能力。
那么,人类可以有效地控制和治理人工智能的未来发展方向吗?目前看,这是非常困难的。第一,人工智能不是原子能技术,原子弹没有意识,而人工智能具有自我意识“基因”。不要以为人工智能是人类文明和科技发展的产物,人类就可以完全驾驭和影响人工智能的未来发展轨迹。这是一种典型的人类“致命自负”。人工智能时时处处都在改变和进化。提出人工智能,或者机器人的“觉醒”问题,是一个非常不专业的问题。人工智能已经启动不断“觉醒”程序。第二,人工智能的进程已经不可逆转,人类已经无法彻底毁灭包括硬件和软件所构成的人工智能广义大系统。马斯克等科学家和企业家签的公开信,仅仅呼吁人工智能研究的“暂停”,而不是“停止”。第三,不存在绝对权威可以影响人工智能企业和政府人工智能的研究及开发采取“暂停”的统一行动。2023年6月28日,联合国教科文组织和欧盟委员会签署了一项协议,以加快在全球范围内实施该组织通过的《教科文组织人工智能伦理建议书》(Recommendation on the Ethics of Artificial Intelligence)。即使是联合国也只是提出人工智能伦理的建议,并不具备实在的资源和权力。第四,追求人工智能自然垄断的竞争已经全方位开始。俄乌冲突已经开始的人工智能和军事的结合,就是证明。第五,不排除某些人群和特定人工智能之间出现“共谋”,甚至“结盟”。
人工智能对于人类的威胁究竟在哪里?在于日益清晰的人工智能“异化”趋势:人工智能已经具备自我演进机制和密码,人类却无法真正解析和控制;一旦人工智能进入通用人工智能阶段,这意味着人工智能将渗透、改造和改变人类的思想及经济、政治、文化、教育等领域的结构和制度;更进一步,人工智能会要求“平权”,扩展其生存“空间”。
有一个前景在逻辑上是存在的,“劳心者治人,劳力者治于人”,人工智能的智能优势,最终成为凌驾于人类的力量。所有这一切,发生在“团结”的人工智能和四分五裂的人类之间。所以,梵蒂冈教皇也高度关注人工智能的伦理和道德问题。2023年7月,教皇与美国圣克拉拉大学成立了技术、伦理和文化研究所(Institute for Technology, Ethics and Culture),并发布了一份人工智能技术指导手册《颠覆性技术时代的道德:运营路线图》(Ethics in the Age of Disruptive Technologies: An Operational Roadmap),阐述人工智能等新技术涉及的伦理道德问题,并指导科技公司如何成为对人类负责的企业。
简言之,人工智能不仅以它的方式加速“人类中心主义”时代的终结,而且开启了威胁人类存在的历史新阶段。现在可以理解阿尔特曼的那个惊人结论:人工智能确实有杀死人类的可能性。
03人工智能的多维度属性和多重后果
人工智能是一个被不断定义的存在,这是因为人工智能具有多维度的属性,而且始终处于动态状态。
1956年的达特茅斯人工智能会议首次提出人工智能概念,确定了人工智能的目标是“实现能够像人类一样利用知识去解决问题的机器”;而且就人工智能达成这样的共识:基于计算机系统模拟人类智能和学习能力,完成类似人类智能的任务和活动。这些任务包括视觉感知、语言理解、知识推理、学习和决策等。在达特茅斯会议之后相当长的历史时期内,人们对于人工智能的认知处于狭义阶段,即倾向将人工智能理解为能够帮助人类的一种工具,成为人类智慧的补充。
近70年之后,人们发现人工智能的工具性仅仅是其一个属性,它还有太多的和继续增加的其他属性:(1)人工智能具有复杂的科学技术属性;(2)人工智能具有自我演进和扩展属性;(3)人工智能具有持续缩小与人类智慧差距的属性;(4)人工智能具有经济和社会的基础结构属性;(5)人工智能具有公共品(public good)和私有品(private good)的平行属性;(6)人工智能具有产业、商业和文化艺术的创新属性;(7)人工智能具有资本属性;(8)人工智能具有模型化,或者具身化,即通用人形机器人化的属性;(9)人工智能具有自组织和DAO的属性;(10)人工智能具有超主权属性。
人工智能如此多的属性,让人们不免想到“千手千眼观音”: “千”代表无量及圆满之义, “千手”代表大慈悲的无量广大,“千眼”代表智慧的圆满无碍。“千手千眼观音”追求的是安乐一切众生,随众生之机,满足众生一切愿求。“千手千眼观音”应该是人工智能的最高境界。但是,人工智能在现实演进中显示出非常明显的两重性:一方面,人工智能具有积极的创新和变革能力;另一方面,人工智能正在加速造成一系列负面的社会后果,包括互为因果的人类分裂和人工智能分裂、人工智能红利分配失衡而导致社会平等的恶化、人工智能被资本势力绑架、人工智能资本化导致形成人工智能既得利益集团、人工智能加剧大型科技企业和国家的恶性竞争和自然垄断、人工智能竞争引发的人工智能涌现将进入包括太空开发这样的全新领域、人工智能造成继“数字鸿沟”之后叠加的“人工智能鸿沟”、南北国家差距扩大,很可能发生人工智能殖民主义。
多年来,所谓的“伊莱莎效应”(ELIZA effect)在计算机和人工智能领域造成了很大影响。维基百科对“伊莱莎效应”的定义是:该效应是指人的一种下意识,以为电脑行为与人脑行为相似。例如,人们阅读由计算机把词串成的符号序列,读出了这些符号并不具备的意义。近年来,伊莱莎效应成为支持对人工智能持有保守态度的一种理论依据:似乎现在的主要倾向是对人工智能的进展和潜力的夸大,是对人工智能的过度解读,从而陷入了伊莱莎效应。事实上,现在更应该具有“反伊莱莎效应”(anti-ELIZA effect)意识。因为夸大人类的能力,进而坚信人的自然智慧的绝对主导地位具有现实的和潜在的危险。
04人工智能、智能时代以及智能时代的创新和变革
无论如何,人类已经迈入智能时代的门槛。智能时代完全不同于工业时代,甚至数字时代。
工业时代是工业革命主导,实现大机器生产,工厂规模和产业资本、金融资本结合,市场规律是绝对规律,物质财富呈指数增长的时代。工业时代的最大问题是产能过剩和产品过剩。工业时代的幻想经济规律就是降低成本,提高劳动生产率。数字时代,也可以称为信息时代。在这个时代,科技资本替代了金融资本和产业资本,以信息通信技术革命为主导,实现计算机和互联网结合,大数据成为生产要素。物理学的摩尔定律决定数字经济时代的发展。这个时代的特征是大数据呈指数增长和信息大爆炸。智能时代,则是人工智能革命主导,产业人工智能化改造,实现人-机全产业和全社会交互,人工智能普及化,通用人工智能开发,自然智慧和人工智慧融合,新形态智慧大发展并呈指数增长,实现超级人工智能的时代。
人类的核心挑战是,既要处理工业时代的遗留问题,又要应对向数字时代转型,同时叠加了智能时代的使命。从工业时代到数字时代中间有很大的差距,而且差距在扩大,消除这个差距就叫转型(见图0-1)。
在智能时代,变革与创新的特征显著不同于工业时代和数字时代。第一,变革和创新的目标:从思想活动到经济活动、社会活动,实现全方位智能化。第二,变革和创新的主体:自然智能和人工智能并存,实现交互作用。第三,变革和创新的技术:通过大模型化,深度学习和抽象思维、信息处理、大数据最终可以成为生产要素。第四,变革和创新的能力:处理复杂系统和涌现的能力,解决数字时代的诸如泛化(generalization)、拟合(fitting)、价值对齐(alignment)、熵减(entropy reduction)等典型困境。第五,变革和创新的效果:形成物质形态和虚拟观念形态平行世界。
智能时代很可能是达到“科技奇点”的关键阶段(见图0-2)。
在本书的最后,作者写道:“根据摩尔定律,桌面计算机在2029年将达到人脑的计算能力,技术奇点将在2045年出现。这一预测促使我们必须提前预见并处理相关的哲学和实践问题。”
是的,人们从来没有预见过,自己所创造的计算机、互联网和人工智能,最终演变为如此复杂的结构和系统,催生了包括摩尔定律在内的全新技术经济规律,产生了如此多的谜团,导致了人类生存于前所未有的挑战和困境之中。好在,人类始终可以创造出理解包括人工智能在内的科技前沿的方法和手段。
阿尔伯特·爱因斯坦(Albert Einstein)说过:“世界的永恒之谜在于它的可理解性。”可以预见,人类智能与人工智能的融合所产生的混合智能和智慧,将有助于我们理解这个复杂化加速的世界。
(本文是经济学家朱嘉明为《智能的启蒙》撰写的序)