人工智能视域下社会学“费孝通悖论”求解
石英
内容提要:
费孝通晚年提出社会学应当具有“科学”和“人文”双重属性的命题,有学者称为“费孝通问题”或“费孝通悖论”。近年中国社会学界关于社会学方法论和本土化的论争,追根溯源都可以归结为社会学科学性与人文性能否统一和如何统一的问题。人工智能的最新进展为回答这一问题提供了启示:机器认知是从逻辑思维走向形象思维;暗知识的发现证明直觉和隐喻的合理性;诗性而“模糊”的自然语言可能比精确严密的数学语言更适于社会研究成果的表达;科学与人文融通的方向和路径,不是用科学规范人文,而是让科学归于人文。“费孝通悖论”的本质:让工具理性服从于价值理性,让科学性服务于人文性。人工智能为社会研究提供了利器,但人工智能替代不了社会学家的作用。社会学者应当更加积极主动地投入到智慧社会建设之中。
关键词:
费孝通悖论、人工智能、复杂性科学、社会学想象力
一、费孝通悖论:方法论与本土化之争溯源
中国大陆社会学恢复重建的领军人费孝通先生2003年发表《试谈扩展社会学的传统界限》一文,提出社会学应当具有科学和人文“双重性格”的命题[1],引发国内社会学界广泛而持久的关注。仇立平(2016)在《社会研究方法论辩背后的中国研究反思》中指出,晚年“费孝通之问”是中国社会学研究无法回避的问题。不可高估科学理性在社会研究中的作用,定量研究和定性研究都有其不足,只有将定性研究和定量研究结合在一起,或许有可能接近对“经验事实”的认识[2];陈云松(2016)认为费老所说的人文性与科学性兼而有之只是一个愿景,方法之争反映了中国社会学的不成熟,呼吁“走出费孝通悖论”[3];渠敬东(2016)在《破除“方法主义”迷信——中国学术自立的出路》,对“方法主义”及其所带来的“学问与生活的疏离”进行了批评[4];潘绥铭和刘林平(2016)围绕定性定量方法进行了激烈论辩,潘文《生活是如何被篡改为数据的?——大数据套用到研究人类的“原罪”》对“一切皆可量化”观点提出质疑[5],刘则以《大数据有“原罪”吗?——与潘绥铭教授商榷》认为潘的认识存在对大数据的严重误解[6];赵鼎新(2015)指出“科学其实只是一种片面而深入地看问题的方法”,并论证了自然科学与社会科学具有根本性区别[7];风笑天(2017)认为,定性研究与定量研究有着本质差别,二者的结合不可能发生在抽象的认识论和理论视角层面,只能发生在方法论和具体方法层面[8];王宁(2017)指出社会学本土化的讨论应深入到“知识创新力不足”的制度根源层面[9];谢宇(2018)发文《走出中国社会学本土化讨论的误区》,从知识的普遍主义角度认定“社会学本土化”是一个“伪问题”[10];翟学伟(2018)则以《社会学本土化是个伪问题吗?——与谢宇商榷》针锋相对予以反驳[11]。
梳理近年国内社会学界围绕定性与定量、本土化与国际化等问题的讨论,一方面表明,中国社会学恢复重建40年,已经从一开始的引进照搬走向独立思考,尝试建立能够与国际接轨的中国社会学话语体系理论体系;一方面可以发现,方法之争的背后反映出学界对中国社会学研究和发展方向的反思乃至焦虑,其焦点其实就是被归纳为“费孝通之问”甚至“费孝通悖论”的科学性与人文性能否统一和如何统一的问题。
从学科分类角度,科学,指数理化天地生等自然科学学科,人文,指文史哲、艺术、宗教等学科。一般意义上,科学性与人文性的区别,在于前者属逻辑思维,后者是形象思维;前者重工具理性,后者偏价值理性。社会学被认为是介于科学学科和人文学科之间的过渡性“社会科学”,其科学性和人文性能否统一、如何统一?人工智能的进展或许可以让我们从中得到启示。
二、人工智能:从逻辑思维到形象思维
1.图灵测试(Turing Test)、深蓝(Deep Blue)、阿尔法狗(AlphaGo)
人工智能(Artificial Intelligence,AI),也被称为“机器智能”。是新的科学技术革命的前沿领域,是世界经济转型产业升级的“风口”,也是当前社会普遍关注的重要热点。早在上世纪中叶,人工智能的概念和设想就已提出,但直到最近几年才有了突飞猛进的爆发式发展。一方面是由于互联网、大数据、云计算奠定了人工智能的物理基础,一方面得益于人工智能的“算法”突破了旧有思维模式。人类智能来自于人的思维,思维的器官是我们的大脑。我们把电子计算机称为“电脑”,但人们并没有将普通电脑称为人工智能。这是因为公认的“人工智能之父”英国数学家图灵提出了评估机器是否具有可以思考的智能的标准——图灵测试(Turing Test):就是当人类测试者向机器提出一些问题由机器作答,当测试者无法分辨给出答案的对方是人还是机器,则该台机器即通过测试,认为其具备“智能”。因此,普通公众对人工智能的认知,是在人与机器的智力比较中获得。于是,发生在1997年和2016年的两次棋类“人机大战”,成为人工智能发展史上重要的里程碑和转折点。1997年5月11日,一台由IBM公司开发的命名为“深蓝(Deep Blue)”的计算机挑战国际象棋世界冠军卡斯帕罗夫,并最终以3.5∶2.5获胜。不仅震惊国际象棋界,也形成一波人工智能舆论高潮。然而计算机科学家十分清楚,“深蓝”的国际象棋赢的其实很艰难。“深蓝”重达1270公斤。利用30个IBM RS/6000处理器运行搜索,480个定制处理器执行行棋功能,平均每秒搜索12.6亿个节点,峰值时可达33亿个节点,每步棋可生成多达300亿个棋局[12]。设计者是一个由计算机专家和国际象棋高手多人组成的专家小组,事先对卡斯帕罗夫下过的所有棋谱进行深入研究,输入了一百多年来世界顶尖国际象棋优秀棋手的对局棋谱两百多万局,对各种可能性写出应对程序,设计搜索算法,实际对弈中采用“穷举法”逻辑推理。也就是说,“深蓝”的胜利是依赖于强大的硬件,依靠计算机逻辑计算的“蛮力”取胜的。在勉为其难赢得胜利后,IBM即宣布“深蓝”退役。刚刚似乎热起来的人工智能又陷入近20年的“潜伏期”。“深蓝”机器人偃旗息鼓,而由谷歌开发的围棋程序“阿尔法狗”则另辟蹊径,从“穷举法”逻辑推理到人工神经网络、“深度学习”,在围棋人机博弈中积累经验、愈战愈勇。2016年3月,“阿尔法狗”对弈职业围棋九段李世石,最终以4:1总比分取得胜利,震动全世界。2017年5月,又以3:0完胜世界排名第一的棋手柯洁。并自此保持了不败的记录。人类围棋高手由一开始的半信半疑不服气,到完全没有还手之力,不得不甘拜下风。围棋被认为是最能体现人类智慧的棋类游戏。棋盘和棋子简单而直观,就是在19×19几何平面上的线性位置结构产生的相对竞争(博弈)关系。围棋的局面由双方博弈过程共同形成的位置关系决定,没有不变的前提变量的设定,完全是双方棋手独自看局观势的直觉判断和策略博弈,所以围棋能体现人的直觉的智能。[13]好的棋手经过长期的训练积累,形成良好的“棋感”,能够从整体局面观“势”,迅速做出判断并创造性地落子。由于每一落子都会带来几乎无限的可能性,棋局变幻莫测。如果像“深蓝”一样依靠“死记硬背”棋谱和穷举搜索的算法模式,计算能力再强大的机器要战胜人类围棋高手也几乎全无可能。因此可以认为,“深蓝”的胜利是硬件的胜利,“阿尔法狗”的胜利则是软件的胜利。
2.符号逻辑、专家系统到深度学习
从“深蓝”到“阿尔法狗”的机器人进化,实际上反映出人工智能发展过程中由“符号逻辑推理——专家系统——人工神经网络深度学习”的关键演进历程。符号逻辑是人工智能早期思想。认为只要解决了自然语言处理即符号化问题,基于少数几条基本的公理和定义,依赖于计算机强大的的计算能力、存储能力,通过数理逻辑和博弈论推演,即可演绎出新的定理和其它推论。实际上目前一般计算机的统计分析软件都已能够很好地达到这种“智能化”效果,但人们发现这种方法只能在一些小规模简单问题上应用,随着问题规模的扩大和复杂化,其搜索空间规模呈指数型急剧上升,根本无法解决现实世界实际问题。专家系统在单一符号逻辑推理基础上更进了一步,是旨在将人类专家决策能力与机器符号逻辑推理能力相融合的系统。专家系统通常分为两个子系统:知识库和推理引擎。知识库是存储结构化信息的技术手段,推理引擎是一种自动推理系统。专家系统的知识库规则与事实来自人为定义和补充,通过“人机回圈”(Human-in-the-Loop)、“众机回圈”(Society-in-the-Loop)实现“人机互动”,人是规划环路的一部分,人的判断既用于业务决策,又被反馈到机器学习算法中使其更加“智能”。有点类似于软科学研究的“德尔菲法”。可以想见,其智能不可能超过人类智能水平。
人工神经网络是对人脑生物神经网络的模仿。人类意识之谜还没有完全解开,人脑具体是怎样工作的机制还不清楚,但解剖生理学知道了大脑的结构,由蛋白质,人脑中有1000亿个神经元,生物神经网络依靠数量庞大的神经元和突触连接构成。无论何种思维都落实为神经系统的生物性-物理性-化学性运动。人工神经网络摒弃了给机器输入逻辑规则的思路,而是尝试模仿人脑结构“重建”大脑。以感知器替代神经元,以并行方式电子电路模仿神经元连接,人工神经元网络结构呈多层分布,因此被称为“深度神经网络”,随着反向传播算法的提出,人们可以通过预训练微调非循环多层神经网络,模仿人脑达到“学习”的目的。学习过程就是调整每个人工神经元中保存的参数值的过程。学习训练的过程区分为监督学习、无监督学习和强化学习,反复训练,即所谓“深度学习”。每个人工神经元保存的参数值即神经网络的“记忆”,信息被分布存放在整个人工神经网络中。
阿尔法狗了不起的是它能够像人一样拥有“棋感”,能“看懂”围棋的“势”,对每一个局面估算有利程度,取有利程度最大的选择,推测当前最优走子。围棋棋局的“势”即局势、形势,是棋手从整体出发对棋局的判断。人类棋手的棋感在强化训练反复实践长时间积累中形成,是人类特有的直觉。对于机器而言,如果你给它看一张图片,它“看到”的无非是一推0/1这样的二进制数字,除了可以很快数出图像里面包含有多少种不同颜色及其排列的信息外,其它的一概不知。数码相机用“像素”表示清晰度,电视电脑显示屏区分多少多少“线”,机器读图是一由点到线到面的“逐行扫描”的过程。而人一开始是从全局的角度看这个图片,一眼就能知道这个图片大概是什么东西、什么内容。这是整体模糊识别,可能会自动忽略一些不重要的细节,同时抓住特征和关键。可以看到,目前人工智能的飞速发展很多都是从图像识别开始。人工智能神经网络应用在计算机视觉上的重要突破,就是不再让计算机用0/1来逐点逐行扫描识别图像内容,而是让计算机依靠分散存储全局并行的深度人工神经网络,在观察刺激“学习”中去自动抽取图像的语义特征。当然一开始很可能只是一个一个小图块组合方式的语义特征,反复训练就可以开始慢慢地感知到这个图形的组合特征,进而形成概念、意义,识别规律,做出判断、决策。在过去这一过程因太漫长而难以实现应用。随着信息传输存储技术发展,加之高性能图形加速处理器加速,互联网大数据时代机器海量阅读学习效率越来越高。阿尔法狗比人厉害在于它一天能下数百盘棋,获得迅速积累,而人类棋手即使不吃不喝不睡,一天也下不了十局。这就是阿尔法狗能够很快超过人类棋手直至战无不胜的原因。计算机模拟人类学习功能,从大量数据中发现规律提取知识,不断完善增强自我。这是机器向人学习。可以看到,由符号逻辑——专家系统——人工神经网络深度学习的人工智能进化过程,机器“认知”开始由严密、精确的逻辑思维转向整体、模糊的形象思维。这是一个重要的转折点:意味着“科学”与“人文”之间的最后一层窗户纸正在被戳破!
三、以科学规范人文:中国社会学恢复重建的逻辑困境
1.早期社会学中西方不同传统
社会学作为一门学科诞生于西方工业革命之后自然科学兴起和大发展时期。创始者法国人孔德1840年左右最先提出社会学概念,一开始称其为“社会物理学”,并认为是人类认识史上“科学序列”最高级也是最后一门学科。他对科学的排序依次为:数学、天文学、物理学、化学、生物学、社会学。之后,一代代西方社会学大师不断丰富发展着这门学科的理论和方法体系,两百余年来,社会学发源地欧洲与后来居上的美国之间各自形成不同的研究传统和学派。从结构功能主义、符号互动论、批判主义,其理论演变始终存在人文主义与科学主义的此消彼长和激烈论争。20世纪中叶,西方社会科学开始涌现各种“后现代”理论和思潮,如格式塔心理学 、胡塞尔现象学 、符号互动主义、常人方法论、建构主义、结构主义、精神分析、女权主义等,社会学领域出现对“量化”研究的“反抗”思潮。质性研究方法的兴起和成熟一定程度上正是这些理论思潮集大成的产物。总体看,西方社会学的发展由一开始强调逻辑实证的科学主义越来越朝向于人文主义思潮。
社会学最早传入中国是在19世纪末20世纪初叶,正值社会大动荡时期。当时的学科分化和学科界限不似今天这样清晰,社会学、民族学、人类学不分家。第一代中国社会学人大都学贯中西,熟谙历史,具有深厚的传统文化底蕴。他们对社会理论的探讨,自觉而自发地以“社会问题”为导向,紧密联系着改造变革社会的实践展开。并形成了“学院派”、“乡村建设派”和中国共产党人的“革命派”社会学特色和风格。即使在艰苦卓绝的抗战时期,我国的社会学教学研究都没有停滞,西南联大在昆明开启了中国社会学史上著名的“魁阁时代”,建立人类学调研基地,开展乡村田野调查。总体上看,中国早期社会学并没有那么多“科学”的框框,而是更多具有“人文”的色彩。反倒是自1979年“恢复重建”以来,在社会学研究方法体系上形成了问卷调查统计分析为主流的学科建设方向。可以认为,中国社会学与西方社会学发展路径似乎截然相反,由早期偏于人文主义的路径到今天演变为“科学社会学”范式的一统天下。
2.恢复重建社会学的历史背景与“技术化”倾向
中国大陆社会学的恢复重建与改革开放完全同步,迄今整整40年。1979年3月以费孝通为会长的“中国社会学研究会”的成立,标志着社会学恢复重建的开始。重建中国社会学,费孝通提出首先是要有社会学的“五脏六腑”:五脏是学会、研究所、院系、图书资料、刊物;六腑是社会学六门基础课,社会学概论、社会学理论、社会调查研究方法、社会心理学、经济社会学、比较社会学。[14]从引进教材、培训学员,“中国社会学在恢复之初,主要是请美国社会学家来华讲学,受到美国社会学的研究风格影响较多一些。因此,30年来的中国社会学在研究风格上更具有实证研究的特点。”[15]
前面谈到,西方社会学总的趋势是由逻辑实证主义起始,到现代人文主义思潮逐渐占上风,美国也不例外。但为什么中国恢复重建引进的美国社会学基本上是科学主义的“统计社会学”?一方面,“美国社会学与经济学和统计学早期多年的亲缘关系,奠定了其量化与统计技术使用的传统……要摆脱欧洲的人文和思辨风格”[16];另方面还要看到,无论是恢复重建初期请到中国来讲学还是后来“走出去、请进来”交流的美国社会学家,大都为华裔移民,鲜有美国本土出生的非亚裔社会学者。这些华裔移民即使已经在美生活了几十年时间,恐也很难具有几代居住在美国的“纯正”美国人所拥有的美式思维方式和文化直觉。而出国留学的中国人大都具有较好的数学能力和逻辑思维能力,量化分析研究方法是华人观察研究美国社会的一种较佳视角,但未必就代表了美国社会学当代发展的趋势。
社会学恢复重建初期的时代潮流也决定了中国社会学必然走“科学社会学”之路。当时的中国百废待兴,1977年恢复高考,1978年全国科学大会,科教兴国,人们欢呼“科学的春天”到来。走出迷信,崇尚科学,科学的地位至高无上,社会学作为一门科学当然必须符合科学的特性和标准:客观性,价值中立;实证性,可重复、可检测;逻辑性,精确定量,数学语言表达。
当社会调查研究愈来愈程序化,操作化,规范化,从资料收集、理论预设、抽样方案,问卷设计、量表测量、信度效度检验、到统计分析等环节,课题设计者、数据采集者、数据分析者、论文撰写者,分工愈来愈细,形成工业化的“产业链”。随着计算机统计和信息技术的发展,大规模问卷调查越来越容易操作,机器编码识别、SPSS、SAS等统计分析软件把交互分析、回归分析、趋势分析、聚类分析、相关分析等过去复杂高深的统计计算变得轻而易举。我们千方百计追求测量数据的信度、效度、精确性,控制和区分自变量、因变量,中间变量,确定相关性,判断因果关系,建构数学模型。研究者越来越工具化,人的主观能动性也越来越被抛到一边。社会学研究已成为完全由工程思维主导的“技术活”!
其实不光是社会学,在包括经济学、法学等在内的整个中国社会科学领域,总是有太多学者担心“中国社会科学离科学还有多远”,但很少有人考虑“人文性”在社会科学中应否和怎样保留一席之地。
3.社会学想象力的弱化和缺失
那么,社会学的“专业性”究竟是什么,是以数理统计为基础的抽样技术、资料分析技术吗?
中外社会学经典教材中,普遍把“社会学想象力”作为社会学区别于经济学和其他社会科学学科的重要特征。社会学想象力(sociological imagination)是美国社会学家赖特·米尔斯1970年提出的概念。“社会学想象力能够使人们关注有限的个人经验和更为广阔的社会历史事件之间的联系。”[17]米尔斯指出,这种想象力是一种视角转换的能力,换位思考能力,是将个人议题转化为公共议题的能力。社会学想象力也被称作“社会学视野”,还有港台学者译为“社会学构造力”。美国社会学家约翰·J·麦休尼斯认为,“社会学是关于人类社会的系统研究。社会学的核心是一种被称作社会学视野(Sociological perspective)的特殊观点”[18]。
据此,如果要谈社会学的“专业性”,比数理计算能力更应当强调的是——社会学想象力!笔者以为,社会学想象力本质上是一种联想能力,是基于经验的直觉感悟能力,是透过局部看整体、透过现象看本质的能力,是合乎理性的批判反思能力,是来自于长期参与、观察、体验、感悟、思考的结果。它更多是一种形象思维,而不是逻辑思维。富有社会学想象力的学者能够在个人体验与公共议题之间建立联系、在微观经验与社会趋势之间进行穿梭。社会学想象力帮助我们找到这个时代在历史中的定位,找到个人在社会结构中的定位。很多难以从个人经验获得完整解释的社会现象,一定源自于某种个人无法控制的社会结构的力量,而这种结构的力量往往是从统计数字分析不出来的。还有一些由“蝴蝶效应”引发影响历史进程的“突发事件”,也几无可能从逻辑因果链数学模型推导和预测。公安人员破案,军事家指挥战斗,甚至企业家设计和生产产品占领市场,直觉和想象力的作用也许比逻辑推演更大。
事实上,我国高校社会学教材也普遍把社会学想象力作为重要概念被提及,但往往还是停留在西方社会学经典案例“一杯咖啡”引起的联想,而对于社会学想象力的本质究竟是什么,怎样训练社会学想象力,中国社会学教材和课堂似乎并未予以足够的关注。与之相反,我们热衷的是“找数据”,建数据库、实验室。把本应鲜活生动的社会学硬生生变为了一门数据科学。社会学的想象力在不知不觉中被“工程思维”所取代,不断弱化、淡化乃至消解,变得可有可无。缺乏想象力的社会学犹如失去了灵魂,难怪有些“找不着北”。
4.确定性追求与不确定性问题
回顾近代自然科学的发展历程可以看到,科学的发展史可以说是一部追求“确定性”的历史。科学家正是不断地克服不确定性和人的主观性,运用精确的数理工具和方法,才有了客观和确定性的科学理论和技术,基于工具文明的加速进步,使得人类社会呈加速度登上了一级级更高的台阶。
这里,还原论是近代自然科学认知和方法的核心理念。认为任何复杂的事物、现象都可以分解为更为简单的各个组成部分来加以认识、描述和处理。将整体分解为部分,高层化解为低层。研究物质世界,化学以物理学为基础,生物学又以化学为基础。然而当物理学研究进入基本粒子层次,生物研究涉及到生命现象,还原论思维和确定性追求似乎失效。
德国物理学家海森堡于1927年提出了“测不准原理”,单个微观粒子的位置与动量不可能同时被确定,位置的不确定性与动量的不确定性遵守不等式。这一原理打破了经典物理学关于所有物理量原则上可以同时确定的观念,奠定了量子力学的基础。按照海森堡的表述,测量行为不可避免地搅扰了被测量粒子的运动状态,因此被理解为一种“观察者效应”。后来物理学家指出“测不准”正是由于“不确定”,“不确定性”是微观粒子的内秉性质,无论是否被测量被观察,都处于“不确定”状态。也就是说,“测不准”和“不确定”是完全等价的。至此,“测不准原理”又被称为“不确定性原理(Uncertainty principle)”。
随着科技的进步人们逐渐发现,“不确定性”比“确定性”更为基本和普遍,在确定性的周围存在着广阔无垠的不确定性海洋,确定性问题只是我们所面对的问题中极小一部份。量子力学领域我们不知道“薛定谔的猫”在某一时刻是死是活。在计算机理论研究领域,大量的“不确定性问题”(Nondeterministic Problem,NP)给人类认知带来深深的困惑。NP既不是算法可确定性计算的,也不是算法可判定的。
人们或许认为,量子世界的不确定性不等于社会运行的不确定,二者之间没有逻辑上的关系。然而不难想象,如果物质世界基本粒子都“测不准”,社会中人的行为就更加测不准。人不同于物在于人有思想有感情有性格,且人的想法还会随时改变。人与人的关系、个体与社会的关系比之基本粒子之间的作用要更加错综复杂得多。真正的不确定性是“人”的不确定性。社会学是“群学”。由人所构成的人类社会,任何社会现象社会事件的发生,都是一个个具体的人的行为的集合表现。人是环境的产物,受历史的局限。量化分析的社会学研究,尽可能把复杂问题简单化,抽象概念具象化。概念的操作化、指标化,以图对组成社会的人的态度、思想和行为进行尽量精准的测量。这也是一个“还原”的过程。然而不难想象,正如量子力学“测不准”是由于测量行为不可避免地扰乱测量对象微观粒子,社会调查对人的“测量”行为无论设计多么精巧,也不能避免对调查对象的干扰,不可能得到“精准”结果。实际上每一次我们认为信度很高的问卷调查结果几乎都经不起重复检测,同一份问卷同一个调查对象两次填写的结果都会不同。我们可以用信度、效度去解释,去校正,但根本不可能达到像自然科学研究那样可证实、可证伪、可重复、可检测的严格标准。
然而,正如基于还原论的数理实验科学在探索物质世界中获得巨大的难以想象的成功,使得还原论成为人们认知世界的基本思维方式。计算机强大的解决问题的能力也给人们带来一种观念上的错觉:所有的不确定性问题最终仍可能确定性地解决。
一定意义上,科学与人文的区别,就是“确定性”与“不确定性”的区别。当我们试图用“科学”去规范“人文”,用追求“确定性”的科学方法去解决充满着“不确定性”的人文社会的问题,势必陷入内在的逻辑矛盾。
四、暗知识:复杂性科学向人文社会科学的跃迁
1.暗知识与人工智能恐惧
理论物理学发现“暗物质(dark matter)”的存在,证明了宇宙中还存在着现代科学无法企及的领域,尽管今天的科学以如此发达,未知世界仍然远远大于已知世界。人工智能发展,又引出了“暗知识(dark knowledge)”的概念。
我们将“深蓝”与“阿尔法狗”对比,开发“深蓝”的IBM工程师十分清楚地知道“深蓝”是如何战胜了国际象棋冠军卡斯帕罗夫,但开发“阿尔法狗”的谷歌工程师对于“阿尔法狗”的胜利却是“知其然不知其所以然”,无法从机理上说清楚。阿尔法狗使用了深度神经网络配合强化学习训练的方法,不依靠人类棋谱先验知识,从零开始自主训练,通过与人类棋手的博弈和不断地自我博弈,积累经验飞速进步,进而达到战无不胜的境界。从“深蓝”到“阿尔法狗”,由穷尽棋谱到“自学成才”,“阿尔法狗”成功的背后,同时也带来一个科学上从未遇到过的问题,那就是不可解释性。与通常人们所理解的算法或计算机原理不同,尽管模仿大脑神经突触联接得到了具有“学习”能力的人工神经网络模型,但仅仅只是基于对人脑物理结构的“模仿”产生的效果!它既不是数学理论的计算推导,也不是物理定律的归纳演绎,当然也就不是基于机理的设计,谈不上机理上的理解和解释。也就是说,其工作机制是一个“黑箱”,既不能像算法程序一样被取出来,也不能被编辑移植。信中利美国创投公司创始合伙人王维嘉将这种人类无法理解、不可感受又不可表达的知识称为“暗知识”,并认为这是一种新的知识类型。[19]阿尔法狗战胜人类棋手,标志着人工智能研究迈上了一个崭新的台阶,也开启了新一波人工智能研究热潮。不长时间内,人脸识别、语音翻译转换、法律咨询、疾病诊断、甚至写诗作画等人工智能应用,都已经显得比人强,似乎很多岗位都要被机器人所替代。与此同时,对人工智能发展的恐惧也达到空前。通过一些科幻作品和媒体宣传,从普通公众到前沿科学家,都从法律、伦理、安全等不同角度对人工智能发展前景表示了担忧。甚至担心未来会否出现机器人统治乃至消灭人类?科学家的担心并非完全是杞人忧天。因为模拟人脑功能的机器学习产生了“暗知识”。对于“暗知识”,人类不仅无法表达无法学习,甚至无法体悟无从感受。在人类认识史上,第一次真真切切地感觉到竟然存在着我们永远无法认知和掌握的知识!人工智能机器做出的判断和选择总是比人正确。为什么正确?我们只知其然而不知其所以然。而未来机器在不长时间内所“发现”的暗知识有可能会让我们数千年积累的知识显得微不足道。人类是如此渺小,恐惧由此而生。
2.默知识、软知识与直觉
“暗知识”不可理解、不可表达;与之相对应,能用语言文字、符号图像等方式表达和传播的知识则叫做“明知识”。王维嘉将“暗知识”归为“第三类知识”。那么除明知识、暗知识外,还有哪一类知识?
早在八十年前,诺贝尔经济学奖获得者哈耶克就曾经对知识的本质有过深刻阐述。他将知识区分为“显知识”和“默知识(默会知识)”。“显知识”就是“明知识”,比如牛顿力学、爱因斯坦相对论,等等。此种知识可以表达可以传播可以理解,因而人人都能得到,也可以集中使用。“默知识”则是指没有办法用语言、数字、符号、图表、公式等方式表达和传递的知识,只可意会不可言传。这种知识在我们生活中其实大量存在,比如舞蹈、绘画、拉提琴都是默会知识,有人一学就会,有人总学不会。师傅带徒弟,老师教学生,同一个班每一个人学习效果都不一样。牛顿、爱因斯坦通过思考发现重大科学定律,而全世界其他科学家却没有。过去只能用“悟性”、“窍门”、天赋差异来解释。“默知识”概念的提出,正好解释了这种“灵感”、“诀窍”的本质。或者可以说,默知识就是人类直觉。
由此可见,“默知识”并不完全等价于“暗知识”。暗知识既不可意会又不可言传,默知识则是一种虽不可表达但可体悟和感受、“只可意会不可言传”的知识。暗知识概念提出者王维嘉认为,这三类知识的关系如果用一座冰山来表示,明知识就是露出水面的冰山一角,默知识就是水面下的整个冰山,暗知识则是整个海洋。
国内还有经济学家将哈耶克提出的“默知识”称作“软知识”,与之相对应的则是“硬知识”。“三类知识”就是指“明知识”、“默知识”和“暗知识”。
明知识=显知识=硬知识
| | |
暗知识≠默知识=软知识
我们把默知识理解为人类直觉,那么暗知识就是“机器直觉”。默知识和暗知识的共同特点是不可表达,当然也就不可集中、不可计算。由此超越了“可计算性”,打破了“一切皆数据”“一切皆算法”的神话。
3.由“方程(equation)”到“算法(Algorithm)”再到“隐喻(Metaphor)”
“机器直觉”的出现,是人工智能的突破之处也是可怕之处。因为“机器直觉”属于“暗知识”,不可表达也无法集中、当然也不可计算。这就颠覆了经典自然科学的符号逻辑话语体系!从牛顿力学到量子力学,我们今天已知的科学技术已经形成了一整套完备、严密、精确、抽象、符号化、逻辑化的话语体系,那就是数学语言。我们用函数y=f(x)描述一个量随着另一个量的变化而变化,或者说一个量中包含另一个量。我们对研究实体进行必要的简化,并用适当的变现形式或规则把它的主要特征描述出来,建构数学模型。数学模型可以是一个或一组代数方程、微分方程、差分方程、积分方程或统计学方程,也可以是它们的某种适当的组合,通过这些方程可以定量地表述系统各变量之间的相关关系或因果关系。在计算机对于工程技术复杂事务的处理中,算法代表着用系统的方法描述解决问题的策略机制。算法是一系列解决问题的清晰指令,能够对一定规范的输入,在有限时间内获得所要求的输出,是解题方案准确而完整的描述。算法中的指令描述的是一个计算,当其运行时能从一个初始状态和初始输入开始,经过一系列有限而清晰定义的状态,最终产生输出并停止于一个终态。一个算法的功能结构不仅取决于所选用的操作,而且还与各操作之间的执行顺序有关。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。一个状态到另一个状态的转移不一定是确定的。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题[20]。就解决问题的路径而言,如果说函数方程给出的路径是唯一的,算法所给出的路径则是可选择可比较的。或者说,“算法”即思路。“算法”强调发挥人的主观能动性。人工智能进一步发展和超越了算法理论,界定了“可算法化”和“不可算法化”的不同情形,面对不确定性问题NP,人工智能提供的是最优近似解决方案。正如“阿尔法狗”的设计者十分清楚,这款“深度学习”围棋软件并不能确保自己一方必胜。但它通过学习不断调整修正“思路”,取胜的可能性越来越高。“暗知识”的不可表达性,意味着人工智能工作原理既不能表示为方程也不能表达为算法。我们只能借用“隐喻”来近似“表达”。隐喻,是一种通过暗示启发想象的修辞手法。多用在诗歌一类文学作品中。而严肃的科学论文基本是杜绝此类修辞的。人工智能是对人脑的模仿,人脑对于非认知因素的理解更多地来自于直觉,说不清道不明的“第六感”。正如只可意会不可言传的“默知识”,虽然我们无法用数学语言或自然语言准确表达和描述,但我们可以通过类比、隐喻等手法来帮助猜测和领悟、解读其潜在信息。当然,这种猜测式解读见仁见智,因人而异,没有统一的“标准答案”。由方程到算法,可以说是由精确逻辑的数学语言走向模糊逻辑的思路选择;由算法再到隐喻,则是由科学语言进一步跨向人文语言,科学性朝着人文性方向的跃迁实现了关键的一步。
4.两种进路,殊途同归
按我国的学科设置和科学建制,社会学的学科属性可以说是介于自然科学和人文学科之间,这也是“双重性格”论的缘由之一。现实的社会科学研究实际存在着“自然科学”“社会科学”两条进路。大多理工科院校都开设有管理学院一类交叉学科院系和课程,从事社会科学的学者很多也踊跃申报自然科学基金软科学项目。也就是说,一方面传统的社会科学学科普遍向自然科学学习和靠拢;一方面经典的自然科学面对能源、交通、环境等经济社会问题也在寻求得到人文学科帮助的解决路径。社会科学引入和模仿自然科学研究方法的路径前已述及。自然科学学者研究社会问题,则逐步形成了“系统科学”、“复杂性科学”的进路。“复杂性科学(complexity sciences)”不是一门具体的自然科学学科,而是泛指对复杂性系统的科学研究。上世纪中叶先后诞生了系统论、控制论和信息论“老三论”,耗散结构理论、协同论和突变论“新三论”。20世纪70年代以来,随着简单系统的理论日趋成熟,系统科学开始真正转向以复杂性为主要对象,“复杂性方法”和“复杂性科学”应运而生。世界上先后出现的关于复杂系统的一般理论有:欧洲学派以普里高津、哈肯、艾根为代表的自组织理论;美国学派以圣菲研究所霍兰为代表的复杂适应系统(CAS)理论;中国学派以钱学森为代表的开放复杂巨系统理论。我国科学家、系统科学中国学派的代表钱学森提出复杂性科学的综合集成方法,他指出“当你定量解决了很多很多问题,譬如说关于国民经济的许多问题以后,你有一个概括的提高的认识了,这又是从定量上升到定性了。自然,这个定性应该是更高层次的定性认识了。因此定性和定量的关系,是认识过程的一个描述,循环往复,永远如此。”[21]系统科学跳出了“定性”“定量”的分离对立,从更大范围、更深层次、更复杂的关系上着眼于整体论思维。复杂性科学的基本原理源自于自然科学特别是理论物理学的进展。热力学第二定律“熵增加原理”表明“时间之矢”不可逆;耗散结构理论则指出远离平衡态的开放系统通过不断地与外界交换物质和能量,涨落,涌现,自组织,可以使系统从无序转变为有序,从而揭示了生物进化、社会进步的基本原理。信息论认为信息等价于“负熵”,而负熵恰好可以作为“复杂性”的量度。由此,熵与负熵、连续性与非连续性、线性与非线性、确定性与不确定性、可预测与不可预测,可计算性与不可计算性,在复杂性科学视域下展现了科学与人文内在、辩证的对立统一。 “复杂性”与“简单性”事物的区别在于运动状态的非线性、不确定性、不可还原性。复杂性科学的一个重要概念是“混沌”,而对“混沌”的认知需要跳出“精确性”思维而遵循“模糊逻辑”。毫无疑问,人类社会是高度复杂的开放性巨系统。复杂性科学着眼于整体的模糊认知,更适于社会现象内在、潜在、本质的探究和理解。引入复杂性科学视角,或许可以对社会学的“科学性”有更为深刻的认识。
五、让科学归于人文:人工智能时代的社会学
1.走出费孝通悖论,回到费孝通
回到“费孝通问题”或“费孝通悖论”。“我们把‘人’放到自然历史演化的总的背景下去理解, 人是自然界演化的一个过程和结果, 同样, 所谓‘社会’、‘人文’也是自然的一部分, 它是人根据自身的需要造出来的一个第二环境, 但‘人文’只能建立在自然规律和原则的基础上,‘人文’的活动, 只是在很多方面利用自然, 利用自然特性, 顺着自然内在的规律, 适应它的要求, 为人所用, 而不能真正改变这些规律和原则, 也不可能和‘自然’法则对抗, 不可能超越自然的基本规律。”[22]费老这段话或许给人们一种误解,认为人文的活动也可以用自然科学方法来加以研究,甚或必须用自然科学的标准来规范!费老《试谈扩展社会学的传统界限》一文是在2003年发表,其时已是中国社会学恢复重建1/4个世纪。从历史背景看,正是由于中国社会学恢复重建以来唯科学主义倾向愈演愈烈,费老晚年才发出呼吁,表示了他的担忧。“特别是对于人和自然的关系上, 我们在接受西方现代科学的同时, 基本上直接接受了西方文化中‘人’和‘自然’的二分的、对立的理念, 而在很大程度上轻易放弃了中国传统的‘天人合一’的价值观”。“社会学的人文性, 决定了社会学应该投放一定的精力, 研究一些关于‘人’、‘群体’、‘社会’、‘文化’、‘历史’等基本问题, 为社会学的学科建设奠定一个更为坚实的认识基础”。前面提到复杂性科学研究的一个重要方法是“隐喻”。有不少学者认为中国传统文化是基于隐喻的文化,中国汉字象形文字本身就是隐喻的典范。表明中国人从一开始就想从整体上来“定性”地认识复杂事物,而不是把复杂事物分割成一个个单元来“量化”认识。费老对中华传统文化的强调和呼唤,实际体现出高度的文化自觉与深刻的科学思维水乳交融的内在统一。人文是人类的特质,是人与动物的区分,一切人造物都是文化。从漫长的人类社会演进史看,“科学”是只到晚近几百年才出现的现象。因此,站在历史的高度看待科学与人文的关系,二者本为一体,都属于人类文化。或者说,人文产生科学,科学隶属于人文,广义上“科学”是“人文”的产物和组成部分。只是当科学文化逐步发展形成一个相对独立的体系,我们才把科学之外的艺术、宗教、哲学等文化类型称之为人文。
科学性的核心是工具理性,人文性的本质是价值理性。当我们分别强调其工具理性与价值理性的区别时,二者才逐渐走向分离与对立。在某种意义上,科学技术只有为了人的目的才具有价值,如果科学不能为人类的历史进步做出贡献,就没有了意义。每一个科学家所身处的社会,才是孕育科学产生和进步的土壤;每一个科学家身份背后的人生,才是科学成其为科学的最终动力。科学技术发展史带给人类社会伦理道德方面的困惑也一再表明,犹如手脚必须服从大脑,社会学科学性与人文性的统一,应当让工具理性服从于价值理性,科学性服务于人文性。而不是本末倒置,把人脑交给电脑,追求科学的形式,忽略科学的本质。
科学的本质是什么?就是实事求是、怀疑批判、追求真理。人文孕育创造了科学,科学终将归于人文。人工智能给我们的启示,科学性与人文性融通的方向和路径不是人文向科学靠拢,而是科学主动走向人文!让科学归于人文,恰好是费老这篇《浅论扩展传统社会学的界限》的核心要义。走出费孝通悖论,就必须要回到费孝通。扎根于中华文化沃土,坚持文化自觉、文化自信,行行重行行,在田野实践中训练社会学想象力,使科学精神与人文精神统一于真善美。
2.智慧社会呼唤科技与人文融通的社会学
我们正快步进入一个“智慧社会”。社会学者可能更关心的是,人工智能能否直接用于社会学研究?就如计算机的普及在几乎所有行业都普遍应用一样,社会学研究领域人工智能的工具性使用,提高效率并部分替代人工将是必然的趋势。实际上,人工智能已经在机器人、仿真系统、控制系统、经济政治决策中得到大量应用。诸如交通管理、刑侦破案等。遍布各处的摄像头,无所不在的自媒体,使得人们社会生活活动轨迹包括行为态度、交往过程、互动关系都被数据记录并保存下来,传输到云端。理论上如果这些数据都能够被充分利用分析,无疑为社会学研究提供了强大的利器。大数据替代问卷调查,民意测验。人工智能用于文献查阅梳理,音频视频识别处理,文本图像自动生成。机器智能化分析,从纷乱如麻的万事万物中找出隐藏的相关关系,结论自动涌现,自动实时调控。社会学家的工作会否被机器人所取代?答案当然是否定的。前已述及,现有人工智能的发展尽管已经能够学会“形象思维”甚至拥有“机器直觉”,但并不拥有自我意识。也就是说,机器并不具有也不可能具有人性,包括欲望、情感、喜怒哀乐、爱与恨、道德感、价值观。所以,人工智能并不是机器像人一样思考,而是让机器做人的智能才能做成的一些事情,其发挥的依然只是“工具”作用,不能替代人的思考。单就记忆力和计算能力而言,人脑显然远不如电脑。而人与机器的不同,在于处理类似黑天鹅事件的能力,不是仅仅依靠逻辑推理归纳演绎,不是依赖于数学方程、回归模型,也不是通过培训形成的刻板、单一的行为模式。人类思维的优势在于拥有一个不封闭的意识世界,因此人类理性有着自由空间,当遇到不合规则的问题能够灵活处理,修改规则甚至发明新规则。人的记忆是有选择的,遗忘是一种自我保护功能。人可以在思想和知识领域建立起一个暂时“不思”的隔离分区,悬置无法解决的问题,而不会一条道走到黑地陷入无法自拔的思想困境。譬如发明“无理数”概念,而不是把π值没完没了地算下去。“与之不同的是,目前为止的人工智能只是一个封闭的意识世界,是一个由给定程序、规则和方法明确界定了的有边界的意识世界。事实上也正是这种封闭性保证了高效率”[23]。费孝通在《试谈扩展社会学的传统界限》一文中特别谈到,“只能意会”应当成为社会学一个基本的关注点,其实这也成为人工智能难以逾越的一个点。“人和人交往过程中的‘不言而喻’、‘意在言外’的这种境界, 是人际关系中的很重要的部分。人们之间的很多意念, 不能用逻辑和语言说清楚, 总是表现为一种‘言外之意’,这些‘意会’的领域, 是人与人关系中一个十分微妙、十分关键的部分, 典型的表现, 就是知心朋友之间、熟人之间、同一个亚文化群体成员之间, 很多事情不用说出来, 就自然理解、领悟, 感觉上甚至比说出来还清楚”。大数据分析、机器人社会调查永远替代不了人的亲身体验切身感受。人工智能人像识别搜索可以比人准确许多倍,能够从千万人中迅速抓住罪犯;但一个三岁小女孩看到妈妈生气的表情,机器却未必能够真正理解和感知。由此可见,社会学研究,不能用“算法”替代“调查”,不能用“屏幕”替代“参与”,不能用“在线”替代“在场”。人工智能对人的智能的部分成功模仿,一定意义上构成了对人的伦理地位的挑战,对人类社会带来巨大的利益同时,也带来了诸多重大的不确定性的后果。因此,人工智能使得现代社会的“不确定性”特征更加凸出,这也给社会学家带来更多机会、提出更高的要求。大数据和人工智能方法一方面构建了可持续完善和异常丰富的数据集和分析工具,其可用性、共享性、协作性大大增强,提供了人文社会科学学者大规模协作的可能;另方面这种协作合作研究方式完全不同于“流水线作业”式的团队分工合作,而是要求每一个参与者都能发挥独立作用和主观能动性的“系统工程”。个体的人的作用、人脑的功能重新被突出。一定程度上,这是“机器”向“人”的回归,向我们正在失去的社会学想象力的回归。智慧社会是人类历史发展的新阶段。人工智能已经成为国家计划世界各国竞争焦点,城市大脑、智慧交通、智慧医疗、智慧教育、智慧养老……人工智能深度渗入当今社会各个层面。然而不难看到,智慧社会相关的科学研究、项目工程参与者基本是计算机工程师一类自然科学技术专家,人文社会科学工作者鲜少介入,社会学者基本缺位。“费孝通悖论”的本质,是呼唤科学与人文的有机融合,智慧社会建设亟待富于社会学想象力和拥有跨学科知识的社会学者的深度参与和贡献。
作者:石英,西北农林科技大学人文与社会发展学院教授,陕西省社会科学院研究员论文原发于《人文杂志》2019年第10期
参考文献:
[1] 费孝通:《试谈扩展社会学的传统界限》,《北京大学学报》(哲学社会科学版),第40卷第3期,2003年5月。
[2] 仇立平,《社会研究方法论辩背后的中国研究反思》,《新视野杂志》,2016年第6期。
[3] 陈云松,《走出费孝通悖论——谈社会学的方法之争》,《清华社会学评论》,2017年第1期。
[4] 渠敬东,《破除“方法主义”迷信:中国学术自立的出路》,《文化纵横》,2016年第2期。
[5] 潘绥铭,《生活是如何被篡改为数据的?——大数据套用到研究人类的“原罪”》,《新视野》2016年第3期。
[6] 刘林平,《大数据有“原罪”吗?——与潘绥铭教授商榷》,《社会观察》,2016年第8期。
[7] 赵鼎新,《社会科学研究的困境:从与自然科学的区别谈起》,《社会学评论》,2015年第4期。
[8] 风笑天,《定性研究与定量研究的差别及其结合》,《江苏行政学院学报》,2017年第2期。
[9] 王宁,《社会学本土化议题:争辩、症结与出路》,《社会学研究》,2017年第5期。
[10] 谢宇,《走出中国社会学本土化讨论的误区》,《社会学研究》,2018年第2期。
[11] 翟学伟,《社会学本土化是个伪命题吗?——与谢宇商榷》,《探索与争鸣》,2018年第10期。
[12] 谭营,《人工智能知识讲座》P152页,人民出版社,2018
[13] 周剑铭 柳渝:两种“两种文化”交汇中的人工智能,此文刊载在《科学与社会》杂志,2018,
Vol. 8 Issue (1): 59-71 网址:http://www.xml-data.org/KXYSH/html/388c98da-b5de-44d7-8bc5-f667566e2a88.htm)
[14] 杨心恒,说说中国社会学的恢复与重建,《炎黄春秋》2015.1
[15] 李强,《理论研究对于社会调查及实证研究的重要性》,《中国社会科学报》2009年10月29日7版
[16] 陈心想,《社会学美国化的历程及其启示》,《社会学研究》,2019年第1期。
[17] 米尔斯,《社会学的想象力》,陈强、张永强译,生活、读书、新知三联书店2015年版
[18] 约翰·J·麦休尼斯,《社会学》(第11版),风笑天等译,中国人民大学出版社2009年,p4页
[19] 王维嘉,《暗知识:机器认知的颠覆》,在2019亚布力中国企业家论坛第十九届年会上的演讲。
[20] 见百度百科,https://baike.baidu.
[21] 黄欣荣著,《复杂性科学的方法论研究》,重庆大学出版社,2006,第182页
[22] 费孝通:《试谈扩展社会学的传统界限》,《北京大学学报》(哲学社会科学版),第40卷第3期,2003年5月。
[23] 赵汀洋,《人工智能的自我意识何以可能?》,《自然辩证法通讯》,2019年第1期。