内容提要:大数据应用对社会学的研究产生了巨大的影响,以至于出现方法学转向乃至“理论终结说”的主张。但是,从本体论角度来说,大数据的局限性在于它过度简单化了社会生活,因而忽略抑或悬置了社会生活所具有的历史特殊意义。而大数据推崇者所宣称的意义指的是客观、普遍的意义,这无疑是一种曲解。此外,如果越来越多的学者热衷于“计算社会学”“新计算社会学”的研究,那么很可能会导致学科的分支化倾向。因而在大数据时代,我们更要秉持学科中的重要内容,即理论的意义以及人文的关怀。简言之,在学科反思的层面上,“溯洄涵泳”式的回应必要且紧迫。
关 键 词:大数据/理论终结/本体性意义/学科反思
作者简介:赵超越(1990- ),男,上海人,南京大学社会学院博士研究生,研究方向:当代中国研究、社会学理论、文化社会学,南京 210023
从社会学学科总体发展的情况来看,定性与量化研究是两条并驾齐驱的方法学路径。但由于涉及主客观主义、事实与价值、理解与规律等诸多方法学的问题,两种研究方法在一系列的研究问题上又处于长期的纷争状态。而自大数据(Big Data)一词被提出并迅速成为当代最热门的研究主题之一,加上随之而来的全球性的时代浪潮,传统的量化研究方式受到了猛烈的冲击。
大数据因其巨大的数据库存(在量上正趋向于全体数据)使得量化研究方法不再完全依赖于过去传统的抽样、假设检验,并为其研究的目的和内容提供了前所未有的便利。由此,大数据社会学研究应运而生。至此,量化研究在一些(暂且称之为)定量极端主义论者的鼓吹下逐渐占据了社会科学方法论领域的“霸权”地位;而与人文主义、建构主义相关联的理论研究、定性研究则逐步落入学科的“边缘化”处境。因而,本文的写作目的在于两方面:其一,从人类社会生活意义的视角对大数据时代下的方法学转向(以新计算社会学为主要形式)进行回应。因为方法手段上的纷争并非是大数据的根本局限性所在,而超越两种研究中的方法手段并站在人类社会历史生活层面上来看,其所具有的意义、意义的历史性与多样性才是大数据研究的软肋。也基于此意义,社会学等学科的自然科学化趋势才能被合理地反对。其二,大数据的到来和以此为基础的生活方式及全球格局的变化,绝不意味着传统研究的方法学和理论的终结。
一、学科量化研究的来源与发展简述
17世纪甚至更早,人们普遍受到自然科学的逻辑思维模式的影响,尝试去了解自然界乃至人类生活世界运行的规律,从而找出能够放之四海而皆准的普遍法则,同时,人们普遍追求一种可以计算和分类的方式来探求其中的知识体系。但是,即便研究对象是自然界,自然科学仍然受到人类主观因素或者其他非自然条件的影响,更不用说更为复杂的人类生活。所以,克服社会生活中诸多不可控因素的尝试,使得社会科学或者道德科学逐步发展起来。
就社会研究中的统计而言,在三百多年前就已开始初步呈现。大致来说,在17世纪,这种尤其关注到规范、治理层面的技术同欧美当时所谓的统治理性是密切相关的。从词源学上来看,国家一词“state”就是统计一词“statistics”的原初形式,同样印证了统计的定量技术本身同国家统治的关系。而统计学(die Statistik)概念则由时任哥廷根大学的哥特弗里德·阿亨瓦尔(Gottfried Achenwall)正式提出。[1]19当时的目的无非是要寻求一个系统,在这个系统中政府能够更方便地记住其中人口数量及其各种社会事实,以便为其所用。英国、法国在这一方面大同小异,统计学最初的运用,是国家的领导者为了方便掌握其国家中人员的状况(人口容量、人口流动规模等),以便更好地实行统治政策和相关治理术。[1]16其中值得一提的是,当时国家的领导者和学者都或多或少地接触过类型学的思想,通过对所谓子民的数量以及活动轨迹的量化研究,实施对其不同职业、层级的划分,以便于对其监控。这个由统治者所构建的、社会成员受监控的社会,在很大程度上可以看作福柯所称的全景监狱(prison de panoramique)或者戈夫曼所说的“精神病院”(Asylum)的管理机制,统治者通过一系列的治理技术和设施对社会成员进行肉体和精神的规训,以至于他们终将成为温顺的受控者。[2][3]而随着社会形态的转变,尤其是从17世纪中叶伊始,“特别是资产阶级日渐掌握到社会的导引权,而市民社会(civil society)也日益成熟之后,其社会属性有了改变”,[4]统计研究不再纯粹为统治理性所服务,社会变迁过程中的诸多问题使得其研究目的发生改变:一方面为确信某个事实或某物提供理由(或支持涉及未来的决定);另一方面通过误差的理论(theory of errors)来评估科学知识的确定性程度(degrees of certainty)。[1]17由此,近代意义上的社会科学从之前统治理性主导时期的边缘地位脱离出来,朝更大的研究范围(自身研究逐步占主导)进行量化统计研究。
而到19世纪末20世纪初,随着概率论的发展和成熟,量化研究逐步趋于数理化、公式复杂化以及模型化,并“展现成为一个具有自我组织、自我再制与自我衍生能力的语言体系”。[5]由于社会属性的根本改变,研究无法从绝对宰制的层面上获取所需的大规模数据,所以,与之前大规模的记录方式不同,近现代的量化研究以一个或多个研究假设为前提,通过对有限的样本规模进行梳理统计以建构不同的模型,从而凭借所得出的因果或相关关系来对当前假设进行验证。一方面,研究者尝试用量化的统计公式和统计模型来实现所谓的学科精确化;另一方面,由于自古以来一直有着对普遍主义的追求,使得量化研究愈发趋向于对人类行动乃至现象的发生进行预测。换言之,量化研究者从事社会学研究时已经采取了两种预设,即客观性预设和规律性预设。[6]95但问题在于,试图用上述两种去囊括所有的社会学研究是徒劳的。就前一个预设而言,所能获取的也只是表面上的外在行动(行动的频次、问卷上的信息等),这些外在数据只是社会学研究领域的冰山一角;后一个预设则更不可能实现,因为规律“只是在近似的情况下以及一定的限制条件下成立”。[7][8]在人类历史的多样化情形下,诸多自然科学中的定律和假说都是相对且不确定的。因此,利用量化的统计分析必须要对社会生活的诸多因素进行过滤和限定,才勉强能在“理想类型”的范围内着手进行。这样一种受限的量化研究,由于社会生活复杂性质的影响,“无法独自承担起社会学研究的重任”,[6]96它必须依靠定性研究进入意义世界的理论能力,方可更深入地解释和看待社会,同时它也能在定性研究的理论基础上呈现数字化的精确证明。所以,作为社会学研究的方法路径之一,量化研究不仅无法单独研究社会,更要时刻“向新的经验证据和反思的目光敞开”。[6]96
但是,大数据以及相关新型数据采集手段的引入,似乎给传统的量化统计研究注入了一剂强心剂。在很多量化研究者看来,大数据在很大程度上意味着对传统的数据采集方法软肋的一种拯救,从而使其从原本诸多的手段限制中抽离出来。这样一来,社会学研究中新的重要问题便产生了:大数据研究究竟何为?既然量化研究和定性研究都有各自的本职工作,并分担研究社会的使命,那么大数据的到来在何种程度上影响这一格局?又在多大的程度上左右了定性、理论研究的作用?
二、大数据、方法学转向与理论终结说
大数据的正式概念始于2011年麦肯锡的报告《大数据:革新、竞争和生产力的下一个“前沿”》:“大数据——能够获取、交流、整合、储存乃至分析的海量数据——如今已成为全球经济里每一部门和功能的组成部分。就像其他的生产要素,比如硬资产和人力资本。数据越来越成为现代经济活动、革新和增长中不可或缺的要素。”[9]报告中强调运用大数据的科学技术将被广泛地应用到统计学、计算科学、应用数学乃至经济学中,同时,这也意味着从大数据中获取信息的组织等需要面临的是一个更为灵活性的、多重规则的方法手段。正是由于大数据量的庞大,因而如何驾驭这个庞然大物(Riding the Juggernaut)[10]来为人们服务越发受到重视。由于大数据应用领域的扩大,因而当今它甚至可以囊括“环境卫星、基因数据、GPS和地图数据、数字图像,以及诸如社交媒体数据之类的人们有意识产生的数据,等等”。[11]所以,《大数据时代:生活、工作与思维的大变革》一书的两位作者舍恩伯格(Viktor Mayer-)和库克耶(Kenneth Cukier)亦将大数据视为“社会以新的方法手段处理信息的一种能力,以生产出具有巨大价值的商品和服务或者产生有用的洞见”。[12]20
相较于传统数据采集及统计分析,大数据最为突出的特点是舍恩伯格和库克耶所强调的三大特性:模糊性、相关性和大样本性。首先,是模糊性代替精确性。对于传统数据采集而建立的数据库而言,收集的数据信息是相对有限的。在有限样本量的情况下,对于数据采集以及建构模型精确性具有很高的要求。但是,在大数据的前提下,“允许不精确的出现已经成为一个新的亮点,而非缺点”。[12]63这种所谓的“非缺点”表现为两个方面:一方面,对于小型数据过多的各种统计方法的计算倒不如从大数据出发的简单运算来得实际,从而在效率层面上完全可以省下更多时间来收集更大的数据,使得手头的数据库存累积起来以便获取更多有用的价值信息;另一方面,大数据之所以被提出乃至风靡全球,是因为它能够满足人类的追求,即掌握现在和预知未来,尤其是后者。预测代表着一种概率逻辑,而非事实的确定性,所以数据的海量采集为预测大方向的追求而不得不或者主动地丧失其精确性,并“拥抱混乱”。其次,是相关性代替因果性。舍恩伯格和库克耶认为,因果关系存在的前提在于人们的主观直觉,“在小数据时代,很难证明由直觉而来的因果联系是错误的。……大数据之间的相关关系,将经常会用来证明直觉的因果关系是错误的”,[12]103而相关关系则代表着客观的事实,且后者作用更为明显。例如,将预测作为最终目的的评估机构和企业,只需要知道用户的目前状况和需求,就能够为其提供相应的产品和服务;他们无须也不想去了解用户之所以会有某类需求的原因。最后,是大样本性代替小样本性。当数据的收集量越来越庞大乃至可以称为海量时,以至于可以直接采用这一超大型样本量而无须顾及小样本所带来的一系列代表性问题。如果说传统统计方法下的抽样研究是为了描述或解决即时的、有限的、特定的社会现象或问题,那么,在大数据时代运用更为先进的信息技术对任何与研究旨趣相关的海量数据分析则可能着眼于更长远的、更为庞杂的事件和趋势。
大数据对于社会科学的影响如此巨大,以至于其研究方式的转变使得社会学成为大数据时代下方法学被撼动得最厉害的学科之一。典型的例子是“新计算社会学”的诞生及其研究应用。20世纪90年代,拉策尔、加里·金等学者在《科学》上提出了“计算社会科学”的概念,[13]721即通过计算机软件作为媒介对社交关系进行测量的一种应用方法。这一新型学科的研究主要涉及社会网络理论与研究方法的发展、基于行动者模拟方法(agent-based modeling)以及互联网研究等。从研究范围来看,这一新兴领域是一种社会世界诸多方面的跨学科研究,通过计算的媒介可以从个体的行动者一直到群体。[14]2它主要利用计算机中的“自动化信息提取”(Automated Information Extraction)技术进行信息搜集。例如,我们可以将谷歌图书语料库的书本大数据、新浪微博、百度搜索等巨大库存作为数据来源,以所需相关变量(关键词)作为指标,从不同维度进行统计分析。[15][16][17]因为这是一门相对较新的领域,所以,计算社会科学需要同其他的跨学科研究领域之间建立起一个新的范式和系统,而这又需要诸如计算机科学等的知识背景。因此,从长远来看,这个学科的发展就是社会科学家和计算机科学家团队合作的成果。[13]722而随着计算社会科学领域科研队伍的不断壮大,社会学领域的计量方法也在不断发展。2014年,美国社会学界在斯坦福大学“计算社会科学中心”召开学术研讨会,并提出了“新计算社会学”(New Computational Sociology)概念。之所以“新”,主要在于“新计算社会学在理念、方法、思路、工具应用等方面比此前的社会学研究中的‘计算’都更为先进和复杂”。[18]
这一方法学转向的极端形式就是热衷计量分析、过度注重计算结果的人(quantophrenia)越发增多,并在学科领域有一定的话语权,由此使得理论逐步被边缘化。例如,《连线》杂志主编克里斯·安德森(Chris Anderson)极度推崇社会的计算以及数据库的分析与运用,甚至直接提出“理论的终结”这一观点。他主张数据的运用可以完全代替理论来研究人本身,认为当今“是一个充满大量数据的世界,在这个世界中应用数据可取代任何其他可能采用的工具。从语言学到社会学,将没有任何一个有关人类行为的理论。而如果丢掉类型学、本体论和心理学,谁知道人们做什么以及为何这么做。但重点是他们就是这样做了,并且我们可以空前精确地追踪和测量他们的行为”,所以借助计算机的统计手段,“海量数据的可获得性为我们提供了理解世界的全新路径。相关性取代因果性,以至于科学可以摒弃相干模型(coherent models)、大一统理论甚至任何机械化的解释而独自前行”。[19]彭特兰并没有直接提出这一说法,但他却尝试着用这样的方式来重新解释社会。他将社会中实体间的影响、社会压力等因素的评估全部简化为数字符号,并采用建立等式乃至数学模型来概括整个社会的运行。尽管安德森和彭特兰的观点均属一家之言,但这些论断和主张无疑反映出一种具有大概率或然性的、试图撬动诸多社会学科、人文学科方法根基的趋势。
不可否认,大数据在样本量上的极大增加,在很多方面为从事量化研究的学者提供了方便。由于大数据为大规模测量人的行为、社会互动交往乃至网络关系提供了可行性,[20]使得这些领域的研究的诸多瓶颈大大减少。研究条件便利化的趋势给一些量化研究者以更大的自信,以至于有人宣称“最终世界上一切不确定的因素皆可量化”。[21]对此,相应的质疑也接踵而至。
大体而言,论争的主要内容是基于研究手段层面所产生的分歧。第一,赞同大数据社会学研究的学者认为,大数据可以为收集和分析的小数据创造参照和判断的标准依据;而且,由于大数据的量足够大,使得与大数据相匹配的传统数据无须接受显著性检验就具有代表性。但反对者则将此看作是一种学科入侵,以至于将大数据运用在人类社会的研究中称为一种所谓的“原罪”,[22]因为“大数据对于传统数据收集和分析而言是一种替代,而非补充”。[23]因此,进行社会学研究,必须摒除诸如此类的、主动拥抱混乱的“大数据傲慢”(Big Data Hubris)态度。第二,在有些情况下,部分学者为了能得到与本研究主题相关的大数据,在没有必要的前提假设时就开始选择因变量,而研究假设恰恰是研究进行的起始点。假设在研究的主题和过程中起到根基的重要作用。在一项研究中如果没有理论或经验性的假设,即便持有现成的数据库,对于该研究而言也是没有任何价值的。但也有学者认为,先有研究假设后有传统数据乃至大数据的检验,属于理论驱动;而直接使用大数据得出结论同样达到研究目的,这是一种数据驱动,由于大数据的量使得这一研究逻辑更为可行且有效。[24]因此,在研究中,两种驱动可以视研究本身的情况而定,有时甚至可以起到相互辅助的作用。第三,大数据研究宣称是一种相较于传统量化研究而言更具客观性的方法和手段,因为该数据库在很大程度上规避了传统数据收集形式中所产生的人为因素。当然,这种客观性的概念在涂尔干看来是社会学研究中的一个核心问题,即社会学研究的就是一个客观的社会事实,它有一个独立于个体表征之外的自身的存在。[25]然而问题在于,这种客观性的宣称因为人的必然在场而受到主观因素的影响,并且建立在主观观察和选择的基础之上。第四,收集数据的手段涉及学术研究本身的伦理性和不平等问题,因此受到学者的质疑。在社会网络的研究领域中,学者一直觊觎着未被利用的、具有巨大研究价值的潜在数据。而诸如SNS、Facebook等网站所蕴含的数据信息就非常适合于做关于网络的社会科学研究。问题在于这些潜在的数据消解了公众网络空间中的隐私。他们在从事网络虚拟活动的过程中,其活动痕迹已经被收集成可储存的数据信息,他们本身对此毫无意识。所以在研究中,人们的自我意识需要重新进行考量。除以上这些对外公开的数据之外,还有更多的大型数据库是有限开放甚至不开放的。如果从事商业,只有部分大型社会媒体公司才能够真正获取这些储存人们交易信息的数据库;从研究层面来看,也只有同Facebook或者Google有内部联系的人类学家、社会学家才能拿到所需的原始数据,其他无联系的研究者也就无从入手。假如他们要得到这些原始数据,往往需要花费大量时间和金钱才能将其购入。所以,从这一趋势来看,社会科学的方法手段在时间和金钱方面变得十分昂贵,同时每天的价格仍在攀升,[26]以至于大数据的研究领域在学界中产生区隔,结果就是产生数码化的分割(Digital Divides)抑或是大数据时代下的贫富之差。
对于社会学而言,大数据研究方式赞成者以及反对者的不同立场所要揭示的是大数据对社会学研究的冲击程度。更进一步说,学界的纷争也是在力图追问:方法学的转向是真正的学科革命还是只是作为一个噱头而存在的表象。[27]其实,由于这个问题乃至论战涉及的是学科方法学领域内的诸多根本性主题,因此它在很大程度上可以称为第三次方法学之争。①但是,就目前论争的主要内容和主题来看,仅仅停留在手段和分析方法这个层面上来探讨大数据的适用性问题只是一种隔靴搔痒式的触碰,未能找到所谓的阿喀琉斯之踵。潘绥铭虽然已经注意到了这点并撰文指出,②但他在详细阐述时却还是采取具体的研究方法、手段及其生活案例,仍属“蜻蜓点水”,以至于仍然会出现方法上的分歧和可商榷之处。在笔者看来,尽管计算社会学乃至新计算社会学的提出,使得社会学研究的量化趋势显著并在一定程度上正逐步向计算机学科靠拢,但终究不能达到称霸学科的目标。归根结底,社会学学科最终的落脚点还是周遭的社会生活。人类的社会生活区别于自然社会之荦荦大端者,正是社会生活充满了意义或价值。同时,这种意义同人本身的能动性、外在的历史因素都有密切联系。这种人本身同诸多因素的复杂意义关联决定了在此社会领域的范围下并非一切都能被计算。
三、社会生活的本体性意义与经验实践
充满意义的社会生活先于经验科学时代而存在,同时它呈现给我们的是一种具有历史特殊性的生命实践。这意味着它已经预设了外在情境和内在于历史个体的生命的双重前提条件。社会生活作为一种非数字、非自然的存在,必然涉及实际的活动,因而也必然受制于外在化的情境。情境作为一种“社会时空的特定状态”,[28]生产或者建构着此刻实践的结果乃至更大范围的历史环境;同时就本体性特征这一点来说,所谓情境的再现虽然在特定情况下可能具有相类似的意义,但并非是完全相同状态的机械复制,相反,在不同时空维度下所产生的特定情境超越了某种形式化的规律,充满着或然性或者不确定性。韦伯行动理论中的“意义层面上的充分性”和“因果层面上的充分性”[29]88就是在这种限制条件下个体对意义把握的一种解释。从这个层面上来说,处于情境当中的实际社会生活是“关系性(即空间性)和可能性(时间性)的总体”,[30]从而彻底否定了所谓的预测。
由于情境在时空因素上的复杂性,使得社会生活本身无法忽视无数单独个体包括能动性和策略在内的主观实践以及个体与其内在生命所产生的关联,所以,以此种历史个体的内在意义为特征的研究都要以理解这些实践与关联为前提,否则研究的结果只会是“解释之不可能”。而科学的手段只是对于极其有限的表象和外在化形式进行工具性描述,因此,从本体性中的文化意义上来说,单纯的“科学的说明不能替代基于理解的解释”。[6]94就历史个体生命而言,其意义的内在性特征所指涉的是生命中各个组成部分同生活这一整体的复杂关系,这一关系连接了个体的生命和结构的历史,这种生命结构同外在环境的持续互动构成了具有意义的生命。此外,这种互动产生的意义只有通过对不同个体的精神和心灵的感悟、对个体生命的体验才能够达成。狄尔泰强调,这种通过体验来认识具有复杂关系的生命结构的整个过程,意味着个体的内在心理因素、个体所拥有的历史背景和外在的环境、与其他个体之间的关系都是其获得发展个性禀赋的条件,个性的结构性联系是统一而不是机械单一的原因所促成的结果。而且,这种联系还是一种连续体,是一种柏格森式的、关乎自然秩序的关联,[31]300-301如此构成的意义“回溯到内在的时间意识以及绵延”。[32]当然,生命意义的理解路径需要通过现实世界的表现形式来得以呈现,但这种形式并非真正建立在科学化的手段基础之上。相反,是一种所谓的“历史意识”在起作用,该意识促进历史个体自身的能动性(对行动施加主观意义)与互动性(主观意义关乎其他主体)。这也是社会行动存在的条件。但这种主观意义既有受具体时空限制的实际层面,也或多或少地带有研究者的理想层面。后者试图通过建构研究对象的数字物理模型来理解其中的具体内容,并且通过这种理想典型,使得研究者能够明了其中的纯粹理性的行动过程。正是由于学科中存在因求得方法学之便利而构建一条建立在理性假设期待上的行为线路,所以,就人类生活中理性所占主导地位的问题而言,韦伯强调,“该主导性是否存在以及多大程度上存在,从来没有说清楚过”。[29]80因此我们可以得知,即便科学主义者深信实证方法的意义呈现,但这种客观意义必须同社会生活的主观意义区分开来。对这种主观意义的把握就意味着能够对行动者(社会生活中的对象)行动过程加以理解;同时,基于此理解,意义的赋予也必然会指涉根据行动者面对行动及其环境做出的解释。[3]34从这个层面上来说,意义又同样可以是通过人们的“自我表现”所显现出来的东西,同时也是人们的“理解”所理解的东西,[33]充满意义的社会生活也就包含着这种东西的集合。当然,除个体同生命关联之外,个体间的关联所构成的特殊共同体也反映了意义的多元复杂性,因为在社会生活尤其是日常生活中,不同个体通过共同影响和工作与他们(其他个体)联结在一起,理解他们并且他们也理解我们,舒茨在修正韦伯理论的基础上,为意义的赋予与把握提供了一种互为主体性的视角。总之,意义的本体论色彩使我们更加确信周遭社会生活中不可计算的诸多因素,并反对利用科学手段所建构的世界(或者当今的数码世界)来取代真实的社会世界。舒茨认为,常识构造由真实世界中的“此在”(Here)(在特定情境下的状态)所形成,“它决定了视角预设的相互性”。[31]38,从这个意义上来说,常识行动模式已经同科学模式区别开来。简言之,意义修正的目的在于强调了这样一个观点:个体间的能动的、互为主体视角所形成的思维模式乃是社会学学科研究的特殊属性。
前文关于本体性意义的论证无非意在强调,基于社会生活的社会学学科“必须拥有自身独特的研究方法,这是基于对意义的理解的方法”。[6]94我们认为,这种方法实践的可能有效性途径之一是超脱于纯经验现实的想象力。具备此种个体、生命、社会、情境相互交织的想象的能力,意味着能够从重点关注人们即刻行为的科学研究方法中超脱出来,并站在高远处思索。这是米尔斯所呼吁的心智品质,它能够帮助个体使用信息并促进理性的发展,从而能看到一种清晰的全貌。正如米尔斯所强调的,“社会学的想象力让拥有此品质的人既能理解一个关乎诸多个体内在生命以及外在生涯意义的、更为广阔的历史情景,又能使他注意到,在繁杂混乱的日常经历当中,个体是如何错误地意识到他们的社会位置的”。[34]5从概念上来看,米尔斯的这一主张可以说是帕斯卡尔心智诠释的延伸。就社会学想象力的内涵而言,除了追问宏观层面的社会结构要素以及秩序的关联性意义之外,米尔斯还强调学术关怀中两个重要的维度:其一涉及人生意义的层面,即关注此时期此社会中盛行人格(抑或占主导地位的人的类型)的重要性,“他们以何种方式被选择和形塑、解放和压抑,并变得敏感和迟钝;我们所观察到的行为和品格反映出何种人性;我们所审视的每个社会特征的‘人性’,其意义是什么”。[34]7其二则关乎历史的维度。是古是今,都处于人类历史长河中。通过对历史长时段的关注,我们可以考察其中某一时期社会运行以及变迁的动力和特点;同时,我们尝试比较不同时期的社会,以此作为当今社会的参照体。所以,“社会学的想象力使我们能够把握住历史、个人生活以及二者在社会之中的关系。这是社会学想象力的任务和承诺”,[34]6也“正是通过社会学的想象力,人们希冀把握世界的进程,并且理解他们周边所发生的事,这些事都是反映社会中个人生活和历史交织的细小部分”。[34]7一旦能够体会到上述两个层面的重要性并付诸实践,那么无论处于哪个社会,人们都能感受自身并反观背后的大时代,体验社会科学的文化意义,即“社会科学所能起到的教养、启蒙和解放作用”。[35]而自二战之后,社会学学科的中心位置已在美国扎根。当地学科霸权的全球化扩散加上本土实用主义方法的横行,使得所谓的“抽象经验主义”愈发盛行;相反,关乎重视意义的想象力的方法学则已经呈现式微趋势。这样就产生了一个问题,当今进行社会研究的科研者们是否还需要具备并深刻理解学科产生至今的经典学术知识?这里涉及两个重要的概念,即科学和学术。在米尔斯看来,抽象经验主义的实践就是科学逐步代替学术的过程,“作为他们对社会本质和功能运作普遍关注的组成部分,杰出的学者们以博学的态势,并且是在宏大历史、理论以及哲学角度来研究公众舆论的,而非所谓的‘就事论事’,同时撰写专著。但是在今天,技术团队对特定的主题进行课题研究并汇报研究发现。二十年前,公众舆论研究是学术的组成部分。当今它却隶属于科学”,[34]54譬如涉及诸多问题域的研究无疑借鉴了自然科学的测量和建模方法,形成八股文式的范式。因为一般而言,自然科学基本上是把可看、可听或者可测的看作是真实的。[36]只要获得上述的结果,加上跨学科搬运的能力,就能达到特定的研究目的。由此,学术的立法者转变成了科学的阐释者。这对于整个学界发展乃至人类知识推进而言是有不小风险的:一方面,教育、学术再生产的过程中,学习者以此作为一个理所当然的模式;或者,尽管有人对此有疑问,也因外界其他强制因素而妥协,这是一种教条主义倾向。另一方面,正如米尔斯所说,各种细枝末节的研究、科学探索都是整个学术研究分工的一部分。自然科学、社会科学亦如是。但如果都在研究细节和当下,做自然科学以及美国量化研究模式的搬运工和阐释者,而逐渐脱离社会科学研究中独特的人文因素,那么必然呈现出学科异化的形式,即人们虽然作为一个个活生生的个体,却抛弃从事学术研究中所涵盖的人文启蒙、反思乃至突破意义。因此,在当今时期,这一60年前所提出的方法学实践主张随全球学术变迁非但没有失去其必要性,反而变得更为重要而且紧迫。
我们无意于对意义本身作更为深层次的阐述,以上的探讨仅仅试图为社会生活意义的本体性特征提供一个非实证的论证分析,目的无非在于将现实的社会生活的固有属性同科学研究过程中尝试制造的理想模型进行区分。它通过对该复杂化意义的内涵与特征进行简要梳理,从外在和内在两方面形成一种对社会生活科学研究方法批判的视角,从而为本文所主张的研究方法学具体实践提供一种可能性的本体论根基与分析框架。
四、意义的曲解与学科反思
诚然,对社会生活的意义强调,并不是对大数据之于社会学研究的彻底否定。如一些推崇者所主张的那样,该时代下对人类部分行为、行动等的研究以及由此所产生的诸多研究成果对于社会生活的进步而言理所当然是有意义的。原因在于,大数据的浪潮使得计算机技术的运用在社会学领域中逐步呈主流研究方式,同时试图在学科领域内产生诸如“社会的信息处理范式”“社会科学的计算范式”[14]23等新的主导范式。在这些范式主导下,数据收集和处理方式也发生了改变。具体来说,研究者们可以从网络采集到的各类数据库中挖掘和获取各自所需的不同维度的字频、词频等,并根据不同的研究主题与对象进行诸如文本、差异、流动等分析且建构相关的数理模型。与传统研究相比,大数据研究的数据来源就是社会生活中自发形成的数据库,其客观性以及研究的可信程度也更高。从这个层面上来说,上述新范式的提出与实践以及在特定领域内的成果确实给诸多研究提供了极大的便利。更进一步说,数据收集与分析方式的更新也促进了研究方法的升级。通过更为先进、高级的分析手段可以使传统手段无法分析出来的相关性、维度等呈现出来,由此既可以对以前的研究成果进行修正,又能够在更为广泛的领域中进行探索。因此,研究者们更有理由相信社会学领域内的科学研究亦充满价值和意义。但是,此处所谓的“意义”却与本文所主张的意义内涵大相径庭,它其实是一种本体论上的曲解。用计算机等科学手段的研究,其意义的概念实际上是指涉某种特定的经验目的(诸如对个体行动的预测、对社会结构运行的把握等),研究本身所追求的也往往是一种类似自然科学所追寻的、客观的、普遍的有限意义。而本文所强调的意义,则是具有社会历史特殊性的、以社会生活抑或人类生活作为研究对象的意义。且如前文所述,本文立足区别于自然的、社会的本体意义,是从人类学科的抽象层面上来探讨,而非停留在具体研究的手段方法的层面。研究方法即便再先进和复杂,从网络收集的数据仍然受到社会情境以及虚拟性的限制。其一,前文已经谈到,情境在时空上的复杂性并非频数统计和模型建构就能解决。即便是采用时间序列分析、多个截面数据进行统合等方式尝试探寻事物发展的变化,也无法准确地把握“行动-过程-事件”三位一体的无限可能性。其二,大数据社会学研究的主要内容就是互联网的使用。而互联网研究的对象即便是所谓的人,其获取的信息也是该群体在虚拟空间中的行动。但不可否认的是,人在现实中的行动必然比虚拟中要复杂得多。而真正的意义就存在于这真实的生活世界中。从这个层面上来看,大数据当然“不能告诉我们所有事”。[37]安德森所谓的“理论终结说”也必然太过于绝对化。综上,我们可以知道,如果研究者仅仅停留在可观测到的、外在的表征,那么他们所能瞧见的只是一棵棵树(经验层面上的意义);而超脱于表征来进行想象并深入地探求周遭世界所包含的诸多问题域,那么所能望见的便是一片片林(本体性层面上的意义)。大数据之于当代社会学研究而言,尽管具有部分方法上的优势,但它的作用仅限于捕捉人类的外显行为或者表面呈现出的状态(这种状态也即各类树木);而该行为或状态背后深层的内在意义(广袤的树林)却是这类量化研究所无法探知到的。简言之,这是研究者同研究对象关系的距离和层次问题,大数据的作用对于社会学学科而言似乎是一种见树不见林的现象。这就涉及大数据在学科层面运用的程度问题了。对于不同领域的研究者而言,其研究的最终目标“还是在于我们到底对社会学的分析与理解有着怎样的期待”。[38]27
大数据时代的来临俨然成为一个不争的事实,但是如果不局限于某一时代的框架,从整个人类社会的角度来看,社会生活中人类的诸多行动和互动以及与之相关的各种现象并不能用所谓的科学手段或自然科学的公式来给出合理的解释。意义的复杂性已经预设了社会生活具有极大的异质性,可量化的程度也都不相同。[39]也正是人类生活充满了各种复杂意义和价值,使得我们能够在更大的时间和空间维度进行人类知识的生产,而不仅仅拘泥于科学化的统计手段,因为后者无论再怎样先进,仍然是人类从事知识思索、探索和生产的媒介。
虽然我们已经从学科乃至人类的层面区分了社会科学与自然科学对知识追问的方式,但从当今的学术生产方面来看,社会学学科却有一种受吞并的潜在倾向。笔者认为,如前文所提及,“计算社会学”“新计算社会学”的兴起和研究手段的日趋成熟,越来越多从事社会学研究的学者热衷于采用计算机科学的处理和研究方式,愈发信奉数字的解释力,并注重类似自然科学的数学和物理模型,这种倾向所导致的结果极可能是社会学将逐步成为计算机科学的分支学科,也即计算机专业下的计算社会学分支方向。其实,不仅是社会学学科本身,诸如心理学这样的学科也同样已经开始朝自然科学这一趋势发展,其程度不亚于社会学本身。我们知道,现在不少心理学研究者开始着手对人的神经和脑部进行测量研究,通过对心电图、脑部成像等结果的呈现来探寻人的态度、认知、行为等。无论那些当代心理学家们是否承认,心理学学科似乎在一定程度上已经成为生物科学的潜在的分支学科。这是学科层面上的异化:人们原本想掌控研究技术并为自身服务,但由于过分追求数据及其模型的呈现,对历史、文化等因素以及自身主体的忽略而使得研究技术本身逐步实现对人们的奴役。如此异化的最终结果就是社会文化意义的忽视以及由此导致的社会科学乃至人文学科的绝对式微。然而,如同埃利亚斯所说:“我们不能期待有关人的科学终有一天将成为生物科学的一个分支。”[40]同样,我们也无法将社会学学科视为计算机科学下的一个分支。我们仍然主张这样一个立场:由于社会历史意义的存在,换句话说,理论的重要性与否,在很大程度上决定了社会学的学科地位;社会科学家不同于自然科学家的标志“在于前者是非数学的,而且不是没有理论的”。[38]129把自然科学的研究手段想当然地应用于社会生活中去,结果无疑是形式上的数据繁荣与实质上的自欺欺人,同时悬置了那些科学方法无法计算的方面。叶启政甚至强调“只为了期待把社会学推进以物理学为典范的‘科学’殿堂而向自然科学的认知模式倾斜,将只是一种东施效颦的作为,更是一种自我矮化与异化的行止”。[38]132所以,我们有必要在理论上像海德格尔一样对数据进行追问。只有通过对“数据本身是什么”进行质问的时候,我们才能知晓数据能为我们做什么以及我们当下的状况。[41]加里·金(Gary King)虽然没有像海德格尔那样进行过多的哲学层面的探讨,也没有明确提及意义理论及其相关的论述,但是他强调理论重要性的观点与此不谋而合。他认为,由于大多社会科学领域内的进步都建立在经验数据以及数据分析方法改进的基础之上,所以一些人士认为,理论家(经济理论家、形式理论家、统计理论家、哲学家等等)已经和我们所谈及的核心部分没有任何关联。因此才会有“有谁还会读理论?”的主张。但这种说法毫无根据。在每个社会科学领域以及大多学术领域中,应该是友善地将理论家和经验研究者区分开的。尽管他们会在教职和诸多研究领域相互竞争,但他们都知道双方研究的必要性。因此,即便是探讨核心部分的经验研究者,在某一时刻仍然需要同理论家进行互动;而理论家则因能在更高质量的经验材料中更好地修正他们的理论而获益。[42]这些主张都值得我们进一步思考。
综上所述,作为对大数据时代下方法学转向的回应,关乎社会学学科的关键问题就是:它绝不可以自然科学为典范,更不隶属于自然科学,它的研究对象具有独特的历史、社会意义。因此,社会学学科的研究特殊性以及研究对象的意义复杂性,远非大数据的研究方法学所能把握和驾驭。从狄尔泰的学科划分时期伊始,意义已经作为人类社会同自然世界区分的重要因素与标志,而社会科学抑或人文学科的真正发展本身可以说是建立在对人类意义关注的基础之上的。雅斯贝尔斯曾强调,历史的意义在于要实现人类意识的最高潜力,即人类在哲学上的自我反思并通过对事物的认识来把握现实的能力,并“通过认识到他的局限性而为自身建立最高目标”,[43]而这种通过反思所产生的精神跃动最终形成了余英时所谓的“轴心突破”(Axial Breakthrough)。[44]由此可以肯定,大数据时代下的科学方法固然在持续推进,但社会学的研究对象及认知模式明确了前者应用程度的局限性,本体性意义的存在也证明理论具有不可动摇的地位。
五、结束语:溯洄涵泳
“当自身面临各种主导思想,哪怕是最为崇高的思想时,也要在个人能力这个意义层面上保持一颗冷静的头脑(einen kühlen Kopf),必要的时候甚至还要‘溯洄涵泳’(gegen den Strom zu schwimmen)。”[45]这是韦伯曾经对部分职业思想家的一种指责和建议。同时,这也是他对于政策上纯技术的实施不能采取客观中立态度现象的一种回应。推而及之,“溯洄涵泳”这一主张的确在一定程度上意味着对时代中主流范式和方法学取向的一种态度。这并非是为了站在某一极端立场(主张理论终结的定量至上说抑或彻底排斥量化方法的理论至上说),而是面对大数据时代的浪潮以及随之产生的某种方法学支配倾向所采取的一种谨慎的、自我慎思的方式。否则,无论是哪种形式的狂热主义或者极端化,用韦伯的话说,“和那些自以为重要的文人们的那种令人厌恶的荒腔走板,实在没什么两样”。[46]
就当今的社会学而言,研究的计算化为主要特征的方法学转向正在成为学科领域中的主流研究趋势。所以韦伯的这一反思态度对目前的情形仍然极具启发意义。我们应当承认,相较于传统的量化研究而言,大数据的社会学研究的确能在研究方法手段和数据来源等方面起到更大的作用;但论其实质,它仍然只是从描述的层面上来呈现所发生的事件和事物的外在;而社会生活的复杂内在性和外在性内容以及不同个体作为能动者所具有的有意义的行动和策略等终究是大数据所无法替代的。另外,有关社会世界的学科研究需要的并不只是人类对静态的、充其量反映外在局部特征的表象采取直观反应和认识的态度;无论是研究的目的、对象和研究过程,在面对科技对方法学的冲击时,要像韦伯所强调的那样,保持清醒的态度,要理解周遭世界的独特活跃性(相对冷冰冰的数码世界而言)和人自身的能力对于他们所创造的知识精神产物的种种突破性。从这个层面上来说,当今的“溯洄涵泳”,也就是对“大数据助推的量化研究霸权地位”以及“计算机科学技术导致的、对人类社会世界的意义和人的崇高意识逐步产生疏离”的一种逆向的审问。简言之,在这样的时代下,只有时刻秉持学科方法学的慎思并从根本上真正施予人文的关怀,才不至于为浩瀚的大数据洪流所淹没。
①19世纪30年代,由门格尔(Carl Menger)和施穆勒(Gustav von Schmoller)私人的学术争论引发了奥地利经济学派同德国历史学派的派别论争,此为第一次方法学之争。而在20世纪中期,弗里德曼(Milton Friedman)与萨缪尔森(Paul A Samuelson)因经济学方法学观点的不同而在学界中掀起第二次方法学之争。
②《生活是如何被篡改为数据的?——大数据套用到研究人类的“原罪”》一文的四个副标题(现实生活被裁剪、社会情境被忽视、主题建构被抹杀、生活意义被取消)涉及的是认识论问题。
参考文献:
[1]Alain Desrosières.The Politics of Large Numbers:A History of Statistical Reasoning[M].Cambridge:Harvard University Press,1998.
[2][法]福柯.规训与惩罚[M].刘北成,杨远婴,译.北京:生活·读书·新知三联书店,1999:194-200.
[3]Erving Goffman.Asylum:Essays on the Social Situation of Mental Patients and Other Inmates[M].New York:Anchor Books,1961:127-131.
[4]叶启政.均值人与离散人的观念巴贝塔:统计社会学的两个概念基石[J].台湾社会学,2001(1):1-63.
[5]Jerzy Neyman.The Emergence of Mathematical Statistics:A Historical Sketch with Particular Reference to the United States[A]//Donald B Owen.On the History of Statistics and Probability.New York:Marcel Dekker,1976:149-193.
[6]郑震.社会学方法的综合——以问卷法和访谈法为例[J].社会科学,2016(11):93-100.
[7][德]亨普尔.自然科学的哲学[M].张华夏,余谋昌,鲁旭东,译.北京:生活·读书·新知三联书店,1987:102.
[8]Carl Hempel.Philosophy of Natural Science[M].New Jersey:Prentice Hall,1966:245.
[9]Mckinsey Clobal Institute.Big Data:The Next Frontier for Innovation,Competition,and Productivity[R].Chicago:Mckinsey & Company,2011.
[10]Anthony Giddens.The Consequences of Modernity[M].California:Stanford University Press,1990:151.
[11][美]彭特兰.智慧社会:大数据与社会物理学[M].汪小帆,汪容,译.杭州:浙江人民出版社,2015:2.
[12][英]舍恩伯格,[英]库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2014.
[13]David Lazer,Alex Pentland.Life in the Network:The Coming Age of Computational Social Science[J].Science,2009(5915):721-723.
[14]Claudio Cioffi-Revilla.Introduction to Computational Social Science[M].London:Springer-Verlag,2014.
[15]陈云松.大数据中的百年社会学——基于百万书籍的文化影响力研究[J].社会学研究,2015(1):23-48.
[16]陈云松,吴青熹,张翼.近三百年中国城市的国际知名度:基于大数据的描述与回归[J].社会,2015(5):60-77.
[17]陈云松,朱灿然,张亮亮.代内“文化反授”:概念、理论和大数据实证[J].社会学研究,2017(1):78-100.
[18]罗玮,罗教讲.新计算社会学:大数据时代的社会学研究[J].社会学研究,2015(3):222-241.
[19]Chris Anderson.The End of Theory,Will the Data Deluge Makes the Scientific Method Obsolete?[J/OL].(2008-06-30)[2018-03-02].https://www.edge.org/3rd_culture/anderson08/anderson08_index.html/,2008.
[20]孙秀林,施润华.社会学应该拥抱大数据[J].新视野,2016(3):3641.
[21]Stephen Baker.The Numerati[M].Boston:Houghton Mifflin Harcourt,2008:22.
[22]潘绥铭.生活是如何被篡改为数据的?——大数据套用到研究人类的“原罪”[J].新视野,2016(3):32-35.
[23]Jim Harris.Big Data Hubris[N/OL].(2014-03-26)[2018-03-05].http://blogs.sas.com/content/datamanagement/2014/03/26/big-data-hubris/,2014.
[24]刘林平,蒋和超,李潇晓.规律与因果:大数据对社会科学研究冲击之反思[J].社会科学,2016(9):67-80.
[25] Durkheim.Les régles de la methodesociologique[M].Paris:PUF,1996:14.
[26]George C Homans.Social Behavior:Its Elementary Forms[M].New York:Harcourt,Brace & World Inc,1961:38.
[27]谢志刚.大数据再掀经济学方法论之争[N].中国社会科学报,2015-09-17(002).
[28]郑震.论日常生活[J].社会学研究,2013(1):65-88.
[29]Max Weber.Wirtschaft und Gesellschaft:Grundriss der verstehenden[M].Tübingen:Jakob Christian Benjamin Mohr,1972.
[30]郑震.作为存在的身体[M].南京:南京大学出版社,2007:14-25.
[31]Alfred Schütz.The Problems of Social Reality[M].Netherlands:Springer,1973.
[32]Alfred Schütz.Der Sinnhafte Aufbau Der Sozialen Welt[M].Wien:Verlag von Julius Springer,1932:38.
[33][德]狄尔泰.历史中的意义[M].艾彦,译.南京:译林出版社,2014:17.
[34]Charles W Mills.The Sociological Imagination[M].London:Oxford University Press,1976.
[35]成伯清.情感、叙事与想象——将历史维度带回社会学[J].江海学刊,2015(5):100-106.
[36]Richard D Precht.Wer Bin Ich und wenn ja,wie viele[M].München:Wilhelm Goldmann Verlag,2007:65.
[37]Abraham Kaplan.The Conduct of Inquiry:Methodology for Behavioral Science[M].Scranton:Chandler Publishing Company,1964:209.
[38]叶启政.实证的迷思:重估社会科学经验研究[M].北京:生活·读书·新知三联书店,2018.
[39]成伯清.社会学的修辞[J].社会学研究,2002(5):46-61.
[40]Norbert Elias.On Civilization,Power and Knowledge:Selected Writings[M].Chicago:The University of Chicago Press,1998:239-240.
[41]Martin Heidegger.The Question Concerning Technology[M].New York:Garland Publishing,Inc,1977:4.
[42]Gary King.Restructuring the Social Sciences:Reflections from Harvard's Institute for Quantitative Social Science[J].Political Science and Politics,2014(1):165-172.
[43]Karl Jaspers.The Origin and Goal of History[M].New Haven,London:Yale University Press,1965:2.
[44]余英时.论天人之际[M].台北:联经出版事业股份有限公司,2014:9.
[45]Max Weber.Gesammelte Aufstze zur Wissenschaftslehre[M].Tubingen:Jakob Christian Benjamin Mohr,1988:540.