张耀铭：学术评价的异化与重建

原编者按:近年来,学术界、期刊界、学术评价机构各方,就学术评价、学术期刊发展等问题进行过较多的讨论,在学术评价的原则、方法、功能和学术期刊的职责、定位、发展路径等议题上,积累了相当可贵的理论和实践经验。2020 年 2 月,教育部、科技部联合下发了《关于规范高等学校 SCI 论文相关指标使用树立正确评价导向的若干意见》,这份文件给学术评价方式的变革与策略的调整指明了方向,也给学术期刊发展提出了新的要求。再加上新媒体技术的发展和大数据的广泛运用,让学术评价和学术期刊发展也面临新的机遇和挑战。为回应上述变化的形势,本刊特邀学术界、期刊界对相关议题素有研究的专家学者展开讨论,以期将学术评价和学术期刊发展研究引向深入。

（原文刊载于《首都师范大学学报》（社会科学版）2020年第6期）

摘要:学术评价是学术资源分配和学术管理的基础和核心，也是国家行政权力部门寻求“科学”和“客观”学术评价的依据和重要抓手。然而，目前中国人文社科的学术评价政出多门，以刊评文，完全颠倒了学术评价的内在逻辑关系，导致一系列的学术评价异化现象出现，如学术评价主体越位、“核心期刊”功能错位、影响因子滥用等。如何重建学术评价体系，作者认为：一是重建学术同行评议，才能标本兼治、扶正祛邪；二是回归学术初心，重建质量导向和回应社会关切；三是改革和完善学术评价体系，确保学术成果评价科学权威。

关键词:学术评价；异化；重建

2020 年 2 月 18 日,教育部、科技部联合出台了《关于规范高等学校 SCI 论文相关指标使用树立正确评价导向的若干意见》(以下简称《意见》)。这个《意见》很有料,在中国语境的“学术评价”浪潮中,是一个更可以期待、更具有政策导向的范本。也就是说,《意见》提出的举措与思考,虽然主要是针对自然科学和工程技术,但对人文社会科学亦具冲击力和参考价值,也意味着学术评价将在一定程度上得到重建。

一、学术评价政出多门

学术评价是指根据一定的目的和标准,采用一定的理论和方法,评判学术成果的价值,鉴别学者研究的贡献,激发科研机构的创新,规范学术研究的行为,推动国家学术发展的活动。从这个意义上说,学术评价是学术资源分配和学术管理的基础和核心,也是国家行政权力部门寻求“科学”和“客观”评价学术成果的依据和重要抓手。

自 1992 年北京大学图书馆《中文核心期刊要目总览》推出以来,目前有北京大学图书馆《中文核心期刊要目总览》、南京大学中国社会科学评价中心《中国社会科学引文索引》、中国社会科学院中国社会科学评价研究院《中国人文社会科学期刊综合评价指标体系》 (AMI)、中国知网《中国学术期刊影响因子年报》 (人文社会科学)、中国人民大学人文社会科学学术成果评价研究中心和书报资料中心共同研制的《“复印报刊资料”重要转载来源期刊》等中国人文社会科学评价机构呼风唤雨、风光无限。这些评价机构的产品大体上分为两类,即“核心期刊”与“来源期刊”。虽然“北大核心”与“南大 C 刊”市场的能见度更高,影响范围更远,更具标杆意义,但其他评价机构也不甘落后,他们卷起袖子,摆开架式,制定标准、组织评价、划分等级,大张旗鼓地举办期刊排行榜发布会。一时间你方唱罢我登台,好不热闹。学术评价政出多门,多路豪杰各显神通,其目的在于获得行政权力部门的认同或强力支持,使自己主导的评价产品成为资源分配和学术管理的主要依据。一旦获得学术评价与权力,评价机构就会摇身一变,成为学术舞台上赢者通吃的大牛。在学术评价的大潮中,学术期刊从主角变身为配角,在亚马逊体系中屈居于从属的地位。面对评价机构发布的“排行榜”,学术期刊要么跟着指挥棒转,要么被淘汰出局。就是这么残酷。这是一个生存还是死亡的问题,是哈姆雷特式的经典问题,并非只是一个传说。学术期刊大多数都是小打小闹的小舢板,面对评价机构的辗轧,只能选择“跪下”,跟着“排行榜”的指挥棒转,被它牵着鼻子走,或许才能把自己渡向彼岸。

二、学术评价异化现象

学术评价首先应该是对学术研究的主要成果———论文进行评价,其次才是期刊评价、机构评价、人才评价、项目评价等,评文是评刊的前提,两者构成因果关系。论文评价属于微观层面的评价,也是学术评价的最小单元,同时也是最为复杂的评价对象,但目前还没有研制出比较客观、公正、科学的评价指标体系。学术评价标准缺失,“以文评刊”一时难以实现,取而代之的是“以刊评文”,使原本最为复杂的事情变得十分简单,即根据论文发表在什么级别的刊物上来确定其内容质量。这便完全颠倒了学术评价的内在逻辑关系,由此导致一系列的学术评价异化现象出现。

异化之一,学术评价主体的越位。

学术评价的主体当然应该是基于学术目标、学术价值、学术范式、学术旨趣认同的学术共同体亦称科学共同体(scientific community),“它是由学者以专业为基础自愿结成的众多学术团体、学术期刊和学术会议组合而成的。专业性与自律性是这种学术共同体最突出的特点。”在美国,自律的学术共同体可以自主地制定评价的规则、标准和程序,对成果(论文与著作)的评价贯穿于学术会议的评议和争鸣,专业期刊发表前的双向匿名评审,成果发表后的书评评价与学术评奖。这种复合型的学术评价机制,客观上避免和惩处了学术评价过程中的一些弊端,推动了学术的良性发展。

学术评价引进到中国之后,并没有完全仿效欧美模式,而是按照中国国情特色进行了自我塑造,或者说在功能和意义上发生了“异化”。改革开放 40 年,中国的教育和学术研究取得了巨大的成就,发生了翻天覆地的变化。但还没有形成严格标准意义上的学派,多数学者习惯于围绕自己的一亩三分地单兵作战,更遑论具有群体意识、学术民主、学术自律和学术自由的学术共同体。在这种情况下,专业评价机构便应运而生越位评价,从而使学术研究与学术评价的同一性彻底终结。专业评价机构的特征体现在四个方面:“其一是几乎均由从事文献情报工作的人员组成,除了其本专业以外,不是任何学术共同体的成员;其二是在明里或暗里都以为政府服务或被政府认可为主要目的;其三是通过采集各种形式数据,以量化评价的“客观”“公正” “公平”相标榜;其四是其主打产品即对学术期刊进行分等分级(如所谓“顶级期刊”“权威期刊”“核心期刊”等)的排行榜和排名表。”现有的评价主体或附属于大学机构, 或附属于中国社会科学院研究中心,既违“瓜田不纳履,李下不整冠”之古训,又依靠这些机构划拨经费维持运转,远不是独立的第三方。由此可以看出,专业学术评价机构完全是越俎代庖越位评价,它们既不是合适的“学术”评价主体,也不是合适的“期刊”评价主体。由于缺少一个民主、自律的学术共同体, 缺少同行评议的积极参与,“行政权力介入和干预越多,则学术乱象和学术腐败越多,异化越严重,从而陷入越管越乱、越乱越管的恶性循环之中。”

异化之二,“核心期刊”功能的错位。

自学术期刊 17 世纪 60 年代诞生开始,其主要社会功能有两种:一是学术成果的展示传播功能;二是学者之间的交流与对话功能。1934 年英国文献计量学家布拉德福揭示了文献集中与分散的规律, 即表明期刊可能存在“核心效应”,后来“核心期刊”概念得以流行,评价功能得到强化,而其交流与传播功能却被有意无意地弱化了。20 世纪 60 年代,中国自然科学界开始引进期刊评价的理论与方法。1992 年北京大学发布《中文核心期刊要目总览》,1999 年南京大学推出“中文社会科学引文索索引来源期刊”(CSSCI),2009 年武汉大学发布“中国学术期刊评价研究报告”,2014 年中国社会科学院发布“中国人文社会科学期刊综合评价指标体系(AMI)”,至此国内有着重要影响力的人文社会科学专业学术评价机构全部亮相。

随着学术功利主义在中国的蔓延,“以刊评文”现象愈演愈烈,“核心期刊”被捧上了神坛,其功能大大超出了原来的边界,发生了严重错位。最令人感到荒谬的在于:第一,“布氏定律”强调的是文献分布的多少,而不是期刊质量的高低,故与质量评价无关。第二,“核心期刊”实质上是以过去的文评现在的刊,以现在的刊评未来的文。过去那些把学术期刊推举到“核心期刊”圈子里的论文,却不是核心期刊论文;而那些还没有数据贡献、没有产生任何效能,发表在“核心期刊”上的论文,反倒坐享其成地成了核心期刊论文。第三,期刊评价等级牵着学术评价的鼻子走,由入库期刊、扩展期刊、核心期刊发展到权威期刊、顶级期刊,步步抬高,层层加冕,贴标签习以为常。在顶级期刊发表一篇高影响因子论文,虽然稿费很低,但奖励动辄几万或数十万元,这种羊毛出在狗身上猪买单的现实剧情,更刺激了了科研中的功利化倾向。第四,学术界及期刊界人士对此喜忧参半,“喜的是‘东方不亮西方亮’,这家‘核心’进不了,那家‘核心’也能上;忧的是大家都是‘核心’,就谁也不是‘核心’了,实际上是使核心期刊的认定失去了固有的意义。”

异化之三,影响因子的滥用。

“影响因子”是由美国文献学家尤金·加菲尔德提出的,是指一份期刊前两年发表的“源刊文本”在这个年度的总被引用数,除以这个期刊在前两年所发表的“引用项”数。依据这一定律,加氏在 1964 年出版科学引文索引(SCI 报告),1973 年出版社会科学引文索引(SSCI 报告),1976 年出版艺术与人文引文索引(A&HCI 报告),构成了美国科学情报研究所(简称 ISI)的三大核心数据库。谁拥有大数据,谁就掌握了权力。1975 年美国科学情报研究所推出期刊引证报告(简称 JCR),包括自然科学和社会科学两个版本。通过对参考文献的标引和统计,可以在期刊层面衡量某项研究的影响力,显示出引用和被引期刊之间的相互关系,从而让影响因子变成了赚钱的机器。不过影响因子是一把双刃剑,在许多国家受到崇拜的同时,也一直受到学术共同体的诟病和批判。2013 年 5 月,美国 78 个科学组织的 155 位科学家签署了在美国细胞生物学学会年会期间提出并最终形成的《关于科研评价的旧金山宣言》。宣言认为科学界应该停止使用影响因子评价科学家个人的工作;影响因子不能作为替代物用于评估科学家的贡献,以及招聘、晋升和项目资助等的评审。2014 年在荷兰莱顿召开的一次国际会议上,美国佐治亚理工学院的公共政策教授 Diana Hicks 等提出了合理利用科学评价指标的七条原则,后来扩充为十条,这就是 2015 年 4 月发表在《自然》杂志上的“莱顿宣言”。“莱顿宣言”的十条原则:一是量化评估应当支撑质化的专家评估,而不是取而代之;二是衡量绩效应基于机构、团队和个人的科研使命;三是保护卓越的本地化的相关研究;四是保持数据采集和分析过程的公开、透明和简单;五是允许被评估者验证数据和分析;六是考虑发表和引用的学科差异;七是对个人研究的评价应基于其综合作品的质性评价;八是应避免评估指标的不当的具体性和虚假的精确性;九是识别认清评价指标对科研系统的影响;十是定期审查评价指标并加以改进。这两个著名宣言引发了世界科学界的广泛关注,《科学》杂志就旗帜鲜明地批评影响因子最重要的危害是妨碍创新,它引导科学家关注发高影响因子的文章,追逐所谓的“热点”,而不是潜心科研创新。诺贝尔生理学和医学奖得主兰迪·韦恩·谢克曼博士在英国《卫报》发表《〈自然〉〈细胞〉和〈科学〉这类顶级期刊是如何损害科学的》文章,猛烈抨击期刊影响因子的重大缺陷和负面作用,指出“一篇论文被大量引用可能是因为它是好的研究,也可能是因为它吸引眼球,或者是挑衅式的甚至是错误的”,强烈呼吁“科学界应该推翻顶级期刊的暴政”。

影响因子引进国内之后,受到社会高度关注和争论的是南京大学中国社会科学评价中心研制的《中文社会科学引文索引》(CSSCI),其在中国学术评价及期刊评价中地位举足轻重。从 1997 年提出设想,1999 年被列为教育部重大项目,2000 年中国社会科学研究评价中心成立,2000 年光盘版新闻发布会在北京举行,2004 年被国家社会科学规划办列为国家重大研究课题,2005 年起增设来源集刊,2007 年起增设扩展版,CSSCI 来源期刊基本完成了在中文人文社会科学领域对 SSCI 的模仿。叶继元教授谈到研制《中文社会科学引文索引》的初衷:一是为了建立一个不同于传统索引系统的、从引文角度来编制的新型的中国人文社会科学文献检索系统: 二是希望利用这个数据库, 通过引文分析来描述人文社会科学的发展, 定时跟踪科研动态、科研前沿和学派动向; 三是要为人文社科的学术评价提供参考和帮助。但评价功能的强势与“期刊排行榜”的招摇,显然超越了“文献检索”和“数据服务”的功能:“从数据库的服务职能转型为评价体系之考评职能,内在隐含的主观性权力追求与获取冲动,乃是完成此一转型的更为根本的因素。”经过十年的不懈努力,CSSCI 一骑绝尘成为中国影响最大的评价标准,被狂热追捧为“C 刊”,迅速“泛化”成为职称评审、工作考核、学科评估、期刊质量评价、论文质量评价等的核心指标。这也导致《2010—2011 年 CSSCI 来源期刊目录》、《2017—2018 年 CSSCI 来源期刊及集刊目录》发布之后,受到学术界的猛烈批评。客观讲,南京大学中国社会科学研究评价中心在编制新版目录时,已经在评选方式、期刊分类、异常数据剔除等方面做了部分改进,但依然成为众矢之的。原因何在? 第一,CSSCI 是一个用于引文分析的数据库产品,并不具有独立的学术期刊评价功能,更不具有独立的学术评价主体身份。第二,CSSCI 评价是以各种数据为基本依据而制定的评价标准,评价过程是对评审对象的“比”而非“评”,“比”是以高与低、多与少、强与弱、优与劣等基于形式的量的比较,而非对期刊学术价值的质的评价。这种评价与排序,“名为评价实为评比,就可能将一些不可比或难可比的要素排斥在外,用统一的标准来比较不同研究对象、不同研究方法、受不同传统习惯的影响而表现出的不同形式的学术研究成果及其特点各异的表述方式,其公平性就很难掌握。”第三,从自然科学引发的学术评价工具,在运用到人文社会科学会发生严重的变异。影响因子被引入学术期刊评价曾起到先前定性评价难以达到的“客观性”和直观“量化”,但不可忽视其存在的片面性、误差性和差异性。影响因子在不同学科分布极为不同,把数学与生物学相比肯定是风马牛不相及;即使是人文社会科学,经济学论文与文史哲论文的影响因子也无法相比。如果将期刊影响因子的作用无限放大,片面追求高影响因子,带来的严重后果就是学风浮躁、急功近利和学术生态恶化。第四,学术研究功利化趋向助长了学术界和期刊界对 CSSCI 的片面认识。CSSCI 作为引文分析的重要工具,利用文献计量方法对学术论文的聚类度、相关度、规范化、引用情况进行各种统计分析,其产生的数据与分析报告,得到学者、期刊编辑和科研管理者的普遍认可,所以有越来越多的学术机构直接将 C 刊目录作为学术评价及期刊评价的依据。这无疑阉割了 CSSCI 数据服务的基本属性,而将其评价功能给予无限放大,实质上混淆了高引用与高水平、来源期刊收录标准与学术评价标准的界限。

三、重建学术评价体系

《意见》除了对规范高等学校 SCI 论文相关指标使用提出负面清单之外,还特别提出建立健全分类评价体系、完善学术同行评议、实行代表作评价的意见。虽然不能说这是自上而下的顶层设计,但也属于行政权力部门推动的政策变革。这种变革对中国人文社会科学的学术评价将带来怎样的影响? 学术期刊将如何作为? 专业评价机构将面对什么样的挑战? 令许多人充满了期待。

第一,重建学术同行评议,“必须立破并举、多管齐下、统筹协调、优化整合,才能标本兼治、扶正祛邪。”一是要根据不同学科具有的特定属性和特征,实施分类评价的标准和方法,完善定性与定量相结合的评价体系。二是让学术评价回归学术本性,依靠、相信、尊重同行专家的专业判断,充分发挥同行专家在学术标准制定和学术评价过程中的主体性作用。三是建立评审专家的遴选、回避、民主表决、专家信誉和监督制度,维护学者和学术尊严,增强学术同行专家的自律,保障学术同行评议制度的公平正义。

第二,回归学术初心,重建质量导向和回应社会关切。由于引文指标成为来源期刊遴选的重要依据,因此部分期刊把追求被引频次、影响因子作为终极目标,采取了一些“策略性操作”。一是采用期刊自引、机构自引、虚引伪引、互惠引用等“定向引用”,从而造成引文数据失真,导致引文分析结果出现误判。二是采取“分子策略”或“分母策略”做大影响因子,导致出现强制引用、共引现象和期刊发文越来越长、数量越来越少的倾向。三是通过策划“热点”选题和约请高被引作者保障高引用率,这种短期行为必然导致学术生产两极分化、赢者通吃的马太效应。破除 SCI 至上,就是要学术期刊回归学术初心, 淡化评价机构的核心期刊排名,在净化学术空气、优化学术生态方面有所作为;破除 SCI 至上,就是要重建学术期刊质量第一导向,鼓励发表高水平、高质量、有创新价值的学术论文,在国际学术界发出中国声音;破除 SCI 至上,就是要鼓励学术期刊关注中国问题,回应社会关切,用中文传播中国学术,发挥“天下公器”之作用,为学术同行评议、为学术共同体的形成和维护,提供重要的支持。

第三,改革和完善学术评价体系,确保学术成果评价科学权威。《意见》发布已有半年,但并没有看到各专业评价机构对“评价导向” “期刊等级” “期刊排行榜”等问题给予正面回应。不过,钟摆效应始终存在。钟摆可以过头,但它终将修正。我们期待改革和完善现有的评价机制,确保学术成果评价科学权威。一是建立学术评价机构准入制度和退出机制,不能无序、无资质进入,更不能胡评价、乱评价。把好准入和退出关,有利于营造良性竞争生态,有利于评价机构的创新发展,有利于加大违规成本。二是建立和完善中文人文社会科学研究的数据库,夯实科学评价的现实基础,以其实现数据服务的归数据服务、评价的归评价。对已经初步具备了检索、分析与学术评价的数据库,学术界与期刊界也寄予厚望的品牌,希望在本土化和国际化两个向度上进行调整和优化,进而对中国学术生态产生更多正面的影响。“具体而言,就是尊重学科发展和期刊发展规律,不断改进计量方式,使之更加贴近中国学术期刊的实际,真实反映出不同类型、不同学科学术期刊的学术影响力和办刊水平。”三是加强学术评价理论研究,学术期刊界和文献计量学界应通力合作、共同攻关,研制出针对人文社会科学单篇论文的评价指标体系,用“以文评刊”取代“以刊评文”,以期得到更具说服力的评价结果,消解量化评价的弊端。四是改革和重建科研管理体制,从根本上解决学术资源的分配、学术期刊的结构、学术评价的方式、学术传播的秩序和行政权力的过度干预等深层次问题。

总之,战术层面的改良,可能只是爆竹和烟花;战略层面的改革,或许才能壮士断腕走出困境。

张耀铭：学术评价的异化与重建

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏