谢登科周鸿飞：司法人工智能在证据审查中的功能定位与风险规制

[摘要] 人工智能在司法活动中应用的重要领域之一就是证据审查。人工智能为证据审查提供科技赋能,减少司法裁判的恣意性,提高证据审查的实效性,但是,人工智能在证据审查中的应用存在证据审查建构模型数据样本不充分、证据规则结构化转换不完整、证据审查程序缺乏可视性等风险和问题。为了应对人工智能在证据审查中的上述风险,需要明确人工智能在司法审判和证据审查中的辅助地位,提高司法人工智能训练的案例样本数量和质量,在技术层面提升人工智能自然语言转换能力,在规则层面限定司法人工智能在证据审查中的适用范围,将专家辅助人制度引入司法人工智能审查证据领域,强化对司法人工智能审查证据结果的说理论证。

[关键词] 司法人工智能;证据审查;证据标准;证据规则;算法解释

一、问题的提出

随着信息技术的快速发展,人类社会交往已逐渐从线下物理空间延伸至线上网络空间,数字智能时代随之到来。大数据、云计算、人工智能等逐渐深度融合并呈现出指数性扩展态势,其在给社会生活带来系统性创新和数字红利的同时,亦引发了新一轮信息革命和技术革命,给传统法律关系带来冲击和挑战。为了有效应对数字智能时代的挑战,部分国家和地区发布了一系列规范性文件。在欧洲,2021年4月欧盟委员会提出一个变革性法律框架,以促进合法、安全、可信的人工智能市场发展。2024年1月,欧盟委员会、欧洲议会和欧洲理事会完成了《人工智能法》的定稿,该法案明确指出人工智能可以用于支持法官的决策,协助司法机关研究和解释案件事实、法律等。在我国,2017年7月国务院发布的《关于印发新一代人工智能发展规划的通知》指出,应重视人工智能法律伦理的基础理论问题研究,促进人工智能在证据收集、案例分析、法律文件阅读与分析中的应用。2022年12月最高人民法院发布的《关于规范和加强人工智能司法应用的意见》明确指出,应加强司法人工智能应用系统建设,促进司法数据平台与智慧服务、智慧审判、智慧执行和智慧管理等业务应用系统的融合集成。

作为证据审查方式的技术性变革,人工智能在证据审查中的应用已经成为世界范围内的实践活动。在美国,人工智能在证据审查中的应用主要是将不同情形的证据关系和假定解释转换为数量值,以相关规则的形式在算法模型中构建,即if(condition)、then(action)的推理引擎,并通过一些变量信息来获取其他概率信息,从而用于证据的审查判断。比如:早期贝叶斯网络(Beyesian network)被用于对火灾事故类证据的审查。在我国,虽然实践中已有部分司法机关将人工智能应用在证据审查中,比如上海市高级人民法院开发的“上海刑事案件智能辅助办案系统”(以下简称上海“206系统”),以大数据、人工智能等技术为支撑,将统一证据标准嵌入办案系统中。贵州省高级人民法院与贵州省人民检察院、贵州省公安厅联合制定了统一的证据标准,并以大数据技术为依托,将要素化、结构化的证据标准嵌入办案系统中。然而,理论界对人工智能应用于证据审查的专门研究却不多。在现有研究成果中,学者多侧重于人工智能在司法中的适用场域、功能定位及应用风险研究,鲜有关于人工智能审查证据的专门研究。通过对现有研究成果梳理和实践现状考察可以发现,人工智能在证据审查中的应用主要存在三重困境:第一,不同案件面对的证据问题多种多样,而人工智能系统处理的案例样本数量有限,由此导致证据标准的设定存在个别化不足,其可靠性大打折扣。第二,证据规则的数字化、结构化转换困难,证据审查中的价值权衡、司法政策等难以量化标准并入算法系统中,无法实现对证据的实质审查。第三,人工智能审查证据过程处于“黑箱”状态,算法可解释性不足,无法实现证据审查程序的“可视正义”。因而本文将立足于人工智能在证据审查中的功能定位,分析司法人工智能在证据审查应用中的主要风险,并在此基础上提出应对措施,以期有效规制司法人工智能风险,充分释放智慧司法红利。

二、主导抑或辅助:人工智能在证据审查中的功能定位

随着网络信息技术与人类日常生活的深度融合,我国已经进入以大数据开发、大数据分析和大数据运用为主要内容的大数据时代。在司法领域,虽然大数据的收集、分析能够为侦破犯罪提供便利,但囿于大数据的“5V”特征,导致司法机关在对此类证据审查时面临着“量多人少”“技术鸿沟”等困境。对此,司法机关开始探索高效的证据审查方式,其中人工智能技术的运用能够大幅提高司法机关的证据审查能力。

(一)人工智能在证据审查中的价值功能

作为新一轮技术革命和产业革命的核心力量,人工智能早期在计算机仿真、机器人研发、机器控制中得到广泛应用。随着网络信息技术的发展普及,人工智能的应用范围日益扩张,逐渐在教育、医疗、司法等领域发挥重要作用。具体至证据审查领域,当前司法机关主要将人工智能运用在证据数量、形式审查、证据合法性审查等方面。

1.统一证据审查标准,减少司法裁判恣意

在司法活动中,“无证据,不事实”已经成为一项共识。虽然证据对于认定案件事实发挥着无可替代的作用,但证据材料只有经过查证属实后方能作为定案依据。关于证据审查,根据《中华人民共和国刑事诉讼法》(以下简称《刑事诉讼法》)第55条第1款规定,只有证据确实、充分的,才可以认定被告人有罪和判处刑罚。此款规定明确了证据审查中的“质”和“量”标准。在实践中,司法机关通常采用单个证据审查、全案证据印证审查等方法,对于证据的形式、属性、证据之间是否形成完整的证据链以及证据链是否闭合等进行审查判断。与传统证据审查相比,人工智能审查证据是将待审查证据与系统内部设定的证据标准进行比对,其中统一证据标准是人工智能审查证据的核心。

关于统一证据标准,2015年最高人民检察院先后制定了《刑事案件审查逮捕指引》和《刑事公诉案件证据审查指引》,分别就故意杀人、抢劫、盗窃等50个常见罪名的证据标准作出明确规定。2017年7月10日,时任中共中央政法委书记孟建柱在全国司法体制改革推进会上强调,要把现代科技应用和法律制度完善结合起来,充分发挥人工智能在数据分析方面的优势,明确不同诉讼阶段的基本证据标准指引。当下,无论是侦查取证阶段还是案件事实认定阶段,人工智能都在证据审查上发挥作用。在侦查取证阶段,人工智能系统通过量化证据标准来指引侦查人员收集证据,避免后续诉讼阶段因证据不合法、不充足而被退回。尤其是在电子数据取证领域,因电子数据具有易篡改性,若不对其及时收集可能会导致部分数据灭失而无法收集,人工智能系统可以指引侦查人员尽可能地全面、及时收集证据。以上海“206系统”为例,其以犯罪案件类型为基础,针对不同犯罪案件在侦查阶段应当收集的证据种类和形式进行了清单式列举,在侦查人员收集、审查证据时为其提供有效指引。在案件事实认定阶段,人工智能系统通过量化证据标准对侦查人员收集的证据进行审查。该标准是由人工智能算法对海量案件的自我标注、证据要素的自动提取并分析赋值所得,在最大程度上对各类证据进行了代码式处理,减少了证据审查过程中的主观裁量。

2.提高证据审查实效,减少刑事冤假错案

近年来,随着案件数量不断增多,案多人少的司法难题使得传统证据审查方式无法有效应对,对人工智能辅助证据审查的需求日益显著。在司法审判中,司法人员运用证据对案件事实认定之前通常需要对其进行审查,当遇到案情复杂的案件时,其将会面临海量的证据材料,这无疑会增加司法人员的工作量。除了案件情况复杂、证据数量多以外,科学证据的存在也是法院探求人工智能在证据审查中应用的重要原因。与传统证据相比,科学证据通常涉及某一领域的专业性问题,其需要由该领域的专家来审查判断。人工智能深度学习算法可以弥补司法人员专业知识的不足,其通过强大的学习和分析能力对不同学科的专业知识进行学习,并以此对科学证据进行审查判断。此外,人工智能也可以提高证据审查的精准性,减少刑事错案的发生。有学者就近年来发生的重大冤假错案分析发现,刑事错案的发生既有事实认定不清,更有证据收集不充分、标准不一致等原因。与传统证据审查相比,人工智能审查证据是通过构建证据模型自动对单一证据进行检验,并对现有证据是否形成完整证据链条进行审查,当发现证据中存在瑕疵或矛盾时及时作出警示指引,提示办案人员进一步核查证据,从而减少因证据审查不严谨、不规范而导致刑事错案的发生。

(二)人工智能在证据审查中的应然定位

人工智能在法律中的应用主要是由传统的逻辑分析、价值分析和规范分析朝着精细化、可操作性和易实现的应用范式转变。虽然人工智能具有提高证据审查效率、减少司法裁判恣意等优势,但其当前仍无法完全替代司法人员对证据进行审查。对此,应当合理审视人工智能在证据审查中的优势与不足,从工具理性的角度出发,明确其应然“辅助”定位。关于人工智能在证据审查中的定位,可以从人工智能在证据审查中的适用范围、运行机制及其与司法人员的思维模式差异等入手分析。

首先,就人工智能在证据审查中的适用范围而言,当前人工智能在证据审查中的应用仅限于证据形式、数量审查、单一证据合法性审查以及全案证据印证审查等。虽然其与司法人员审查的证据要素有相同之处,但后者对于证据的审查范围要更加宽泛。以单一证据审查为例,人工智能仅能对证据的形式合法性要件进行审查,而司法机关不仅要对证据的形式合法性进行审查,还要对证据的真实性、可信性等进行审查。由此,因人工智能在证据审查中的适用范围相对有限,故其仅能发挥辅助作用。

其次,就人工智能在证据审查中的运行机制而言,其主要是通过证据标准对于案件需要哪些证据以及各证据之间是否存在矛盾进行审查。关于证据标准,早期研究通常将其与证明标准视为等同,随着理论研究和司法实务的不断发展,人们逐渐认识到它们两者之间存在重大差异。若以阶段划分,证据标准应当属于审前阶段事实查明的证据要求,而证明标准则属于审判阶段事实查明的证据要求。当下,理论界大多学者认为,证据标准是指案件对所需证据的最低要求,其主要功能是发挥证据收集和审查的指引作用。在实践中,司法机关多是将证据标准作为证据数量、形式的审查指引。虽然证据标准包括对证据能力的审查判断,但严格来说人工智能中的证据标准与传统证据能力标准并非等同,以证据能力之合法性审查为例,前者仅包括形式合法性标准,而后者不仅包括形式合法性标准,还包括主体合法性标准、程序合法性标准等,比如:《刑事诉讼法》第56条关于非法实物证据认定要素之“严重影响司法公正”就属于程序合法性标准,其通常需要司法人员的解释性评价。由于人工智能中的证据标准既不等同于传统证据能力标准,亦不等同于证明标准,故该标准仅能实现对证据的初步筛选,而非实质审查。

再次,就人工智能审查证据的思维模式而言,人工智能属于典型的线性思维,其主要是通过算法来训练计算自动或在人工输入期望值的情况下,对输入的证据材料进行审查判断,即使当前人工智能已然经历了基于规则的系统学习、机器学习和深度学习三个发展阶段,但证据审查要素图谱仍主要是由人工录入或机器对司法案例大数据深度学习的基础上建构的。相比之下,司法人员审查证据时不仅需要法律规范的程式规定,还需要丰富的办案经验、司法政策的综合衡量。由此,人工智能对于证据的审查应当属于证据的初筛阶段,其仅能对证据的数量、种类以及形式合法性等进行审查,无法完全模拟司法人员对证据审查的系统思维。

三、样本质量风险:人工智能审查证据之证据标准可靠性

在数字信息化时代,人工智能在证据审查中的应用是人类决策与机器判断交互的结果。虽然人工智能可以提高证据的审查效果,最大程度实现“类案证据,相同审查”,但不同案件需要的证据种类、证据数量并不相同。囿于案例样本数量的充分性不足,以有限案件数量归纳的证据标准是否可靠存有疑问。对此,应当提高案例样本的充分性,从扩充案例样本数量、优化案例样本质量两个方面入手,提升证据标准设定的可靠性。

(一)案例样本不充分:证据标准可靠性不足的主要原因

大规模、高质量的数据是人工智能深度学习发挥效用的前提,要有大量的数据才能训练深度结构。人工智能在数据库中进行数据挖掘和知识发现的过程涉及多种技术,其中最关键的是统计分析和拟合概率的结合,其是探索数据分析(Exploratory Data Analysis)的一种形式,可以分析大量的数据集合。

在证据审查领域,人工智能审查证据使用的数据集主要包括数据采集、数据清洗、数据采样等环节,当数据样本不足时,人工智能仅能从数据集中提取到零星的群体特征,无法确保人工智能审查证据的精准可靠。以Last Atlantis Capital v.Ags Specialist Partners案为例,原告在法庭上出示了专家通过电子制表软件制作的数据表,用以证明消费者与证券交易所、证券代理人、经销商之间存在不当交易订单。被告及代理人对该证据存在异议,主张由于专家在创造电子制表软件时使用的算法可能对数据表的可靠性和可采性产生影响,而专家没有对法庭出示的数据表所依靠的样本数据进行出示,故该数据表的真实性和可靠性不足。法院认为,原告未能对电子制表软件所生成的数据表之样本数据集进行出示,以说明数据表所依赖的原始数据足够可靠,故该证据未被采纳。人工智能分析结果的可靠性与样本数据的充分性成正相关关系,即样本数据越充分、质量越高,样本特征越能贴近整体参数,人工智能分析结果的拟合度越高、可靠性越强。

在我国,虽然当前各地司法机关均在积极探索构建统一的证据标准,但囿于技术能力有限、案件复杂多样等原因,其证据标准设定所依赖的案例样本数量有限、质量不高。以上海“206系统”为例,2017年上海市高级人民法院针对多发常见的侵犯人身安全类犯罪、侵犯财产类犯罪、毒品类犯罪等7类案件中18个罪名的证据校验标准、证据材料、证据链构建等予以明确,并将该证据标准嵌入到“206系统”中。虽然将统一证据标准嵌入到上海“206系统”中可以大幅提高办案质量和效率,但其证据标准设定所依据的案例样本存在局限。一方面是当前裁判文书说理不充分,多数裁判文书仅是简单罗列证据目录,并没有对案件中的证据审查结果进行详细说理分析。另一方面则是案例样本数量有限,虽然当前我国法院已经建立了裁判文书数据库,但其并没有涵盖所有案件的裁判文书,且关于裁判文书的数据也仅有近期数据而没有长期数据,无法实现对不同案件所需证据的精细化分析。以上海“206系统”对于盗窃罪的证据标准设定为例,该系统收集并分析了2012至2016年间上海各基层法院审理的部分盗窃案36 779件,并将盗窃案件分为当场抓获型、重要线索型和网络犯罪型三类,按照不同的证据数量和种类构建了该罪的证据标准指引模型。从案例样本数量来看,虽然该系统已经涵盖了上海市近5年的案例,但以此设定的证据标准仍存在精细化、个别化不足的问题,即不同案件需要的证据种类、证据数量存在差异,即使是同类案件,案情的差别也会导致证据的需求有所变化。

(二)“扩充+优化”案例样本:提升证据标准可靠性的有效途径

司法人工智能必须基于充足的大数据,有数据才有人工智能。人工智能在证据审查中的应用亦是如此,其是典型的从数据挖掘到规律发现的过程,即从海量案例样本中通过算法提炼出隐藏在数据中的规律和知识。只有案例样本充足,才能确保证据审查标准的可靠。提高案例样本充分性不仅应当扩充案例样本数量,还应当优化案例样本质量。

从证据标准设定的案例样本来源和数量来看,当下人工智能分析的案例样本获取主要依托于中国裁判文书网、各法院内部的裁判文书数据库以及科技公司研发的案例检索平台,且各省、市自行研发的司法智能辅助系统通常依托于其法院内部的裁判文书数据库,比如:上海“206系统”中关于盗窃罪的证据标准就是基于2012至2016年间上海各基层法院审理的部分盗窃案。以各省、市法院内部的裁判文书数据库为分析样本,难免会导致证据标准带有“地域化”特征,而此种特征既没有达到实务界对统一证据标准的合理预期,也可能因地域样本不足而引发证据标准设定的隐性偏差。但是若将案例分析样本扩展至全国范围,以提取大范围的共性因素,则可能会导致证据标准因存在较大地域性误差而实用性不足。究其原因,主要在于全国各地经济发展水平和风俗文化存在差异,统一法律适用标准不仅难以做到,而且没有必要。以盗窃罪为例,根据最高人民法院、最高人民检察院《关于办理盗窃刑事案件适用法律若干问题的解释》第1条第2款规定,各省、自治区、直辖市高级人民法院、人民检察院可以根据本地区经济发展情况,考虑社会治安状况,确定本地区盗窃公私财物的具体数额标准。在此规定下,各地司法机关对于盗窃公私财物认定的具体数额标准作出了不同规定,比如:吉林省将盗窃财物价值3万元认定为“数额巨大”,而河南省将盗窃财物价值5万元认定为“数额巨大”。由此,扩充案例样本数量并非意味着将其扩至全国范围,其中案例样本数量阈值的设定,就涉及对统一证据标准之“统一”的理解,应当明确人工智能审查证据的标准统一并不是全国范围的统一,而是以各省级地域为限的统一。各地司法机关应当扩充其地域内的案例样本数量,不仅要关注近期数据,也应当归纳长期数据,使案例样本数量更接近该省、直辖市案例样本的整体完整性。唯有如此,才能挖掘数据多维度信息,降低案例样本间的不均衡,提高人工智能审查证据的拟合度。

目前,我国司法机关作出的判决书说理部分阐述过于简单,大多仅是将据以认定案件事实的证据予以罗列,对于证据审查过程中的关键行为和信息如当事人就某一证据互相质证的过程却疏于记载。这是因为:其一,部分证据的审查并非在庭审中进行。一方面,审判法庭并非证据产生的唯一空间,部分言词类证据可以不通过庭审程序就成为判决的基础。另一方面,部分证据的审查认定并非在庭审中进行,法官可以将庭外收集的证据直接作为判决依据。其二,司法人员的主观因素。在实践中,司法人员出于“言多必失”“职业风险”等顾虑,尤其是社会影响较大的案件,法院裁判文书通常是对案情简要描述后径直作出判决,存在着证据审查不说理、模式化语言替代具体说理以及用简短说理的方式掩盖证据瑕疵等问题。人工智能依赖的程序过程信息不充分,将导致其对于案例样本的分析仅是表象的,而无法实现对证据审查要素的全面提炼、标注和量化。以上海“206系统”为例,虽然该系统将证据规则嵌入其中,直接针对证据的合法性审查,但其当前仅是侧重于证据形式的合法性审查,在实质审查方面还有障碍,其深层次的原因就在于人工智能据以分析的案例样本中证据审查程序信息不足。对此,有效的解决方法即为优化案例样本质量,加强裁判文书中关于证据审查过程的阐述。具体而言,可以从两个方面入手:一方面应当深入推进庭审实质化改革,转变既往过度依赖查阅卷宗材料等证据调查方式,明确证人出庭作证、物证当庭出示等证据调查方式。另一方面应当强调裁判文书中对证据审查过程阐述的实质化,不能仅以“不符合证据标准”“无法形成合理印证”等概括理由直接得出证据审查结果,对证据审查应当实现从“是什么”到“为什么”的转变。需要注意的是,此处加强对证据审查过程的分析和阐述并非要求对证据审查流程的全部记录。由于证据审查通常包括单一证据审查、多个证据印证审查等环节,而每个环节下又包括多重流程,若对每个流程进行记载,则可能会导致裁判文书内容过于繁琐。需要在保障裁判文书中载有证据审查过程的前提下做到繁简得当,以清晰简洁的文字将证据审查的思维过程予以展现。

四、结构转换风险:人工智能审查证据之证据规则结构化转换

随着人工智能技术的持续发展,人工智能已经实现了从符号逻辑计算向机器学习的转变,虽然此种转变提高了人工智能提取、分析数据的能力,但其仍面临着自然语言处理有限的难题,即人工智能仅能对证据规则中的部分语言进行结构化处理,无法实现对证据规则语言的全部转换。对此,应当明确人工智能在证据审查中的适用范围,以应对证据规则无法全部嵌入证据审查模型的困境。

(一)自然语言处理能力有限:证据规则无法完全结构化转换的主要原因

人工智能在证据审查中的应用主要是通过数理逻辑的智能算法,以人工输入、机器学习、大数据技术等将证据规则转换成证据数学模型,从而实现对证据的审查。虽然证据规则在证据审查中发挥着重要作用,但若将证据规则嵌入到人工智能系统中,则需要经过法律语言向结构化语言的转换过程。囿于人工智能的自然语言处理能力不足,故当下无法实现对证据规则的完全转换。

在证据法领域,证据规则指引事实认定者如何进行事实推理,体现了使审判中的事实认定合法化的价值。无论是事实认定准确性的证据规则,抑或是提高效率的证据规则,其通常以“程式化语言+自然语言”的形式表现。虽然证据规则中部分程式化语言可以直接转换成结构化语言,但证据规则的适用并非仅依靠程式化语言的逻辑判断,其同样需要自然语言的建构性解释,即司法人员在运用证据规则审查证据时通常需要将法律规则和价值判断相结合。以非法证据排除规则为例,该规则是证据合法性审查的典型规则,主要是通过对侵犯公民基本权利所取得的证据予以排除,从而避免侦查人员非法取证,保障被调查人基本权利。关于非法证据的认定标准,我国主要采用的是“严重程序违法”标准。根据我国《刑事诉讼法》第56条规定,对于非法言词证据,明确了采用刑讯逼供等非法方法取得的供述应予以排除。对于非法实物证据,明确了程序违法程度达到可能严重影响司法公正程度的才予以排除;若将非法证据排除规则嵌入到人工智能系统中,则应当对《刑事诉讼法》第56条的法律语言进行解构,即将其拆分为程式化语言和自然语言。对于非法言词证据的认定,该条中“刑讯逼供”“暴力、威胁”等应当属于程式化语言,对其可以进行法律标注,以实现法律语言的结构化转换。对于非法实物证据的认定,该条中“法定程序”同样属于程式化语言,对其可以结合书证、物证等实物证据的取证程序要求,比如:扣押笔录上需要有侦查人员的签字、扣押清单应当一式三份、扣押清单上应当写明财物的名称、编号、数量等并依照要求进行法律标注,以实现程式化语言的结构转换。而该条中“严重影响司法公正”则属于自然语言,对于需要达到何种程度才能认定为严重影响司法公正需要司法人员进行综合评价和解释。

因此,由于证据规则中的语言范式包括程式化语言和自然语言,虽然程式化语言可以通过法律标注实现结构化转换,但自然语言需要司法人员的综合评价和解释性建构,其通常难以实现结构化转换,故证据规则难以全部嵌入到证据审查系统中。

(二)明确证据审查范围:解决证据规则结构化转换困境的有效途径

人工智能已经进入到飞速发展阶段,当前多数研究者倾向于人工智能中的深度学习算法,利用多层结构从庞大的数据集中提取特征,以满足需要模式识别的实际任务,或使用其他技术实现类似效果。2022年11月30日美国人工智能实验室Open AI发布了对话式大型语言模型Chat Generative Pre-trained Transformer(简称Chat GPT),作为人工智能技术驱动的自然语言处理工具,Chat GPT主要是采用生成式预训练模型,通过深度学习来生成和训练数据,使用近端策略优化算法的多次迭代来加强训练和自身微调。如今已经发展到第四代GPT-4,其使用的自回归语言模型优于之前GPT-3和GPT-3.5的模型,在法律检索、处理法律文本、辅助司法裁判等领域中的应用效果更佳。在证据审查领域,虽然GPT-4的出现能够提高既有证据审查模型的自然语言识别处理能力,但其仍不具备将证据规则下自然语言完全结构化转换的能力。

证据审查既包括证据能力审查也包括证明力审查。从证据规则结构体系来看,证据能力与证明力的结构属性体现了事实认定的程序结构进程,即对证据的审查应当先判断其是否具有证据能力,再判断其证明力大小。在人工智能审查证据领域,其对证据能力的审查通常是从证据的合法性入手,其中最典型的证据规则是非法证据排除规则。虽然实践中部分司法机关将证据的合法性审查要素嵌入到人工智能辅助办案系统中,但人工智能对于单一证据的合法性审查仍存在局限之处,即其仅能对证据形式合法性进行审查,比如:讯问笔录是否有签字捺印、提取的电子数据是否附有清单说明相关数据的类别和格式等。究其原因,主要在于证据合法性审查之非法证据排除规则中存在着需要解释性建构的自然语言。

与证据能力相比,证明力的审查更为复杂,主要原因是证据能力一般实行法定主义,其存在一般法律推理的前提和结构;而证明力判断基本上是一个事实判断问题。关于证明力,其是指证据对待证事实的证明作用及程度大小,主要包括真实性和相关性两个因素。就证据的真实性而言,其主要包括证据载体的真实性和证据事实的真实性,关于证据载体的真实性,其主要是指证据来源真实、证据保管链条完整等表现形式真实,最典型的证据规则是实物证据鉴真规则,对其审查主要是通过证据收集的法定形式要件、保管链条完整性检验等方式,其中电子数据也可以通过完整性校验、可信时间戳、区块链存证等技术方法进行鉴真。证据载体的真实性审查属于对实物证据的证据能力审查,证据证明力审查主要指向证据事实的真实性。关于证据事实的真实性,其主要是指证据所记录或反映的事实是真实可信的,最典型的证据规则是印证规则,若要保障一项证据的真实性,就需要使其包含的事实信息得到其他证据的印证。具体至人工智能领域,人工智能可以通过算法模型对办案人员录入的证据材料之间是否存在交叉重合或矛盾进行审查。比如:办案人员录入了两份材料,其中A材料是证人陈述被告人出现在案发现场的事实,B材料是侦查机关的勘验笔录,其中记载了被告人在犯罪现场留下了指纹,此时人工智能通过对比即可认定材料A与材料B所指向的内容存在重合,两份证据材料之间形成印证。就证据的相关性而言,其主要包括法律上的相关性和逻辑上的相关性,前者是指证据所证明的事实与案件具有一定联系,后者是指证据的存在使某一事实的成立可能性更大或更小。虽然人工智能可以通过对海量案例样本的归纳学习,提炼出侦破某一案件所需要的证据种类和数量,对办案人员输入的证据材料进行筛选,实现对证据与案件事实之间的法律相关性审查。但是,人工智能算法统计的相关性并不代表因果关联,即使其通过推演所得数值的准确性和召回率很高,也无法确保证据与案件事实相关。究其原因,主要在于证据逻辑上的相关性通常包括证据所包含的信息量多少以及与案件主要事实的关系,需要司法人员结合经验法则进行主观判断和评价。由于司法人员的日常经验难以进行结构化转换,故当前人工智能无法对证据逻辑上的相关性进行审查。

因此,无论是证据能力审查抑或证明力审查,当下都面临着无法将证据规则中需要主观解释或评价的自然语言进行结构化转换的困难。对此,除了可以在技术层面提高人工智能自然语言转换能力外,还可以在法律层面明确人工智能审查证据的范围。在证据能力上,应当明确人工智能可以对证据的形式合法性进行审查;在证明力上,应当明确人工智能可以对证据的事实真实性和法律相关性进行审查。

五、正当程序风险:人工智能审查证据之程序可视正义

在证据审查领域,无论是证据标准的设定,还是证据规则的结构化嵌入,人工智能并非仅依靠海量裁判文书完成,其通常需要算法助力,通过算法来认识、学习并分析数据之间的匹配度。虽然人工智能提高了证据审查的实效性,但人工智能审查证据的过程几乎完全处于封闭状态,其原始代码或演算程式无法被当事人所感知,当事人仅能得到证据是否齐全、证据形式是否符合法律要求等结论,而无法对证据审查过程进行查阅,这将导致当事人缺乏对证据审查程序的正义感知。对此,应当加强对人工智能审查证据结果的说理论证,以弥合证据审查程序“可视正义”的匮乏。

(一)算法可解释性不足:证据审查程序“可视正义”匮乏的主要原因

司法程序不仅要公正、合理,而且要保障诉讼参与者有充分机会参与法庭审理程序,确保司法程序的全程透明。证据审查作为司法程序中的重要环节,其更应当注重对当事人程序参与权的保障。在人工智能审查证据领域,当下司法机关普遍面临着算法可解释性不足的困扰,其将阻碍证据审查程序“可视正义”的实现,引发当事人对人工智能审查证据结果的不信任。关于算法可解释性不足的形成原因,一方面是科技公司出于商业利益考量不愿公开算法,另一方面是当事人专业知识不足无法理解算法。

从商业利益层面来看,算法公开会对参与开发设计司法人工智能的相关科技公司利益产生消极影响。当下,司法智能辅助系统并非由司法机关独立研发,大多是其与第三方科技公司合作完成。比如:上海“206系统”是上海高级人民法院与科大讯飞公司联合研发。贵州省“刑事案件智能辅助办案系统”是贵州省委政法委与科大讯飞公司联合研发。对于研发算法的科技公司而言,与其他企业一样,都是以商业利益为根本追求,必须考虑算法研发过程中投入的成本与取得的经济收益之间的关系,由于算法的源代码和演算程式属于商业秘密,若司法机关要求科技公司公开其源代码和演算程式,则可能会引发同行不正当竞争,不仅对科技公司的商业利益带来损害,而且会影响科技公司研发司法人工智能的积极性,故算法不对外公开具有合理性。

从专业知识层面来看,其主要是由于人工智能审查证据的本质是科学技术和法律知识的融合,虽然当事人可能了解法律知识,但对人工智能技术普遍较为匮乏,而人工智能系统的编写程序和算法极为复杂,即使技术人员公开了人工智能中的源代码,当事人也不一定对其有所了解。程序参与是程序正义的基本要素,其要求当事人都有参与法庭审判的机会,法庭至少保证他们有提出有利于自己的证据、主张并对不利于自己的证据和意见进行质证和反驳的机会,应当保障当事人有实质参与证据审查的过程,确保证据审查的程序正义。从应然层面出发,司法人员在运用人工智能审查证据时,应当向当事人披露人工智能系统所使用的资料、算法代码、演算程式等,否则就存在侵犯当事人的程序参与权之嫌。然而,即使司法人员将人工智能系统中的算法代码、演算程式等向当事人展示说明,打开了“算法黑箱”,也并不意味着其保障了当事人程序参与权。虽然证据审查程序公开可以提高当事人信任感,但此种信任应当建立在当事人“形式感知+实质理解”之上。由于知识壁垒的客观存在,以算法公开破解“黑箱”难题仅能实现当事人对人工智能审查证据过程的形式感知,而无法保障其实质参与。

(二)加强证据审查结果的论证:提升程序“可视正义”的有效途径

在人工智能审查证据领域,算法可解释性不足会引发当事人对证据审查过程正当性不足的隐忧。算法公开通常被视为解决此问题最直接、有效的方式,应当通过推动科技企业开源算法以实现算法的公开。虽然算法公开不仅在技术上可行,而且在法律上也可充分保障当事人的程序参与权以及其他诉讼权利,但是上述优势仅是应然层面下的理想状态,从实然层面出发,算法公开也面临着诸多难题。一方面,科技公司基于商业利益不愿公开算法;另一方面,知识壁垒使算法公开的目的落空。即使算法公开在技术上可行,但非技术人员对于算法中的代码、演算程式等并不了解,算法公开所要实现的当事人了解人工智能审查证据过程之目的也并未实现。由此,算法公开仅能实现人工智能审查证据的形式可视,并未解决当事人对于人工智能审查证据的实质参与。

算法公开并不等同于算法知悉。在司法程序中,当事人对司法过程的参与不够,将会导致其缺乏对司法裁判的信任,进而影响法律的公信力。具体至证据审查领域,当事人通常希望能够实质参与证据审查的过程,从而影响证据审查的结果,而人工智能审查证据程序不透明将会阻碍当事人对证据审查程序的正义感知。实际上,由于当事人专业知识的匮乏,故其实质追求的应当是证据审查结果是否准确、能否接受。对此,在法律层面,应当加强司法人员对证据审查结果的说理论证。需要注意的是,此处对证据审查结果的说理论证是针对证据审查结果的准确性和可靠性,主要包括:量化证据标准设定所依据的案例样本数量、案例样本与本案的相似度、司法人员采纳/拒绝证据的依据等。在技术层面,作为证据审查方式的技术性变革,只有具备相关技术知识才能实现对证据审查结果的有效质证,而当事人技术知识不足必然会对其质证效果产生消极影响。在刑事诉讼中,控诉方与被追诉方之间存在天然失衡的状态,控诉方可以借助于其背后的技术部门或团队,更容易让法院采信其提交的证据,而被告人及其辩护人则可能因缺乏专业知识而无法展开有效质证,进而影响证据审查认定的效果。未来可以考虑将专家辅助人制度引入到人工智能审查证据领域,赋予当事人申请有专门知识的人出庭的权利,将人工智能审查证据中的技术问题交由专业人员审查认定。

因此,算法公开仅是以技术可视来实现当事人对程序正义的形式化感知,其并未破除算法可解释性不足的枷锁。为了实现当事人对证据审查结果的实质认同,应当加强司法人员对人工智能审查证据结果的说理论证,对作出证据审查结果的主要依据予以阐释,对于人工智能审查证据中的专业问题还可以申请技术领域专家进行质证。

伴随着人工智能热潮的涌来,当下各地司法机关积极探索将人工智能在司法领域中深度应用,以期提高司法能力和诉讼效率,实现传统诉讼活动的技术性变革。在证据审查领域,虽然人工智能能够提高证据的审查效率,最大程度实现“类案证据,相同审查”,但其在实践中仍面临着证据标准设定可靠性不足、证据规则结构化转换困难、算法可解释性较差等问题。要充分释放人工智能在证据审查领域中的智慧红利,不应将目光仅局限在人工智能的技术优势,还应当对其在证据审查中存在的问题予以审视。从工具理性的角度出发,明确人工智能在证据审查中的辅助地位,同时提高案例样本的充分性、明确人工智能在证据审查中的适用范围和加强司法人员对证据审查结果的说理论证。

本文载于《吉林大学社会科学学报》2024年第3期，注释从略，请参阅原文。

谢登科周鸿飞：司法人工智能在证据审查中的功能定位与风险规制

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏

谢登科 周鸿飞：司法人工智能在证据审查中的功能定位与风险规制

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏

谢登科周鸿飞：司法人工智能在证据审查中的功能定位与风险规制