周翔：逮捕审查判断中犯罪嫌疑人社会危险性的量化评估

内容提要：通过对2020年以来13万余份起诉书和不起诉书的机器学习，研究发现：我国司法人员在判断羁押必要性时，会评估犯罪嫌疑人的社会危险性，但相应评估侧重于罪行危险性因素，却忽略了人身危险性因素；引入量化评估方法，主要有利于改善仅依靠基本案情信息难以准确判断是否需要羁押的“复杂”案件的羁押必要性判断，量化方法有可能显著降低此类案件的羁押率。当前在判断羁押必要性时，办案人员主要依靠罪行危险性因素的主观综合判断，规范改革路径着力于规则细化和要件重构，但这无力化解社会危险性判断信息不足的问题。引入大数据建模方法，有助于系统统合零散的社会危险性判断信息。此外，可通过问卷、量表、数字化设备等方式扩充模型的训练数据，通过深化对社会危险性发生机制的理解，区分案由和社会危险性类型，构建多个子模型，以进一步提升量化工具的准确性。

关键词：逮捕；社会危险性；量化评估；羁押必要性审查

引言

我国学界和实务界在羁押必要性审查的改革方向上已初步形成共识，即应当加强对犯罪嫌疑人社会危险性要件的审查，以降低羁押率。纵览国内已有做法，加强对社会危险性要件的审查主要有规范和实证两条路径。前者是不断细化适用羁押措施和非羁押措施的情形，并加强对社会危险性要件的阐释和要件关系重构。后者则采取定性和定量的方法，对犯罪嫌疑人的社会危险性作出相对实证的评估，以期提高审查的客观性。从实践情况看，各地也已经在加强社会危险性的量化评估工作。

虽然国内已提出多套量化评估方法和工具，并在北京、江苏无锡、江西萍乡、四川乐山等地的检察机关有所试验，但是，对这些方法和工具的质量以及降低羁押率的效果，目前尚未有文献作过实证分析。造成这类缺失的主要原因是，传统基于统计学的方法缺乏用于测量实践中社会危险性评估的现状、依据以及加强量化评估方法的效果的显性指标。以机器学习为代表的人工智能技术的兴起，为该领域的实证研究提供了新的发展契机。有鉴于此，本文利用算法和性能衡量等方法，对社会危险性要件的司法适用状况、评估依据和效果等，进行了相对系统的实证检验。本研究旨在分析，如果采取此种量化评估方法，其一，会对强制措施的类型判断产生何种实质性影响；其二，与规范改革路径相比，量化方法有何种优势；其三，如何实现两种路径的兼容。

一、研究假设和研究设计

（一）研究假设

1.研究假设一

值得验证的首要问题是，在我国当前的司法实践中，进行羁押判断时是否已经考虑了犯罪嫌疑人的社会危险性。虽然近年来开始强调社会危险性要件的审查，但该规范要求是否落实到了司法实践，在不同案件类型、地区落实的效果是否存在差异等，均缺乏实证检验。

由此提出假设一：在我国的司法实践中，羁押判断已经考虑了犯罪嫌疑人的社会危险性。如果实证检验发现，在案件基本事实、罪名等基础信息之外引入社会危险性评估信息，能够提升模型对现实中羁押判断过程的还原度，则说明假设一基本成立，即在我国的司法实践中，目前的羁押判断已经考虑了社会危险性的有关因素。

2.研究假设二

既有文献批判了一种社会危险性评估理念和方法，即把罪行危险性和社会危险性相等同，忽略了以“一贯表现”为代表的人身危险性评价。若司法实践中果真存在重罪行危险性、轻人身危险性的现象，这是一种社会危险性评价的偏废，一定程度上说明社会危险性评估方法在科学性方面有待提升。本文借鉴该分类法，提出侧重于罪行危险性因素和侧重于人身危险性因素的两类评估。罪行危险性因素衡量的是案件本身的性质和严重程度，包括案件类型、情节和轻重等方面；人身危险性因素衡量的是犯罪嫌疑人的特征，包括社会属性、案后表现等方面。

由此提出假设二：在我国司法实践中，当前主要根据罪行危险性因素而不是人身危险性因素来判断社会危险性。如果实证检验发现，罪行危险性相关因素构造的模型能够更好地拟合社会危险性值，则说明假设二基本成立，即当前的司法实践更加偏向于采用罪行危险性因素进行社会危险性判断。

3.研究假设三

本研究还希望探讨引入社会危险性量化评估对整体羁押率的影响，即引入量化评估方法能否真正合理地降低整体羁押率。基于前期的研究成果和认知，笔者认为，社会危险性的量化评估主要作用于“复杂”案件，主要影响这部分案件犯罪嫌疑人是否羁押的判断结论。引入社会危险性量化评估工具，能够控制乃至降低的应当是这部分案件的羁押率。2018年刑事诉讼法第81条第3款、2023年《人民检察院、公安机关羁押必要性审查、评估工作规定》第17条、第18条，明确规定了应当予以逮捕的情形和不予羁押的情形，这些案件属于本研究所称的“简单”案件。剩余案件，即在适用相关规定时存在较大裁量空间的案件，就是本研究所称的“复杂”案件。有研究主张，我国应当参考审判程序的繁简分流改革，推定大多数轻罪案件犯罪嫌疑人妨碍诉讼的社会危险性较低，而把社会危险性调查集中于重罪案件。本研究有理由相信，社会危险性量化评估方法和工具的引入，如果有助于改善整体的羁押状况，也主要作用于“复杂”案件。

由此提出假设三：社会危险性量化评估的引入，将降低部分难于判断的“复杂”案件的羁押率。为检验这一假设，本研究首先定义和识别出“复杂”案件，并以“复杂”案件的实际羁押情况作为现状的对照组，以社会危险性量化评估信息为输入的模型所预测的羁押情况是预测的实验组。比较实验组的羁押率和对照组的羁押率之后，如果发现加入社会危险性量化评估信息之后的案件适用羁押措施的比例下降，则说明假设三成立，即社会危险性的量化评估有助于改善整体的羁押状况。

（二）变量设置

本研究的目的是检验哪些因素会影响司法人员的社会危险性评估，社会危险性评估能否影响犯罪嫌疑人的羁押状态。故而，变量的设置包括确定社会危险性评估的量化方法、量化结果所依据的影响因素、司法实践的羁押判断结果等三个方面。

1.社会危险性值的测量方法

国内既有的社会危险性量化评估方法设置了不同的社会危险性评估体系。高通在轻罪领域提出了五分法，张吉喜采取的也是五分法，而杨秀莉等人采取的是四分法，王贞会采取的是三分法。造成这些差异的原因可能是：（1）采集的数据语料不同，从而关注视角有差异。比如，张吉喜的研究主要关注取保后重新犯罪、有逃跑风险的风险细分类型。（2）得到指标的方式不同。比如，杨秀莉等人主要采取梳理、归纳业务经验的方式，其他人则是从具有显著相关性的变量中挖掘有价值的指标。

关键是如何实现以上多种因素的综合评价，即把以上指标合并进社会危险性的单一指标中。在国内开展社会危险性评估工作的困难在于，我国司法办案部门并未过多开示社会危险性的评估过程，也未全面记录社会危险性的评估结果。本研究通过归纳“集体经验做法”来实现变量的可操作化。在社会科学的量化研究中有一种“去量纲化操作”的方法，近年来该方法被引入法学研究，比如用于测量妨害公务罪的严重程度。本研究采取类似的去量纲化处理方法，实现了社会危险性评估的可量化操作。

限于检察机关对逮捕和不予逮捕的理由说理不足和公开程度不够，本研究只能采用不批准逮捕理由说明书中的“无社会危险性”理由信息作为“集体经验”的来源，将其中不予逮捕的理由按照降序排列，以理由出现的频次作为社会危险性计算公式的变量和权重依据。为此，共收集并获得154份不批准逮捕理由说明书。对这些文书所使用的理由进行提取，共涉及30个相关变量，并对这些变量依据在总体文书中被提及的次数占比进行降序排列。本研究认为，某个不批准逮捕的因素被提及的次数越多，该因素在社会危险性判断中就越发重要，该因素对应的权重也应当越大。同时，当数据具有不同的量纲和范围时，直接进行比较可能会产生误导，因此将数据归一化到相同的比例范围，可以确保数据之间的比较更加准确和可靠。本研究将对应的频次进行百分比归一化处理后，作为模型的权重系数。计算公式中的X根据案情进行赋值，例如当犯罪嫌疑人自动投案时，“自动投案”项X=0；犯罪嫌疑人未自动投案时，X=1。

表1 社会危险性评估的集体经验和影响因素权重计算

图片

据此拟合出社会危险性值的测量公式：

Y=(0.127×图片)+(0.109×图片)+(0.101×图片)+(0.091×图片)+(0.089×图片)+(0.072×图片)+(0.070×图片)+(0.064×图片)+(0.058×图片)(0.042×图片)+(0.036×图片)+(0.020×图片)…+(0.002×图片)

基于以上公式，本研究对13万余个案件的数据库进行了社会危险性的数值测量。

2.社会危险性的影响因素

为发现司法实践中社会危险性评估的实然机制，必须对影响社会危险性的因素进行大规模样本测量。在测量前，首先要定义可能影响社会危险性的因素，并构造出影响因素的指标体系。研究假设二的主要目标是实证分析司法实践中社会危险性评估的有关机制，进而确定在当前的社会危险性评估中主要依据的信息类型。对于社会危险性评估的依据，既有文献给出了不同的分类法，包括但不限于以下几类：人身危险性、社会危害性、诉讼可控性的三分类法；犯罪情况、嫌疑人个人情况、罪后情况、被害人情况的四分类法；犯罪嫌疑人自然情况、反映人身危险性、反映犯罪行为社会危害程度、反映妨碍刑事诉讼顺利进行可能性、反映人道主义考虑的五分类法；犯罪嫌疑人基本情况、违法犯罪史、犯罪行为、犯罪后表现的四分类法。这些分类方法为本研究构造分类指标体系提供了指引。

如前所述，本研究采取二分类法，将判断社会危险性的罪行危险性和人身危险性两大类因素分为四小类，把犯罪类型、行为和情节归入罪行危险性因素，把犯罪嫌疑人人口信息、妨碍诉讼的可能性和诉讼可控性等归入人身危险性因素。本研究共提取了案件的以上因素共计30项。罪行危险性因素一共11项，其中“法益侵害”信息9项，包括情节轻微，从犯，金额较少，是否为家庭邻里纠纷，被害人过错，犯罪未遂，未造成损失，证据是否足以认定，是否可能被判处管制、拘役、缓刑；“法益修复”信息2项，包括被害人谅解、积极赔偿。人身危险性因素一共19项，其中“人口学”信息12项，包括有无前科、偶犯、本地固定住所、无业、企业家、吸毒史、一贯表现良好、限制刑事责任能力人、户籍所在地是否一致、严重疾病、家庭困难、性别；“案后表现”信息7项，包括如实供述、认罪认罚、悔罪表现较好、自动投案、立功、退缴赃物、抗拒抓捕。两大类四小类的分类法，对前述三分法、四分法和五分法作了一定的合并处理，但依然遵循了过去的习惯，比如社会危险性的典型三分法——犯罪性质、罪后表现和犯罪嫌疑人自身情况，本研究的罪行危险性因素等同于第一类，人身危险性因素等同于第二、三类，且基本对应人身危险性因素的两个子类型。

3.社会危险性的用途指标

本研究特别关注的是，社会危险性量化评估的直接效果——决定是否对犯罪嫌疑人予以羁押。本研究主要的社会危险性用途指标，是针对犯罪嫌疑人采取“逮捕”或者“取保候审”的强制措施类型。

为了更全面反映司法实践审查强制措施的状况，本研究采用起诉书、不起诉书等审查起诉阶段文书，测量社会危险性评估对强制措施审查的影响。这类文书能够更客观地反映强制措施的类型分布，如果采用判决书，则可能遗漏部分不起诉案件，从而低估取保候审的适用比例。本研究收集了B区、Z区、G区、Y区等四个地区2020年1月1日至2021年12月31日间的全库不包含未成年犯罪嫌疑人的起诉书和不起诉书，经数据清洗后共计132645份。

（三）分析方法

为了加强数据分析结论的丰富性和研究假设的检验，本研究还引入主题模型的算法，以分析不同社会危险性值之下的案件特征；引入LSTM深度学习的算法，实现了可直接采用文本作为模型的输入格式。为验证研究假设，并能够更好地从数据层面分析、揭示司法实践中的羁押判断过程和结果，本研究并行采用两种衡量模型还原能力的方法。

方法一：统计学的图片评价方法。本研究的主要变量为“社会危险性值”，这是一个连续数值变量，本研究构建了多元线性回归模型并以图片指标说明自变量的影响程度。图片，也称决定系数（coefficient of determination），是用来评估一个回归模型的拟合优度的指标。它的取值范围在0到1之间，越接近1表示模型的拟合效果越好。在统计学中，图片是一种常用的评估回归模型拟合优度的指标。

方法二：计算机科学通用的F1评价方法。F1值是精确率和召回率的调和平均数，其取值范围在0到1之间，数值越大，模型性能越好。通俗地说，该数值越高，意味着所构造的模型越是接近（拟合）训练数据背后的人类判断经验。机器学习的方法还有一些特别的优势，比如可以用非结构化的语料作为输入；数据集分为训练集和测试集，用训练集拟合模型，在测试集中进行测试。以上两点，改变了过去以统计学为基础的定量实证研究。

虽然本研究引入了机器学习中通用且成熟的评价方法，并且和统计学检验方法进行比较，但后文采用的分析方法，通俗地说，是在遵循“量化模型是一种对人类判断集体经验的反映”的假设的基础上，采用集体经验构造并测量社会危险性值，在13万余个案件样本中对我国的羁押审查判断是否已经开展社会危险性评估、评估所依据的因素指标、引入量化评估工具对羁押率的影响等三个方面进行评价。

二、社会危险性量化评估的依据和效果

（一）社会危险性值的测量结果

本研究分析了社会危险性值的测量结果，首先根据社会危险性值的高低进行分组，将13万余份样本按0.3、0.7的阈值分为高于0.7的高风险组、介于0.3与0.7之间的中风险组、低于0.3的低风险组，一共三组。接着通过主题模型、词云等方法，构造“社会危险性值区分度”的新指标。分析发现，不同等级的社会危险性值集中于不同的案件类型，不同案件类型表现出的社会危险性值分布集中度差异较大。

1.依社会危险性值等级的分组情况

本研究对主题模型的分类结果进行合并和命名后，观察到不同社会危险性程度的组内情况差异。低风险组中，主要的案件类型为危险驾驶、故意伤害和盗窃。从地区间的差异看，G区的案件集中于危险驾驶（占比80%，高于总体的47.5%），盗窃案件的社会危险性评价则相对严苛（占比0%，没有被评价为低社会危险性的案件）；与之相反，Y区对盗窃案件犯罪嫌疑人的社会危险性评价相对比较宽容（占比11.7%，在各地区中最高）。

表2 低风险组的案件类型

图片

再看中风险组的社会危险性值测量结果。前三位是危险驾驶、盗窃、赌博。与低风险组比较，危险驾驶案件虽然横跨低、中两组，但呈现出占比下降的趋势，在各地区间则有占比15.6%—43.4%的较大波动；盗窃跃升至第二位，占比呈现上升趋势，而且盗窃的财物价值更高；赌博进入了高频罪名的序列，主要分布于G区；B区占比第三位的仍然是故意伤害。

表3 中风险组的案件类型

图片

最后看高风险组的情况。高频案件类型变为盗窃、毒品犯罪（包括贩卖、运输毒品等）、诈骗。从案件类型看，毒品犯罪和诈骗是低、中风险组中未见到的。高频案件类型在各地区间的分布存在差异，比如盗窃案件在B区占比最高，毒品犯罪案件在Y区占比最高。

表4 高风险组的案件类型

图片

从组间的案件类型分布情况看，高频案件类型的覆盖率不一。低风险组的分布最集中，覆盖案件类型的八成；中风险组的分布相对较为分散，主要为危险驾驶，盗窃和赌博的覆盖率不足六成；高风险组的案件类型分布，集中度介于低风险组与中风险组之间。

2.依罪名的分组情况

为进一步说明社会危险性测量结果的分布情况，可切换至“罪名”的视角分析社会危险性与犯罪行为之间的联系。本研究认为，只有案件基于社会危险性值归入高风险、低风险两组，才可能给司法人员提供充分的参考价值——归入高风险组，即可作出予以羁押的判断；归入低风险组，即可作出不予羁押的判断。为此，本研究设计了一个特别指标——社会危险性值区分度，用于衡量社会危险性量化评估方法在不同案件类型中对社会危险性的区分度。计算公式为：社会危险性值区分度=（低风险组的案件数+高风险组的案件数）/中风险组的案件数。本研究计算了高频罪名的社会危险性值区分度，结果发现，区分度较高的罪名有偷越国（边）境罪、盗窃罪、贩卖毒品罪等，区分度不足的罪名有危险驾驶罪、妨害作证罪、开设赌场罪等。

表5 不同罪名的社会危险性值区分度

图片

从罪名间分布情况看，社会危险性值的分布区间存在较大差异。一些罪名的社会危险性值测量结果处于中间地带的较多，一些罪名则分布于社会危险性值的高、低两极。本研究认为，社会危险性的量化评估方法对羁押判断的贡献，重点在于后者，即社会危险性值区分度高的案件类型。社会危险性量化评估的结果若要给予司法人员足够清晰的指引，社会危险性值要么足够高、要么足够低，如此办案人才有充足理由作出予以羁押或者不予羁押的判断。从给出的罪名间社会危险性值区分度的排序看，盗窃罪、贩卖毒品罪、寻衅滋事罪等案件的犯罪嫌疑人，其社会危险性值要么处于高区间、要么处于低区间，能够给予司法人员更加明确的信号。相对而言，对于危险驾驶罪、交通肇事罪等罪名，社会危险性的量化评估则并非必要或者并不是有效的。反之，就提升社会危险性量化评估的科学性而言，重点应当放在社会危险性值区分度不够高的罪名。

（二）社会危险性要件的司法适用状况

本部分实验，利用机器学习的方法还原了当下的羁押判断方式，用于检验当前实践是否实际考虑了社会危险性要件。本研究默认在缺乏社会危险性要件审查的情况下，亦能进行强制措施审查；单纯依靠案件基本事实作出的强制措施类型判断，不一定全面反映司法现状；缺乏精确的量化评估也不代表司法实践没有考虑社会危险性要件。本部分的对照实验，可以说明单纯依靠案件基本事实、罪名等基础信息，无法全面还原司法实践进行羁押判断的现实情况，而社会危险性评估信息是一种有助于还原羁押判断现实情况的增益性信息。

1.单纯依靠案件事实信息难以还原羁押判断的现实情况

本部分实验对单纯依靠案件事实信息能否完全拟合司法实践的羁押判断现状以及发生判断错误的原因展开检验。本研究分析了单纯依靠案件事实信息发生判断错误的案件规律，通过构建以“案件事实段”为输入、“是否羁押”为输出的模型，并比较模型预测的判断结果和实际的判断结果，从而筛选出模型“预测错误”的案件子集。

从表6可以看出，单纯依靠案件的基本事实预测羁押状态的F1值约为0.83，不能较好地预测实际的羁押判断。进一步分析预测错误案件的要素特征，可以发现如实供述、情节严重程度、认罪认罚、前科等指标偏高，预测错误案件在以上方面呈现出共性。

表6 单纯依靠案件事实信息错误预测羁押状态的案件特征

图片

2.社会危险性评估信息有助于还原实际的羁押判断

本研究检验司法实践进行羁押判断是否考虑了社会危险性有关信息的方式是，比较有无社会危险性评估信息的前后，模型对司法实践判断羁押状态的还原度是否存在差异。如果单纯依靠案件事实信息，模型未能较好地拟合司法实践进行羁押判断的现状，就说明实际的羁押判断还考量了案件事实以外的其他信息；加入社会危险性评估信息之后，如果模型的预测性能变得更优异，则说明社会危险性评估信息对于还原司法实践的羁押判断而言是一种增益性信息。

本研究的分析结论认为，加入社会危险性值作为模型的输入，有助于强化模型还原真实司法决策场景的能力。实验表明，与单独以案件事实信息作为输入相比，添加罪名信息能够提高模型预测强制措施类型的能力；继续添加社会危险性值之后，模型的性能进一步提升。单纯依靠案件事实信息的模型表现为F1值0.83，说明未能完全还原司法现状。实验组模型较之对照组，性能分别提升了5%和3%；分地区看，提升幅度从0%到6%不等。

在默认“数据模型是对人类决策过程的拟合”这一前提下，模型性能越好，说明数据模型的还原能力越强。数据上体现为，在加入社会危险性有关信息之后，模型对实践中羁押必要性审查方式的还原程度更高。

表7 不同输入项的模型对羁押判断的还原度

图片

值得特别说明的是，本实验仅能说明社会危险性评估信息有助于还原司法实践的羁押判断现状，以上实证结果证明了研究假设一成立的可能性，即从“模型是对实然审查模式的反映，社会危险性因素的加入提升了模型的性能”这一点看，司法实践在进行羁押判断时的确考虑了社会危险性，只是不一定采用严格的量化方法，在不同罪名间采用的方法也有所不同。实践中对社会危险性是予以量化评估，还是停留于主观判断，评估所依据的具体因素如何，地区间存在的量化方式和量化程度上的差异等，均有待后续的定量检验。

（三）社会危险性的司法判断依据

本部分实验把社会危险性值作为因变量，研究在羁押判断中司法实践如何确定犯罪嫌疑人的社会危险性。本研究首先默认通过前述无量纲化处理得到的公式，是对社会危险性判断集体经验的恰当反映，在此基础上实验对13万余个案件构成的数据库进行社会危险性数值测量，并提取可能影响社会危险性判断的因素，最后对社会危险性判断的内在机制予以分析。本研究分别采取统计学的图片值、机器学习的F1值两种衡量方法，对“究竟是人身危险性因素还是罪行危险性因素对社会危险性的判断影响更大”的研究假设二进行检验。

1.统计学方法的检验

统计学方法的检验结果表明，司法实践在评估社会危险性时更加倚重罪行危险性因素。本研究采用所提取的30个因素作为自变量、以社会危险性值作为因变量，多元线性回归模型中图片=1，说明以上指标能够较好地拟合社会危险性的判断模型，侧面验证了采取“频次法”赋值社会危险性和提取影响因素具有合理性。进一步分析发现，罪行危险性因素组的图片大于人身危险性因素组的图片，从而初步检验了研究假设二：当前的司法实践依然十分倚重案件情节的严重程度、案后是否积极退赃退赔、是否取得被害人谅解等罪行危险性因素，对社会危险性作出评价。

表8 罪行危险性和人身危险性对社会危险性评估的影响权重图片比较

图片

2.机器学习方法的检验

深度学习的建模和衡量方法亦表明，罪行危险性因素的作用更加显著。实验采用LSTM的深度学习算法，分别采用当事人信息段、基本事实信息段作为模型的输入，测试哪一类信息能更好地预测社会危险性值。实验结果表明，“基本事实段”信息作为输入的模型，预测社会危险性值的效果更好。考虑到采用文本信息作为模型的输入，较之采用结构化要素作为输入，所遗漏的信息更少，该结果可加强“当前的社会危险性判断更加依赖罪行危险性因素”的判断的可信度。

表9 罪行危险性和人身危险性对社会危险性评估的影响权重F1比较

图片

（四）引入量化评估工具对羁押率的影响

本部分实验把社会危险性值作为自变量，主要检验引入量化评估工具对整体羁押率的影响。根据既有的认识，社会危险性的量化评估主要作用于“复杂”案件。本部分实验希望检验，与单纯依赖案件事实信息进行强制措施类型判断的审查相比，使用考虑了社会危险性评估信息的模型预测强制措施类型，案件的整体羁押率能否得到控制。本部分采用两种方式定义“复杂”案件：其一，在采用“基本案情信息”预测强制措施类型时，模型预测的结果与实际结果不一致的案件（以下称“预测错误案件”）；其二，在采用“基本案情信息”预测强制措施类型时，模型预测的结果不能明确地归于某一种强制措施类型的案件（以下称“预测困难案件”）。

1.预测错误案件

本研究在控制使用同一最优模型（GBDT梯度提升决策树）的条件下，首先用“案件事实+罪名”作为输入信息预测羁押判断结果，把其中53801个预测错误案件作为本部分的研究对象。对于这部分案件，有理由认为，单纯用案件事实和罪名来判断是否羁押是不够的，笔者将对比通过“案件事实+罪名+社会危险性值”预测的羁押率和实际的羁押率。

对比结果表明，把社会危险性值作为输入信息后，模型预测的整体羁押率为45%，而同样测试集中的实际羁押率约为81%。从分析结论看，在“复杂”案件中引入社会危险性量化评估，也许有助于得出“非羁押”的结论，从而初步验证研究假设三。

表10 预测错误案件中引入社会危险性值的羁押率变化情况

图片

2.预测困难案件

本研究以深度学习LSTM算法，将“基本事实段”文本信息作为模型的输入进行羁押判断。每个案件的预测结果是从0到1的连续变量，算法一般默认0.5为二分标签的阈值，本场景中“0.5以下”判定为“非羁押”，“0.5以上”判定为“羁押”。从科学性的角度看，判断值临界于0.5附近的案件其实属于“预测困难”的情形。因此，本研究把预测结果介于0.45—0.55的案件定义为“复杂”案件，共计筛选出4152件。笔者将这部分案件作为测试对象，对比通过“案件事实+罪名+社会危险性值”预测的羁押率和实际的羁押率。

对比结果再次表明，研究假设三成立，即具备社会危险性评估信息之后，能够有助于得出“非羁押”的结论。这体现为整体的羁押率得到了控制，机器预测的羁押率为40%，比实际羁押率低14个百分点。

表11 预测困难案件中引入社会危险性值的羁押率变化情况

图片

本部分提供的实证数据，为引入社会危险性量化评估提供了一定指引。一方面验证了既有理论和实践的一些认识，另一方面证实了“逮捕必要性要件是抑制逮捕适用的关键”，“将社会危险性条件视为适用逮捕的核心要件”等改革建议具有一定的合理性。

三、社会危险性审查的实践模式和改革路径

前文实证研究聚焦于司法实践中羁押判断的现状和依据，并对加强量化评估以控制案件羁押率的前景作了初步评估。基于以上分析结论，本部分从理论角度总结现有的社会危险性审查模式，反思当前做法的形成背景及局限，进而评析当前的主流改革路径。

（一）实践中社会危险性的审查模式

关于强制措施类型在司法实践中的审查判断方式，有不少学术归纳，包括对“构罪即捕”“以捕代侦”等现象的概念提炼和局限性批判，并且试图在刑事程序的更大视域内考察逮捕的审查方式及功能。这些基于经验主义的逮捕审查模式归纳，有助于理解逮捕审查判断的实然运转方式。本研究在此基础上，基于实证分析的发现以及针对检察机关一线办案人员的访谈，拟进一步总结归纳社会危险性要件的审查方式。笔者发现，当前针对社会危险性要件的审查，司法机关遵循“繁简分流”、后置于其他要件的审查模式，大致依照如下步骤。

第一步：先审查“证据要件”和“刑罚要件”，再审查“社会危险性要件”，社会危险性的评估处于程序的最后一环。司法实践中的真正做法是在充分阅卷、讯问犯罪嫌疑人等必要程序之后，先判断其是否构成犯罪、是否可能判处有期徒刑以上刑罚，只有在满足以上两个要件时，才会启动社会危险性要件的审查程序。

第二步：根据案件的“繁简”进行社会危险性判断的分流。这里的“繁简”不完全等同于案件情节的轻重，而是与影响社会危险性评估依据的因素多寡有关。“简单”案件，是指那些依靠单一因素即可作出决定的情形，包括法条中明确认定为具有社会危险性的情形。实践中，办案人员一般径行将这些案件归入有较高或较低社会危险性的类别，这一点在本研究的实证部分得到过检验。其余案件则属于“复杂”案件，这些案件不能通过单一因素直接作出判断，而是要根据多种因素综合判断才能得出结论。

第三步：针对“复杂”案件，办案人员将根据案件的不同类型，开展差异化的评估工作。不同案件类型意味着所侵犯的法益、是否具有被害人、犯罪嫌疑人是否可能实施新的犯罪的概率都有所不同。办案中高效区分案件类型的方法可能是基于罪名作初步分流。本研究针对所收集的不批准逮捕理由说明书中“无社会危险性”的理由进行统计，发现不同罪名的审查重点有很大差异，比如盗窃案件和故意伤害案件的社会危险性评估，在模式上就存在明显区别。

第三步之一：再犯可能性的评估。对于某些再犯情形高发的罪名，审查者重点考虑的是，如果采取非羁押强制措施，犯罪嫌疑人再次犯罪的可能性大小。本研究统计了盗窃案件中“无社会危险性”的理由，发现较高频次的理由包括如实供述（占比66%）、无前科（占比66%）、认罪认罚（占比54%）、退还赃物（占比49%）。以上情节基本能够说明犯罪嫌疑人的认罪悔罪态度以及重新犯罪的可能性。从司法办案经验看，盗窃的确也是再犯可能性较大的犯罪类型，有盗窃前科的盗窃案件犯罪嫌疑人不在少数。

第三步之二：被害人态度的评估。对于那些有被害人的案件，审查者还可能重视被害人及其家属的态度。本研究统计了故意伤害案件中“无社会危险性”的理由，发现较高频次的理由是取得被害人谅解（占比86%）、积极赔偿（占比72%）。这说明在故意伤害案件中，办案人员可能认为通过事后赔偿等方式可以实现双方和解，这会被看作犯罪造成的社会关系破坏情况已经有所修复。

需要特别说明的是，实践中社会危险性的审查过程不一定严格按以上步骤进行，办案人员完全有可能改变审查顺序，甚至“一气呵成”直接进行判定。对实践做法区分出步骤，能够聚焦社会危险性量化评估的着力点。本研究认为，量化评估主要在第三个步骤中对“复杂”案件发挥作用。当前，这部分案件的社会危险性评估以定性的、主观的判断为主。由于未全面采用以算法公式为内核的量化评估工具，当前的实践做法容易简化社会危险性要件的审查过程，从而给人留下结论主观性强、说理不充分的印象。

（二）实践做法的形成背景及局限

其一，审查者把罪行危险性因素作为社会危险性判断的主要依据，与当前社会危险性判断依赖侦查案卷信息有关。从实际办案情况看，检察机关和审判机关依然严重依赖侦查机关所收集的证据，特别是大部分案件很少出现审查逮捕中检察机关要求侦查机关补充取证的情况。这一点在当下似乎很难改变，在“案卷中心主义”之下，检察机关在审查和决定审前羁押时，主要依赖侦查案卷，这就很难做到全面、客观、中立的审查和决定。总之，单纯围绕侦查机关制作的案卷开展社会危险性评估，本身即有偏颇性。

其二，审查者在侦查案卷的基础上，并无足够动力、意愿继续拓展罪行危险性因素以外与社会危险性有关的信息。根据有关办案期限的规定，案件初次羁押的审查判断期限较短，审查者要在一周左右的时间内完成阅卷、提讯和文书制作等工作，并且审查者还可能同时办理多个案件。局促的办案期限、“复杂”案件难于定性、事后问责的潜在风险等等，使得办案人员并无意愿、也无能力扩充有关社会危险性的信息。

其三，在社会危险性判断中采取主观心证方法，是一种理性选择。在处理那些社会危险性判断困难的案件时，办案人员只能结合案卷中已知的因素，得到主观上认为恰当的综合判断，似乎没有其他可以借助的工具。这一点从本研究的社会危险性值等级分组中，各地区案件词云画像不一致，特别是中等社会危险性值的案件特征中，能够看出社会危险性评估标准的多元化，决策权限分散于个案并且办案人员的主观裁量空间较大。

虽然必须承认，实践中以罪行危险性因素为主的主观心证式社会危险性判断模式，是现实条件局限下的权宜之计，但此种模式亦暴露出如下局限性：人身危险性因素相对匮乏，办案人员无意也无力拓展有关人身危险性的信息，由此导致依赖侦查案卷记载的罪行危险性因素进行判断。这些汇总起来，使得社会危险性错判的风险增加。

（三）围绕规范细化和要件重构的改革

提升评估能力的方法无外乎两个，要么从制度规范方面考虑如何重塑审查判断过程，要么引入更加可取的评估工具。很显然，主流改革思路是前一种。前文的分析已经说明，司法实践把社会危险性评估置于强制措施判断的最后一个环节，并且以案件基本事实和罪行危险性因素为主要判断依据。自2012年修改刑事诉讼法以来，理论界和实务界主要围绕规范细化提出改革方案，以期强化对社会危险性要件的审查。这主要表现为，立法和司法机关不断出台法律规定和规范性文件，细化社会危险性的判断要素和标准。具体来说，自2012年开始的一系列规范，主要采用列举具体情形的方式推动改革进程，包括2012年刑事诉讼法明确了社会危险性的要件和情形；2015年最高人民检察院、公安部《关于逮捕社会危险性条件若干问题的规定（试行）》细化了社会危险性的五种具体内涵；2018年刑事诉讼法进一步明确了犯罪的性质、情节、认罪认罚情况、对所居住社区的影响等要素，作为判断社会危险性的依据；2023年《人民检察院、公安机关羁押必要性审查、评估工作规定》进一步明确，对可能判处3年有期徒刑以下刑罚的犯罪嫌疑人等情形，应当开展羁押必要性审查，并对羁押必要性审查、评估的内容和方式作了细化。

在学术研究方面，表现为加强对逮捕三要件的阐述和重构，包括各要件的功能定位、要件之间的关系、适用顺序等，以突出社会危险性要件的重要性。就逮捕的实体要件，有学者主张，应当强调逮捕三要件之一的社会危险性的审查，阶层化地重构逮捕三要件，把证据要件作为基础要件、刑罚要件作为否定性要件，将社会危险性要件作为“核心要件”；还有学者认为，社会危险性要件是抑制羁押率的重点。

以上表明，改革的着力点主要在于：一是不断细化作为“大前提”的规范，二是突出社会危险性要件的重要性。改革的最主要成果是使办案人员有了更具可操作性、可理解性的规范依据。但是，这类指引只是解决了羁押判断中的一小部分案件，即本研究所谓的“简单”案件。甚至这种审查模式还可能把部分原本属于“复杂”案件的，归类为“简单”案件，从而并未化解那些需要结合多种因素综合评估社会危险性的判断难题。因而，此种路径的效果，笔者是十分怀疑的。

四、量化方法与规范路径的兼容

（一）规范改革路径的主要局限

理论上重新构造逮捕三要件的分工和关系，可能产生一种新的审查犯罪嫌疑人是否满足羁押条件的方法指引，特别是引导基层办案人员重视社会危险性要件对于控制羁押率的宝贵价值。然而，单纯依靠规范细化和要件重构的改革路径，无法化解社会危险性判断不足的问题。这一路径存在一些明显的短板：

其一，规范列举的情形需要结合犯罪嫌疑人的具体情况作进一步判断。在规范列举的具有社会危险性的情形中，“逃跑”“再犯罪”等都不是实际已经发生的危害，而只是面向未来的、未知的风险。办案中审查的关键在于通过案件及其犯罪嫌疑人的已知信息，从中提炼有价值的因素来预测风险的大小。要作出社会危险性大小的结论，当前主要基于办案人员的主观经验进行笼统判断，未来或许可以采用更为精准、科学的方法。

其二，规范改革路径无助于增加办案人员对社会危险性事实层面的认知。不论是细化规则还是列举具体情形，并不能给予办案人员有关案件和犯罪嫌疑人更多事实层面的信息，即规范改革路径集中于优化法律适用的“大前提”，而与事实层面的“小前提”无涉。已有研究注意到了这一局限性，比如从证据法的角度认为，社会危险性评价不足的根源是相关事实依据不足。

其三，沿袭既有改革思路，终归无法通过成文规范事先事无巨细地规定清楚每一类“复杂”案件情形的社会危险性判断方法。本研究认为，对于那些需要结合多种因素综合判断社会危险性的案件类型，是无法通过规范细化的路径实现判断准确性方面的改观的。“复杂”案件的特点决定了，即使成文规范具体列举了社会危险性的表现类型和判断方法，也依然需要审查者综合案件的细节对社会危险性作出判断，即不存在直接表征“复杂”案件社会危险性程度的单一指标。

综合以上分析，似乎既有的规范改革路径并不能彻底解决当下的实践问题。细化规则和重构要件的改革思路，只是有助于解决“简单”案件中的社会危险性评估问题。由于缺乏犯罪嫌疑人人身危险性方面的信息增益，并采取更为科学的方法归纳社会危险性的各种类型及其发生机制，当前的规范改革路径似乎无力解决“复杂”案件中的社会危险性判断难题。

（二）量化方法与规范路径的互补

实际上，量化方法与规范路径不是对立的关系，而是完全有可能实现有效互补。社会危险性的量化评估方法，其实质是将社会危险性因素首先予以具体化和类型化；其次研究各类型社会危险性的发生机制，借助罪行危险性和人身危险性的指标体系刻画这一机制；再次是运用大数据训练并赋予各指标以不同权重的方式，实现对社会危险性的科学赋值。

量化方法与规范改革路径各自的侧重点和互补性体现为：

其一，规范路径是在法律适用的“大前提”上做文章，而量化方法是在事实层面的“小前提”上下功夫。充实“小前提”，能够克服当前社会危险性审查个人主观色彩浓重、判断缺乏统一性的问题。

其二，量化评估方法能够拓展案件信息的边界。如果说规范路径的目标是更为准确地理解和把握规范的含义，量化方法则是通过大数据采集、人工智能算法，在人力资源、办案期限、机关分工等既定不变的情况下，尝试冲破传统办案模式的信息瓶颈，得到更多有关犯罪嫌疑人社会危险性的信息。同时，量化评估方法还将提升评估过程的可解释性，让社会危险性评估得到过程性开示，促使逮捕审查判断工作朝向科学化、可追溯、能事后说明的方向发展。

其三，量化方法也需要规范路径的指引。一方面，规范层面明文规定了具有社会危险性和不具有社会危险性的情形，这可以设计成量化评估的直接判断规则或者更高权重的指标。量化评估的改进重点，应当放在审查那些有多个参考指标且指标间关系复杂的案件。当案件的社会危险性值介于中间状态（比如在设置的阈值0.5附近）时，说明在司法实践中，办案人员欠缺预估社会危险性的能力，依靠规范指引也依然无法作出清晰判断。这是未来引入量化评估方法时应当着力处理的案件类型。

评估犯罪嫌疑人的社会危险性，主要依靠审查者综合各类社会危险性信息作出准确预测的能力。规范细化和要件重构，可能只是明确是与否的大致界限，而无助于改变社会危险性评估信息匮乏、未能精细化运用的现状。相较而言，对于需要更多案件和犯罪嫌疑人信息、更加需要科学确定各类信息权重的“复杂”案件，量化评估方法更能发挥其专长。

（三）引入量化工具的可行路径

在规范改革路径基本保持不变的情况下，笔者认为，加强引入量化评估工具的可行性在于：一方面，提升办案机关采集社会危险性信息的能力；另一方面，加强对社会危险性发生机制的认知度。

1.提升采集社会危险性信息的能力

其一，扩大可用于构造量化评估公式的备选数据项类型。基于本文的实证研究发现，我国当前判断社会危险性值主要依赖罪行危险性因素，应通过量表等方法加强对人身危险性信息的收集，从而弥补判断数据项的结构性短缺。办案机关应当尽快完成量表设计，在案件立案后、逮捕审查决定作出前的全过程中，均可适当穿插针对犯罪嫌疑人、被害人和其他诉讼参与人的问卷调查，加快积累一批可以用于训练社会危险性评估模型的大数据集。

其二，利用数字化手段扩大对人身危险性信息的收集范围。应当借助这一轮司法数字化浪潮，尽快提升智能设备的引入程度，采集时间序列更长、收集过程更加客观的犯罪嫌疑人、服刑期满人员的相关社会活动数据。比如，非羁码、电子手环、电子脚铐、车载物联网等设备，都可以记录被释放的犯罪嫌疑人的行踪。诸如此类工作，能够有效收集非羁押状态下犯罪嫌疑人的社会危险性数据，从而丰富社会危险性评估模型的训练数据标签。彼时，本研究所采取的利用不批准逮捕理由说明书测量社会危险性的方法，就会被更科学的方法所取代。

2.加强对社会危险性发生机制的认知度

其一，组织专家学者开展深入且系统的社会危险性发生机制的理论研究。如前所述，量化方法的数据建模，其主要功能是统合各类事实信息材料，通过数据建模的方法更准确地量化犯罪嫌疑人的社会危险性。量化公式是否科学、精准，关键取决于对社会危险性发生机制的把握是否到位。因此，改进量化评估方法，需要组织有经验的司法人员、专家学者，深入挖掘社会危险性与案件各要素之间的机制性联系。

其二，可以采取分类型、分地区的模型建构思路。实务中，可以区分社会危险性的具体类型、不同罪名、不同地区实现建模。这一思路有本文实证研究的相关数据予以支持，比如盗窃案件和故意伤害案件的社会危险性判断就存在很大差异。应当承认，由于公开样本量的限制，本研究对相关机制的挖掘还很不够。最适合继续深入探索建模方法的，是掌握了全库案件信息、具备更强资源调动和整合能力的司法实务部门。

以上两方面工作应当同步进行。社会危险性发生机制的研究为进一步的数据采集指明了方向，扩大的数据样本和数据项则有助于检验相关机制是否具备实证支持。两类成果将在具体构建社会危险性量化公式时共同发挥作用，有关机制的研究结论将主要决定公式的数据项体系和类型，海量的社会危险性数据库将通过机器学习得出各个数据项的权重。

周翔，浙江大学光华法学院特聘研究员

本文原载《法学研究》2024年第3期第191-208页

周翔：逮捕审查判断中犯罪嫌疑人社会危险性的量化评估

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏