熊明辉：法律人工智能的十大前沿问题

法律人工智能是指人工智能技术在法律中的应用，其目标是充分提升法治效能。我国的智慧法院、智慧检务建设等国家重大工程，就是法律人工智能的落地应用。目前，法律人工智能的系统工程标杆是“上海刑事案件智能辅助办案系统”，其将公检法三机关的刑事业务在一个云平台内打通，部分实现了自动法律推理，大幅提升了工作实效和程序公正性。法律人工智能研发中的问题主要有理论建模和具体应用两大类，可以总结为十大前沿问题。

法律推理的形式模型。法律推理的形式建模是实现自动法律推理最基础的问题。自动推理与智能密切相关。智能即会思维。什么叫“会思维”？英国数学家图灵认为，如果机器能在互不接触的相当长时间内与人类对话，而被对方误判为人类的概率达到一定程度，那就有理由说这台机器“会思维”。这就是“图灵测试”。这表明，人工智能的关键在于能否实现自动推理。作为人工智能子领域，法律人工智能的关键就在于法律自动推理的实现。为此，需要给出面向自动法律推理的形式模型。有三种可能的法律推理建模方案：一是规则推理方案，即利用演绎推理将法律规范编码成法律解释库和案件事实库，以实现自动法律演绎推理；二是案例推理方案，即利用类比推理将案例编码成法律解释库和案件事实库，以实现自动法律类比推理；三是数据推理方案，即利用归纳推理将有价值的法律信息编码成法律解释库和案件事实库，以实现自动法律大数据推理。在成文法国家，第一种方案是最主要的。

法律决策的计算模型。能行可计算是人工智能得以实现的必要条件。“能行”强调要有实效，“可计算”强调能够通过编辑方式来实现。法律决策能行可计算是法律人工智能的前提条件。法律决策可分为立法、执法、司法和守法决策，其理性根基即立法论证、执法论证、司法论证和守法论证。然而，传统法律论证主要由人工完成，优度完全取决于法律论证者的知识结构和论证能力，而作为自然人的论证者总有知识结构、价值取向等局限，得出的结论难免存在主观偏差。在法律决策中，尤其是在法律论证者经验不足的阶段，常常会犯常识或逻辑错误，而设计相关法律决策辅助系统，保障法律问题部分可计算，可以减少这类错误发生。概言之，为了逼近客观性，充分利用人工智能技术是一种切实可行的方案。

证据推理的计算模型。证据推理的计算模型是实现自动法律证据推理的前提条件。在审判过程中，法律从业者通过证据累积来确认或否认有关法律假设。服务司法证明过程的法律人工智能应用必须具备为用户提供在案件中进行证据表达和推理的复杂能力，因此，研发者必须使用复杂的技术来表示、探索、推断和分析诉讼过程中出现的假设和证据的可替代性解释。这需要计算技术来表示诉讼参与者、实体、事件和世界情形语境，将解释证据的替代假设进行结构化处理，通过评估证据的相关性和权重来确证或否定假设，做出假设真实的推论，而将贝叶斯推理网络与人工智能中的知识表示组合起来，就可以对事实论证进行结构化分析。

法律推理多主体建模。法律审判是建立在诉讼基础之上的，而诉讼是一种三方法律论证博弈。利用人工智能中的多主体系统思想，就能实现诉讼论证博弈的逻辑建模。在计算机科学中，多主体系统又称多智能体系统，是指由多个相互作用的智能体组成的计算机系统。典型的多智能体系统研究指向软件智能体，其主体可以是机器人、人或人机组合团队，智能则可以包括条理方法、功能方法、程序方法、算法搜索或强化学习。多智能体系统可以解决单个智能体或单个系统难以解决甚至不可解决的问题。法律诉讼恰恰是一种多主体互动的论证活动。诉讼中，起诉、应诉和裁判三方需要就法律论证中的法律规范及其解释、法律证据及其支持的事实主张以及法律论证的强度进行互动，做出相应法律决策。多主体系统为智能诉讼系统（如智慧法院等）提供了可能的建模方案。

可执行立法检验建模。党的十八大提出了“科学立法”。从逻辑学角度讲，科学立法就是将法律体系视为一个准逻辑体系，要求法律体系原则上具有一致性、完备性、有效性和可靠性。其中，最为核心的是一致性，因为完备性、可靠性和有效性均可通过法官的自由裁量权弥补，而一致性却很难。法律体系的一致性，要求法律体系原则上无矛盾，不应出现法律冲突。不一致会导致法律体系紊乱和法律从业者无所适从，并削弱司法公信力。同一法律内部的冲突，立法者一般可自行解决，但不同部门法以及上下位法的冲突往往超出立法者能力范围。而自动实现法律法规体系一致性检测的法律人工智能，将大大提升我们的科学立法水平。

文本自动分类与总结。该问题包括两个方面：一是法律文本的自动分类。当前，大多数法律文件以电子形式提交，但对这些电子文件的分类多停留在传统的人工阶段，而利用机器学习技术中的文本自动分类技术，可实现法律文本的自动分类。智慧司法的一大目标就是要借此提高文件的归档效率和后期利用率。二是文本中法律论证的自动总结。法律决策建立在法律论证之上，而法律论证埋藏在法律文本之中。借助机器学习中的文本自动总结技术，可以大大提高法律论证挖掘的效率。更重要的是，使用传统的人工方法挖掘法律论证，其质量主要取决于论证挖掘者的能力和水平，优度参差不齐，而研发法律文本的自动总结应用程序，可以普遍提升论证挖掘优度，并确保论证挖掘质量的稳定性和评估的客观性。

法律信息的自动提取。法律信息提取过程中产生的信息是后续立法和构建新的法律论证的基础，也是处理电子证据的有效手段和帮助用户评估相关信息的能行工具的重要组成部分。但由于数据量过于庞大，对法律信息手工分析显然不可行。自动信息提取的任务就是从非结构化或半结构化的机器可读文档中自动提取并生成结构化信息。在大多数情况下，信息提取涉及通过自然语言处理分析人类语言文本。目前，人工智能技术已支持多媒体文档信息的处理，如图像、音频和视频文档的自动注释和内容提取。法律信息自动提取涉及一般自然语言的文本处理和具体法律领域语言处理，因此，相关模型需要同时兼顾这两个方面。

电子取证的机器学习。电子取证是指在法律诉讼或法律调查中为回应举证要求而进行的电子存储信息的辨识、收集和举证。这些电子存储信息包括文档、电子邮件、音频、视频、数据库、社交媒体等。电子数据不仅数量巨大，取证过程和技术往往也很复杂。电子文档富有动态性，常常包含如时间—日期戳、作者和收信人等元数据。为避免证据后期被篡改或毁损，需保存电子存储信息的原始内容和元数据，并置于法律监管之下。数据分析就是要筛选和隔离明显不相关的电子信息，将数据托管于安全环境中，使得编写文档代码的审阅人员可以访问这些数据，了解它们与法律事项的关系。使用计算机辅助评估、预测编码和其他用于电子取证的分析软件，可以大幅降低法律从业者审查证据的时间等人力成本。

法律信息的检索系统。法律信息检索是一门应用于包括法律法规、判例和学术论著在内的法律文本的信息检索科学，是法律信息学的一个领域。通过电子手段可获得的法律文件数量庞大且呈爆炸式增长，故法律信息精准检索日渐重要。一般来讲，为了达到信息检索的目标，有三种可运用的检索技术——布尔检索、法律文本手工分类和法律文本自然语言处理。对于整体的法律文档而言，目前通常使用的方法是布尔检索法，也就是与特定术语进行精确匹配。一般来说，研究人员相信他们通过这种方法已经检索了大多数的相关文件，事实上这种方法的平均查全率只有20%，所遗漏信息可能相当重要。法律信息检索试图通过增加相关文档的数量（高查全率）和减少不相关文档的数量（高准确率）提高法律搜索的效率。但这是一项艰巨的任务，因为在法律领域行话和多义词非常普遍，而且有些词义还经常变化。

法律机器人的研发。法律机器人是一类面向客户的法律人工智能应用程序，用于自动执行具体法律任务，如文档自动化和计算机辅助法律检索。从智能搜索机器人、表单程式机器人到法律咨询机器人，法律机器人的用户界面多种多样。根据任务的不同，面向律师事务所客户的法律机器人解决方案往往需要在律师监督下运行，而面向消费者和企业客户的法律机器人解决方案则通常不需要法律专业人士的直接监督。法律机器人不是用来取代诸如法官、律师等法律从业者的，它是人类智能之延伸，是法律人的得力助手，而并不会替代法律人。

（作者：熊明辉，系中山大学哲学系教授，国家“2011计划”司法文明协同创新中心教授）

熊明辉：法律人工智能的十大前沿问题

小程序 | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏