摘要
近年来,随着以裁判文书为代表的司法大数据不断公开,如何利用机器学习、自然语言处理等技术来赋予计算机理解法律文本、学习法律知识、解决法律问题的智能逐渐成为司法和计算机交叉领域的研究热点。相关技术既可以为法官、律师等专业人员提供辅助参考,提高他们的工作效率,也可以为缺乏法律知识的非专业人士提供低成本的法律援助,因而具有重要的应用价值和社会意义。司法审判预测(LegalJudgmentPrediction,简称为LJP)是司法智能研究的主要方向之一,其目标为基于案件的事实描述等信息自动地预测罪名,相关法律条款以及刑期等判决结果,在法律辅助系统中有着非常重要的作用。 已有LJP研究大都针对一审阶段的结果进行预测,本文进一步关注了二审阶段审判结果的预测问题(AppealJudgmentPrediction,简称为AJP)。AJP的目标是根据案件事实和上诉理由的文本描述预测二审法院对上诉案件的判决。AJP一方面可以帮助上诉人预估自己的上诉收益;另一方面也可以辅助一审法院提前排查其判决中的不足。解决AJP任务主要面临两方面挑战:首先是如何合理地对二审判决过程进行建模;其次是如何提高预测结果的可解释性,以便获得司法专业人士的认同。针对上述挑战,本文提出了一种子任务依赖的有序多任务学习方法SMAJudge来实现二审审判结果预测。SMAJudge首先使用两个多任务学习模块分别对一审、二审审判过程建模,各模块中子任务之间根据真实的审判逻辑存在依赖关系;然后,顺序连接两个多任务学习模块来对从一审到二审的完整审判逻辑建模。此外,SMAJudge使用基于上诉理由的注意力机制来提升预测结果的可解释性。 本文在一个由三万余份二审判决文书组成的真实数据集上进行了充分的实验来验证SMAJudge的性能。实验结果表明,与基线实验相比,SMAJudge具有更好的综合性能,并且在小数据集上的性能较基线方法有显著提升。同时,实验验证了SMAJudge的注意力机制能够使预测结果具有较好的可解释性。