摘要
近年来,“互联网+犯罪”已成为我国最主要的犯罪类型。由于语音证据具有非接触性和易采集性等特点,其在“互联网+犯罪”中的证据地位不断提高,并被广泛应用于各类刑事案件的证明过程。然而,在司法语音检验实务中,许多案件的供检语音是短时语音,由于这类语音证据的时长较短,其中的内容和信息有限,因此采用传统的法庭说话人识别范式难以对其进行充分的检验和分析,进而影响其证据效力的发挥。在语音证据的评价范式转变背景下,基于似然比框架的法庭自动说话人识别正日益展现出其相对于传统范式的显著优势,为短时检材语音检验困难提供了新的的解决方案。 本文以短时检材语音为研究对象,在似然比框架下,利用基于深度神经网络(DNN)模型的法庭自动说话人识别系统对短时语音的说话人识别性能进行了理论分析和实验测试。研究内容主要包括两个方面:一是在短时语音环境下的法庭自动说话人识别系统识别的有效性;二是不同参数条件的校准数据集对系统识别性能的影响。在此基础上,通过一起案例的实证研究,示范性地表明利用法庭自动说话人识别系统进行短时语音案件分析检验的基本方法和流程,为司法语音实践提供参考。 全文由引言和主体两大部分组成,具体内容如下: 引言部分阐述了本文的研究背景及目的、研究意义、国内外研究现状、研究方法和创新。主体分为五个部分: 第一部分是对法庭说话人识别的概述,简要介绍了法庭说话人识别发展的整体历程、法庭说话人识别的基础以及目前主流的法庭说话人识别方法。 第二部分是对法庭说话人识别新范式的阐释,包括似然比框架体系的原理介绍、基于似然比框架的法庭自动说话人识别模式以及评估法庭自动说话人识别系统性能的主要指标。 第三部分是在短时语音环境下对法庭自动说话人识别系统性能的分析测试,内容包括系统简介、实验数据来源、实验设计思路以及实验结果和分析。 第四部分是典型案例的实证研究。通过一起短时检材语音的实际案例,示范性地展示利用法庭自动说话人识别系统进行该类案件检验的基本步骤和程序。 第五部分是对全文的总结和展望。