摘要
随着计算机技术在语言测试中的大量应用,不只是客观题,主观题的测试也开始应用机器自动评分。而主观题应用机器评分的领域主要集中在对写作的自动评分,较少涉及口语领域。 本研究聚焦口译译文的机器自动评分,从词汇特征方面着手,探究不同的词汇特征对口译结果的影响及对口译分数的预测程度。本研究借助Kyle团队研发的文本处理软件TAALES,以PACCEL为参照语料库,对词汇复杂度的各类参数进行提取,共确定出4类与语料库相关的词汇复杂度参数。本研究将语料库按照抽样文本数量和学生水平进行了两种分类研究,经过回归分析,4类词汇复杂度参数均能预测学生的口译分数,且在不同分组中的预测情况不同。在以抽样文本数量分类的分组中,TAALES中的参数评分对人工评分的预测度最强的是样本容量为全部样本的30%,其次是样本容量为全部样本的70%,再次是样本容量为全部样本的50%,预测度最弱的是样本容量为全部样本。在以学生水平分类的分组中,TAALES中的参数评分对人工评分的预测度最强的是学生分数高于60分(包括)但低于70分(不包括),其次是学生分数高于70分(包括)但低于80分(不包括),再次是学生分数高于80分(包括),预测度最弱的是学生分数低于60分。 本研究利用文本特征与口译的关系来预测口译得分,为机器自动评分在口译领域的发展提供了一种新的方法。