首页|俄文文本易读性自动评估研究

俄文文本易读性自动评估研究

李晨蕊

俄文文本易读性自动评估研究

李晨蕊1
扫码查看

作者信息

  • 1. 国防科技大学
  • 折叠

摘要

国内俄语学习热潮屡创新高,但俄文自动分析研究却未能得到语言学家足够的重视。俄文易读性作为俄文自动分析研究的重要内容之一,其研究在书籍编撰、语言教学、文本自动编写与修改等方面具有重要的实用价值。因此,本文选取俄文易读性作为研究对象,将俄文易读性自动评估作为主要研究任务。 本文通过对国内外易读性研究成果的总结,发现其研究方法正在从以形成易读性理论为主要目的的理性主义研究方法转变为以准确评估易读性为主要目的的经验主义研究方法,并且其评估方法正在从利用回归分析构建易读性公式的方法转变为基于机器学习算法构建评估模型的方法。本文将现有易读性研究成果同俄语语言学理论相结合,从词汇、句子、语篇三个层面提出了影响俄文易读性的 16个特征变量。在易读性评估方法的选择上,本文基于自建语料库检验了基于回归分析构建易读性公式的可靠性,公式准确率最高仅为55%。因此,本研究将目光转移到基于支持向量机算法(SVM)的模型构建上来,基于自建语料库构建的文本难度分类器准确率分别超过了70%和75%,其结果体现了SVM算法在俄文易读性评估方面的优越性。本研究选取的研究工具和研究方法可以为后续俄文易读性研究以及俄文自动分析研究提供借鉴,取得的研究成果在语言教学、教材编排等多个领域具有一定的实用价值。

关键词

俄语学习/俄文易读性/自动评估/支持向量机算法

引用本文复制引用

授予学位

硕士

学科专业

外国语言文学

导师

许汉成

学位年度

2021

学位授予单位

国防科技大学

语种

中文

中图分类号

H3
段落导航相关论文