摘要
机器解答技术是人工智能技术在教育场景下的典型应用,对于构建智能化、个性化的学习系统具有重要意义。近年来,数学应用题的机器解答研究备受关注。一方面利用智能技术辅助小学生学习解答数学应用题,可以增加学习乐趣,同时是对教育资源的极大补充。另一方面,使用计算机自动解答数学应用题,还可以用于衡量计算机的智能化程度。目前,计算机已经在象棋、围棋等智力游戏上超越人类,但对于理解自然语言描述的应用题,还有很长的路要走。 机器解答数学应用题的难点在于自然语言表述的复杂性。传统的研究方法通过语义分析构建模板,从题目文本中提取主体与数值构成的数量关系,生成方程或方程组进行解答。这一方法保留了数量关系提取的过程,具有较好的可解释性。不过为了覆盖更多的题目类型,这些方法往往需要对模板进行不断扩充,导致模板数量越来越大。随着机器学习、神经网络等技术的发展,越来越多的研究者开始尝试“序列到序列”的方式,直接从题目文本中得到一个表达式,以求得结果。不过机器学习的过程缺乏解释性,这些方法较难转化为人类可读的解题过程,因此在智能教育领域的应用可能会受到限制。因此,本文构建了基于物性结构的数学实体关系模型,并用于对题目文本进行分析,构建实体关系图,以提取数量关系。具体来说,本文的研究内容分为以下两个方面: (1)数学实体的物性结构建模:物性结构可以同时对词汇在语言和非语言学上进行描述的特性启发了本文构建针对数学实体的物性结构模型。建立这一模型的目的在于将其用于对数学实体关系进行分析,并对数量关系进行提取。为了构建这一模型,本文分析了数学实体和实体关系的类型、介绍了如何通过物性角色描述实体关系,并提出通过对句法格式的语义分析获取物性角色,最后通过实例演示数学实体关系建模的过程。 (2)基于实体关系图的数量关系提取:数学应用题中的数量关系往往还涉及未直接表述的实体,而且如果要实现对题目文本的完整表达,需要将题目中的所有实体关系进行整体分析。因此,本文通过对应用题情景的分类,将离散的实体物性角色整合成完整的实体关系图,通过对实体关系图的节点关联计算提取应用题中的数量关系。 本文在公开的Math23k数据集上进行了数量关系提取实验。从与其它方法的对比可以看出,基于实体关系图的数量关系提取在准确性和完整性上具有更好的性能。本文的研究方法保留了数量关系提取的过程,具有较好的可解释性,在智能辅导领域有广阔的应用前景。本文提出的数学实体关系模型为题目理解领域提供了新的思路,可以广泛用于物理、化学等与数学相关学科的机器解答,具有更高的扩展性和移植性。本文提出的实体关系图,具有直观的特点,如果基于本文方法实现对数学应用题的机器解答,可以促进智能导学系统的发展。