摘要
互联网在教育教学领域的应用日益广泛,有海量的教育数据在此过程中产生。如何合理地利用这些海量的教育数据一直是教育数据挖掘领域的重要课题。学生的日常行为会对其学业表现产生很大的影响。结合学生日常行为数据对其学业表现进行预测,可以在早期对具有不良学业表现风险的学生采取一定的干扰手段,最大程度避免因为学业表现较差而影响学生学习及生活的情况发生。 现有的针对学生学业表现的研究大多采用调查问卷、利用学生的课程成绩进行预测的方法,这些方法使用的数据具有一定的局限性。对在校大学生学业表现进行预测常采用一些传统的机器学习的模型,例如SVM、逻辑回归等方式。但是,这些方法不能利用学生的行为时序数据的信息来进行预测。此外,复杂的模型在简单的学生成绩数据集上使用会导致过拟合问题的出现。因此,本文提出了基于高校学生多维特征进行预测的学业表现预测模型,能够有针对性地对高校学生的学业表现进行分析和预测,提前检测出学业表现差的学生并进行干预工作。本文的工作包括: (1)针对数据局限性问题,从学生基本信息数据、学生成绩数据、学生行为数据这三个维度对学生在校行为进行分析,构造行为熵,用于挖掘行为特征的规律性,对学生的行为规律进行了比较准确的刻画。 (2)针对使用传统关联规则挖掘算法对高校学生行为数据挖掘时会产生大量无效规则的问题,提出了改进的关联分析算法,对学生的各种行为之间的关联性进行分析,挖掘得到与学生学业表现关联性较强的行为特征。 (3)针对传统模型不能较好地捕获行为时序数据信息的问题,本文提出了一种基于因果卷积网络以及残差结构的网络结构,个性化的分析及预测学生学业表现的模型,对预测得到的有不良学业表现风险的学生提前采取干预措施,进一步提高学生学业表现。