摘要
近年来,随着经济的发展,人们的生活节奏开始不断变快,同时也产生了越来越多的心理问题,而作为关系到国家未来发展的高校学生,其心理健康状态更是受到更多的社会关注,及时发现学生的心理健康问题并进行预警,能让学生身心得到全方位发展,减少恶性事件发生,有助于维系社会稳定。随着高校学生的心理健康问题不断受到关注,相关技术研究也不断涌现,但目前研究仍然存在以下问题:(1)在数据方面通过对学生发放问卷调查进行分析,这种方式获得的样本较小,同时数据的主观性高;(2)在模型方面选用传统的机器学习模型,难以适应大规模的数据集;(3)在进行心理健康预警时将学生视为相对独立的个体,从而忽视了他们之间的相互联系。针对以上问题,本文使用学生的日常行为数据构建多源数据集,并提出基于多源数据融合的学生心理健康预警算法,主要研究内容如下: (1)针对样本数据少和主观性强的问题,构建了学生日常行为多源数据集,采用非侵入的方式收集学生日常行为数据,减少数据的主观性。以周为时间单位收集学生两个学期内的消费行为数据(包括消费次数、消费时间和消费金额)、上网行为数据(包括上网次数和上网时间)、作息数据(包括开始活动时间和准备休息时间)等一系列数据,构建学生日常行为多源数据集,通过个体匿名化和随机加噪保护数据隐私,将数据进行预处理操作并提取对应特征。 (2)针对模型难以处理大规模数据的问题,提出了基于时间编码器和行为编码器的学生心理健康预警算法TSEN,将学生日常行为产生的时间序列数据分别输入时间数据流和行为数据流,TSEN在时间数据流中使用时间编码器来捕获时间周期趋势,同时在行为数据流中使用行为编码器来捕获特征依赖关系,通过搭建多层编码器实现更深层次的非线性变换,对复杂的数据分布进行建模,学习更深层次的特征,相较于传统的机器学习模型能够更好地处理大规模数据中复杂的结构和信息。此外,TSEN还能减少编码器堆叠时出现的信息损失,通过中间融合模块对时间数据流和行为数据流的特征进行逐层融合。在多个数据集的实验结果表明,所提算法都具有良好的效果。 (3)针对学生之间关联性较弱的问题,提出了基于图自注意力和标签传播的学生心理健康预警算法GTCS,同时使用学生的生活关系和学习关系搭建学生关系网络,在学习节点特征表示的同时,还能沿着图的边传播节点的误差和标签,进一步修正和平滑分类结果。首先,GT模块将Transformer应用于图结构,并通过聚合邻域信息将图结构转换为序列结构,使编码器对大型图结构数据也能够进行处理,聚合函数赋权融合多个序列结构,送入全连接层获得软标签,CS模块沿着学生的生活关系和学习关系对软标签进行修正和平滑。在多个数据集上与基准实验进行对比,实验结果表明所提算法的性能具有一定的优势。