首页|基于深度卷积神经网络的儿童笑脸识别

基于深度卷积神经网络的儿童笑脸识别

张秋秋

基于深度卷积神经网络的儿童笑脸识别

张秋秋1
扫码查看

作者信息

  • 1. 上海师范大学
  • 折叠

摘要

近年来,随着城市化进程的加快,义务教育的实施,学生学习和生活压力与日递增,发生心理行为问题现象也日趋突出,因此学校已将学生心理健康教育当成教学工作中的重中之重。有效的表情分类可以协助心理学研究者们研究心理学等学科,通过对表情进行分类来分析儿童的心理活动和精神状态,从而减少心理行为问题的发生。其中,笑脸作为人类最常见的面部表情之一,反映了人的心理状态,传递着丰富的情感和意向信息。在学校里,通过鼓励学生多多微笑,使学生保持开心愉悦的心情,可以有效实现学生的快乐成长与教育,因此准确地识别出儿童的笑脸对于帮助解决学生心理健康问题具有重要意义,且具有比较广的应用前景。本文基于深度神经网络进行儿童笑脸识别的研究,主要研究工作如下: (1)建立了儿童笑脸数据库并对其进行预处理。首先利用网络搜索进行儿童人脸图片收集,其次利用StyleGAN生成部分儿童人脸图片,构建了9712张图片的儿童笑脸数据库,并通过多人同时打分机制为数据库分类,打上相应标签,分为4615张大笑、2101张微笑与2996张非笑脸图片。同时,针对三类数据样本不均衡问题,本文利用数据增强技术,对图片进行旋转、剪裁等操作,将儿童笑脸数据库扩增为20356张图片。最终,将这些图片进行灰度化、直方图均衡化以及归一化等预处理,以便后续送入神经网络获得更高的识别率。 (2)分别研究了基于经典卷积神经网络InceptionV3、ResNet50、Xception以及MobileNet的儿童笑脸识别方法。利用迁移学习微调四种网络模型,并分别对四个网络模型进行添加FC层与添加GAP层的对比训练。经实验,添加FC层的各个网络模型训练时收敛速度快,可以提升原始网络的分类性能,较好地实现了对儿童笑脸的识别。同时,基于ResNet50网络模型的笑脸识别,在准确率等各个方面均达到性能最优。然而ResNet50网络模型较大,参数最多,即对使用设备要求比较高。因此,在保证笑脸识别率等不会有太大损失的前提下,结合轻量型神经网络的结构特点,对ResNet50进行压缩改进,最终实现了既有高识别率又不至于消耗过多内存而拉高成本的ResNet50网络模型。该模型相对原来的模型识别率略有提高,同时模型变小参数减少,降低了计算成本,节省了存储资源和计算资源。 (3)最后,设计了一个基于深度卷积神经网络的儿童笑脸识别系统,该系统由人脸检测模块、人脸识别模块、笑脸识别模块、数据库模块以及人机交互界面模块组成。经对各模块的功能进行测试,本文设计的儿童笑脸识别系统能够达到对实时视频中人脸自动检测识别和笑脸识别的效果,并最终成功地将该系统推广至上海市一所小学用于笑脸识别和人工智能技术体验。

关键词

小学教育/心理健康/表情识别/深度卷积神经网络

引用本文复制引用

授予学位

硕士

学科专业

通信与信息系统

导师

李传江

学位年度

2020

学位授予单位

上海师范大学

语种

中文

中图分类号

G4
段落导航相关论文