摘要
随着新冠疫情的全球爆发,人们的生产和生活受到了巨大的影响。口罩是抗击新型冠状病毒的有效个人防护工具。佩戴口罩也是防止新型冠状病毒在火车站、教室、街道等公共场所传播的一种有效而简单的方法,因此在很多公共场所要求人们佩戴口罩。完全依靠人力在公共场所检测人们佩戴口罩不可避免地存在强度高、效率低、覆盖小、时效差等缺点,因此使用计算机视觉技术检测并督促人们佩戴口罩具有积极的社会意义。然而现有的检测方法主要针对行人依次通过闸机或检查点这样背景单一,人脸数量少的应用场景。本文主要针对密集人群,复杂背景,人脸存在不同的尺寸或相互遮挡等应用场景,基于深度学习相关技术设计公共场景下口罩佩戴检测算法。本文主要的创新与工作量可以总结为如下几点: (1)设计了用于人脸检测的DFL(Dilation Face Location)网络。通过实验比对了三个主干网络的检测效果,最终选择ResNet作为主干网络。通过融合自下而上和自上而下两条数据通路提高了在复杂背景下对人脸的检测能力。通过融合空洞卷积与普通卷积的方式改进了加强特征提取模块,提高了对小尺寸人脸的检测能力。DFL网络对人脸平均检测准确率达到90.6%。 (2)制作了一个新的戴口罩人脸分类数据集。其中训练集包含18000张图像,分别为9000张戴口罩的人脸和9000张不戴口罩的人脸,测试集包含1751张图片,分别为656张戴口罩的人脸和1095张未戴口罩的人脸。数据集中的人脸分辨率最大1735×2342到最小20×40,跨度涵盖了人脸出现在图像中的大多数可能的尺寸,强化了网络对不同尺寸戴口罩人脸的分类能力。数据集已被公开以供其他科研人员研究。 (3)创建了用于戴口罩人脸分类的网络。使用神经架构搜索的方式创建了SRNet20分类网络,采用不同的卷积核进行构建,提高了网络对戴口罩人脸的分类能力。考虑到监控视频存在的隐私问题,使用联邦训练的方式模拟了多机分布条件下的模型训练。对比预训练的ResNet网络对戴口罩人脸平均分类准确率最高为93.0%,本文创建的SRNet20网络对戴口罩人脸平均分类准确率达到98.5%。