基于多尺度特征融合的细粒度行人属性识别

谢晶晶¹

扫码查看

作者信息

1. 电子科技大学
折叠

摘要

行人属性识别即对给定的行人图像进行语义分析，在视频监控、身份识别、人物检索等领域发挥着重要的作用。由于行人属性标签的类别多、尺度多样，属性间关联性复杂、易被忽略，导致图像中许多语义信息不强但对于分类具有重要作用的特征难以被网络捕捉到。此外，现有行人属性数据集的规模受到数量和多样性的限制，细粒度属性不足，质量欠佳。因此现有的方法对行人细粒度属性的识别性能不佳。针对以上问题，本文改进并丰富了一个包含126种属性的行人属性数据集，用于细粒度的行人属性识别，并提出了三种用于行人属性识别的方法。本文的主要研究内容如下：（1）本文分析并完善了一个细粒度的行人属性识别数据集。本数据集涵盖了126种属性，有多个细粒度行人属性，但属性类别过多，导致数据集中数据分布不平衡，长尾问题严重，降低了数据集质量。本文针对此问题，对数据集进行完善扩充，丰富尾部数据。（2）本文研究了基于注意力机制的多尺度特征融合的行人属性识别方法。针对属性尺度多样带来的挑战，本文采用了类似金字塔的形式来融合多尺度特征，提高属性识别的准确率；为了抑制无关信息干扰，使模型定位到有效信息，引入了通道注意力机制，使网络关注到更重要的通道特征；采用了多分支损失函数进行约束，充分的训练每一个融合后的特征层，提升网络性能。（3）本文研究了基于局部特征的多粒度特征融合的行人属性识别方法。行人图像中存在许多中小尺寸和区域关联性较强的属性，仅使用全局特征无法有效的提高这些属性的识别性能，针对此问题本文研究了一种结合全局与局部特征的方法来进行属性识别，对行人的各粒度区域分别进行特征提取，有效的提高了细粒度属性的识别准确率；针对数据集中的长尾问题，本章采用属性加权损失函数，避免尾部样本过度惩罚，提高网络识别性能。（4）本文研究了基于图卷积网络的属性间关系建模的行人属性识别方法。本文利用图来对属性标签的相互依赖关系进行建模，从而灵活的获取属性标签空间的拓扑结构，提升模型的学习能力；针对数据集属性类别的数据分布不平衡问题，采用平衡损失分布损失，缓解各类别失衡的问题，提升模型性能。

关键词

深度学习/行人属性/特征融合/局部特征/图卷积

引用本文复制引用

授予学位

硕士

学科专业

信息与通信工程

导师

颜庆义

学位年度

2023

学位授予单位

电子科技大学

语种

中文

中图分类号

段落导航