首页|基于卷积神经网络的二手服装图像分类

基于卷积神经网络的二手服装图像分类

李涛

基于卷积神经网络的二手服装图像分类

李涛1
扫码查看

作者信息

  • 1. 武汉纺织大学
  • 折叠

摘要

随着购物方式的简化以及快速时尚潮流的推动,使得服装消费量和废弃量大幅增加。二手服装交易是实现“碳中和”的重要手段,准确和高效的服装图像分类能大大提高服装检索和服装推荐的效果,促进二手服装的交易。近年来,随着深度学习的飞速发展和卷积神经网络的问世,服装图像分类性能大幅提高。针对这一现状,本文将基于卷积神经网络对二手服装图像分类算法进行研究。 与全新服装相比,二手服装图像拍摄条件往往较差,通常存在拍摄场景杂乱、拍摄背景复杂、光线不足等问题。此外,二手服装存在形变、褶皱、遮挡等不确定因素,这些不确定因素往往使得现有的二手服装图像分类效果不理想,无法很好的满足二手服装分类商业领域的需求。 为了能更有效地对二手服装进行分类,本文提出了一个基于特征融合和注意力机制的二手服装图像分类算法。采用ResNet50作为基础服装分类算法结构,利用多阶段卷积层特征融合的方式优化算法模型。在使用卷积神经网络提取图片特征时,网络的底层特征具有较高的分辨率以及更丰富的位置和细节信息,但由于只经过少量的卷积处理,其语义性较弱且包含更多的噪声。相反,网络的高层特征分辨率较低,难以捕捉图片的细节,但具有更强的语义性。融合多个阶段卷积层提取的特征信息能有效的利用网络不同层次特征的更多互补优势,从而丰富模型提取的特征信息。同时,本文在模型中嵌入了通道和位置注意力模块,分别用于学习通道之间的内部关联性和特征的空间依赖性。通过将这两个注意力模块的输出结果相加,可以进一步增强特征表示。对于二手服装图像数据的采集。一方面,使用网络爬虫收集线上二手服装图像来训练网络模型,另一方面,使用照相设备对二手服装进行拍摄,收集图片用于测试网络模型的分类效果。此外,为了更深入地研究所提出的算法的适用范围,利用香港中文大学多媒体实验室提供的DeepFashion服装数据集进行了扩充实验。根据实验结果显示,在自建数据集和DeepFashion数据集上,本文所提出的算法的分类准确度相较于基础分类算法分别提高了 1.95%和1.76%,验证了本文算法的有效性和普适性。

关键词

二手服装图像/图像分类/特征融合/注意力机制

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

张俊杰

学位年度

2023

学位授予单位

武汉纺织大学

语种

中文

中图分类号

TP
段落导航相关论文