信息技术与信息化2024,Issue(12) :5-12.DOI:10.3969/j.issn.1672-9528.2024.12.001

基于稳定扩散模型的苗绣图像分类研究

张银建 杨邦勤 陈研 吴菁
信息技术与信息化2024,Issue(12) :5-12.DOI:10.3969/j.issn.1672-9528.2024.12.001

基于稳定扩散模型的苗绣图像分类研究

张银建 1杨邦勤 1陈研 2吴菁1
扫码查看

作者信息

  • 1. 贵州民族大学 贵州贵阳 550000
  • 2. 华南理工大学 广东广州 510641
  • 折叠

摘要

针对苗绣图像分类中图片数据量少导致特征提取质量较低的问题,引入稳定扩散模型(stable diffusion)的"图生图"方法作为一种数据增强手段.在此数据增强的基础上,针对卷积神经网络在图像分类中特征提取不充分且贡献度不明确的问题,基于残差网络ResNet-18 结构引入多维度动态卷积(omni-dimensional dynamic convolution,ODConv)和多维协同注意力模块(multidimensional collaborative attention module,MCA)构建了基于稳定扩散模型的苗绣图像分类模型.通过在自建数据集上进行对比,实验结果表明,与不进行数据增强且单纯使用原始残差网络相比,文章所提方法可有效提高模型分类性能.

关键词

苗绣/扩散模型/数据增强/残差网络/图像分类

引用本文复制引用

出版年

2024
信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
段落导航相关论文