首页|基于稳定扩散模型的苗绣图像分类研究

基于稳定扩散模型的苗绣图像分类研究

扫码查看
针对苗绣图像分类中图片数据量少导致特征提取质量较低的问题,引入稳定扩散模型(stable diffusion)的"图生图"方法作为一种数据增强手段.在此数据增强的基础上,针对卷积神经网络在图像分类中特征提取不充分且贡献度不明确的问题,基于残差网络ResNet-18 结构引入多维度动态卷积(omni-dimensional dynamic convolution,ODConv)和多维协同注意力模块(multidimensional collaborative attention module,MCA)构建了基于稳定扩散模型的苗绣图像分类模型.通过在自建数据集上进行对比,实验结果表明,与不进行数据增强且单纯使用原始残差网络相比,文章所提方法可有效提高模型分类性能.

张银建、杨邦勤、陈研、吴菁

展开 >

贵州民族大学 贵州贵阳 550000

华南理工大学 广东广州 510641

苗绣 扩散模型 数据增强 残差网络 图像分类

2024

信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
年,卷(期):2024.(12)