基于手绘草图的服装图像生成方法研究

杨聪聪¹

扫码查看

作者信息

1. 武汉纺织大学
折叠

摘要

服装设计是一种将设计美学和自然美应用于服装及其配饰的技艺，它追求实用美,是一种以人体为对象，以材料为基础，与各种机能性相结合的创造性行为。设计者不仅要对大众的生活方式和客户的需求有很好的了解，还要能够清晰地表达自己的想法。其中服装草图是设计者创作意图的集中体现，首先通过构思绘制出服装草图，然后根据服装草图设计出服装效果图，最后在此基础上制作出成衣。这种传统的设计过程耗时耗力，且严重依赖于设计者的主观意志，为了减轻设计者的负担并提高服装设计的效率，可以利用计算机进行辅助服装设计，将手绘草图自动转换为服装图像。本文主要工作如下: （1）本文的基于手绘草图的服装图像生成研究需要大量的服装图像和草图数据进行训练，而由于服装草图数据的稀缺性，现有公开数据集无法满足本文研究，因此提出一种方案来解决此问题。该方案首先对所需要的服装草图数据集展开分析，然后收集相应的服装图像，再利用现有的几种边缘检测算法对收集得到的真实服装图像进行处理以得到服装边缘图。在进行了对比实验的定性与定量分析后，选择性能最为优异的边缘检测算法来构建本文的服装草图数据集。（2）提出一种基于CycleGAN的两阶段草图生成服装图像方法。在第一阶段中，针对手绘草图的变形问题，通过空间对齐模块将输入草图进行非刚性对齐，从而得到更合理的结果，然后通过基于自注意力机制的CycleGAN网络初步生成服装图像。在第二阶段中，针对手绘草图过于简单抽象导致提供的信息十分有限的问题，设计了一个由参考图像引导的多样化网络，该网络使用VGG16编码器分别对参考图像和第一阶段的生成图像提取样式特征和内容特征，然后将样式特征插入到VGG16解码器每一层的AdaIN层中，最终生成内容更为丰富的服装图像。实验结果表明，本文方法生成的服装图像在视觉效果上相较于对比方法更好，并在FID指标上比CycleGAN降低了12.7％。（3）提出一种基于手绘草图和文本的多模态服装图像生成方法。针对第4章所提方法中草图提供的信息有限从而难以生成较高质量服装图像的问题，提出结合多模态输入到模型中从而避免该问题。第一阶段训练视觉Tokenizer学习将输入图像压缩成离散的token序列;第二阶段通过双向Transformer对多模态条件的token序列和服装图像token序列进行相关性建模。为了提高生成图像的质量，在训练过程中的掩码视觉建模任务中采用了五种掩码策略，并在迭代推理过程中采用了非自回归生成的方式来提高生成速度。实验结果表明，本文方法在文本到图像生成和草图到图像生成任务上均优于对比方法。

关键词

服装图像/图像生成/手绘草图/自动转换

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

陈佳

学位年度

2023

学位授予单位

武汉纺织大学

语种

中文

中图分类号

段落导航