国家学术搜索

家庭影院技术2024，Vol.342Issue(16) ：59-62.

改进扩散模型的文本生成图像方法

刘洋程昔恩

家庭影院技术2024，Vol.342Issue(16) ：59-62.

✕

来源：

NETL
NSTL
万方数据

改进扩散模型的文本生成图像方法

刘洋 ¹程昔恩¹

扫码查看

作者信息

1. 景德镇陶瓷大学信息工程学院
折叠

摘要

本模型是在预训练的扩散模型的基础上赋予新的输入模态,使它和文本共同作为输入条件,提高现存模型的生成可控性.同时,为了留存预训练模型的概念知识,先冻结了原本的权重,然后使用门控机制将新的模态加入新的可训练层.本次改进的模型,使用文本和边界框作为输入条件,增强过程的可控性从而达到相对较好的结果.

关键词

图像生成/稳定扩散模型/GLIP

引用本文复制引用

出版年

2024

家庭影院技术

广州市科学技术协会

家庭影院技术

影响因子：0.003

ISSN：1008-0945

段落导航

相关论文

摘要
关键词
引用本文
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果