国家学术搜索
登录
注册
中文
EN
家庭影院技术
2024,
Vol.
342
Issue
(16) :
59-62.
改进扩散模型的文本生成图像方法
刘洋
程昔恩
家庭影院技术
2024,
Vol.
342
Issue
(16) :
59-62.
引用
认领
✕
来源:
NETL
NSTL
万方数据
改进扩散模型的文本生成图像方法
刘洋
1
程昔恩
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
景德镇陶瓷大学信息工程学院
折叠
摘要
本模型是在预训练的扩散模型的基础上赋予新的输入模态,使它和文本共同作为输入条件,提高现存模型的生成可控性.同时,为了留存预训练模型的概念知识,先冻结了原本的权重,然后使用门控机制将新的模态加入新的可训练层.本次改进的模型,使用文本和边界框作为输入条件,增强过程的可控性从而达到相对较好的结果.
关键词
图像生成
/
稳定扩散模型
/
GLIP
引用本文
复制引用
出版年
2024
家庭影院技术
广州市科学技术协会
家庭影院技术
影响因子:
0.003
ISSN:
1008-0945
引用
认领
段落导航
相关论文
摘要
关键词
引用本文
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果