国家学术搜索
登录
注册
中文
EN
首页
|
改进扩散模型的文本生成图像方法
改进扩散模型的文本生成图像方法
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
中文摘要:
本模型是在预训练的扩散模型的基础上赋予新的输入模态,使它和文本共同作为输入条件,提高现存模型的生成可控性.同时,为了留存预训练模型的概念知识,先冻结了原本的权重,然后使用门控机制将新的模态加入新的可训练层.本次改进的模型,使用文本和边界框作为输入条件,增强过程的可控性从而达到相对较好的结果.
收起全部
展开查看外文信息
作者:
刘洋、程昔恩
展开 >
作者单位:
景德镇陶瓷大学信息工程学院
关键词:
图像生成
稳定扩散模型
GLIP
出版年:
2024
家庭影院技术
广州市科学技术协会
家庭影院技术
影响因子:
0.003
ISSN:
1008-0945
年,卷(期):
2024.
342
(16)