首页|改进扩散模型的文本生成图像方法

改进扩散模型的文本生成图像方法

扫码查看
本模型是在预训练的扩散模型的基础上赋予新的输入模态,使它和文本共同作为输入条件,提高现存模型的生成可控性.同时,为了留存预训练模型的概念知识,先冻结了原本的权重,然后使用门控机制将新的模态加入新的可训练层.本次改进的模型,使用文本和边界框作为输入条件,增强过程的可控性从而达到相对较好的结果.

刘洋、程昔恩

展开 >

景德镇陶瓷大学信息工程学院

图像生成 稳定扩散模型 GLIP

2024

家庭影院技术
广州市科学技术协会

家庭影院技术

影响因子:0.003
ISSN:1008-0945
年,卷(期):2024.342(16)