信息技术与信息化2024,Issue(4) :24-27.DOI:10.3969/j.issn.1672-9528.2024.04.005

基于扩散模型的文本连续性插画生成

徐任政 姚剑敏 陈恩果 严群
信息技术与信息化2024,Issue(4) :24-27.DOI:10.3969/j.issn.1672-9528.2024.04.005

基于扩散模型的文本连续性插画生成

徐任政 1姚剑敏 2陈恩果 1严群1
扫码查看

作者信息

  • 1. 福州大学 福建福州 350108
  • 2. 福州大学 福建福州 350108;晋江市博感电子科技有限公司 福建晋江 362200
  • 折叠

摘要

基于扩散模型的生成能力,提出了一种基于扩散模型的文本连续性插画的生成方法.其目标是根据给定的文本输入,生成连续的插画,以便更好地传达文本的意思.在扩散模型的基础上,加入了LSTM神经网络模型,使扩散模型在原本只能根据一句或者一段文本来生成一张图片的基础上加以改进,之后可以通过一段或多段文本,通过LSTM进行预处理,再生成一系列连续性的图片.所提方法主要是利用LSTM神经网络模型在序列建模方面的优势,它能很好地捕捉序列数据中的长期依赖关系,从而更好地理解和建模序列中的上下文信息.将预处理好的源文本送入生成模型,通过生成模型的生成能力,最后输出一系列连续的图片.

关键词

扩散模型/深度学习/插画生成/连续性/LSTM神经网络模型

引用本文复制引用

基金项目

国家重点研发计划(2022YFB3603503)

福建省技术攻关重点项目(2023G007)

出版年

2024
信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
参考文献量13
段落导航相关论文