个性化文本生成技术研究及其在自动网评系统中的应用

张晨阳¹

扫码查看

作者信息

1. 中国科学院大学
折叠

摘要

伴随互联网技术的发展与网民规模的扩增，民众通过网络获取信息并发表评论已是生活常态化。受自由、多向互动的网络环境影响，网络评论中的立场与观点在影响民众多角度认知的同时，也容易形成具有争议性的网络舆论。伴随虚假信息和网络不良思想的误导，舆论更容易出现盲目从众性或群体极化现象，甚至会产生谣言的大肆传播，网络舆论失控等问题，给舆论引导工作带来极大的困难。为了能更好的开展舆论引导工作，本课题相关项目已经初步设计完成了自动网评系统，可以通过网上评论跟帖的方式实现对舆论的主动引导。但其中评论内容制定功能还不够完善，为了实现系统账号能够模仿真实用户发表评论的项目需求，本文提出了基于用户特征的个性化网络评论生成方法。在对短文本自动生成技术做了充分调研的情况下，本文为了获取网络用户的个性化特征，在现有对网络群体特征分类和描述的基础上，结合特定话题下真实的网络评论数据，以用户情感立场和兴趣爱好两个维度对网络用户特征及描述进行了细化分类，用于分配系统账号不同的风格类别。随后，本文提出了融合BERT预训练模型的个性化网络评论生成方法。模型在编码器端利用BERT进行词向量的增强训练，利用门控记忆单元将用户个性化信息嵌入生成模型中，通过素材内容和用户特征描述信息共同指导生成特定风格类别的个性化评论文本。同时为了保证生成评论的在应用时的流畅及连贯性，本文对生成的初代文本利用文本复述技术进行了修正，并完成了在自动网评中的应用。本文提出的“预训练+基于用户特征生成+文本修正”的方法，经实验对比验证，能较好的实现针对不同用户类别的个性化评论生成，符合项目的功能需求，并且在语料充分的情况下，本方法也适用于其他相关场景。

关键词

自动网评系统/个性化文本生成/预训练模型/用户特征/文本修正

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

杜义华

学位年度

2021

学位授予单位

中国科学院大学

语种

中文

中图分类号

段落导航