计算机科学2021,Vol.48Issue(12) :219-225.DOI:10.11896/jsjkx.201100128

基于多粒度文本特征表示的微博用户兴趣识别

Microblog User Interest Recognition Based on Multi-granularity Text Feature Representation

郁友琴 李弼程
计算机科学2021,Vol.48Issue(12) :219-225.DOI:10.11896/jsjkx.201100128

基于多粒度文本特征表示的微博用户兴趣识别

Microblog User Interest Recognition Based on Multi-granularity Text Feature Representation

郁友琴 1李弼程1
扫码查看

作者信息

  • 1. 华侨大学计算机科学与技术学院 福建 厦门 361021
  • 折叠

摘要

微博用户兴趣发现对社交网络的个性化推荐和信息传播的正确引导具有重要意义,因此提出了一种基于多粒度文本特征表示的微博用户兴趣识别方法.首先,从主题层、词序层和词汇层3个方面对微博用户构造文本向量,利用LDA提取内容的主题特征,通过LSTM学习内容的语义特征,引入腾讯AI Lab开源词向量获取词义特征;然后,将以上3种特征向量拼接得到的多粒度文本特征表示矩阵输入CNN中,进行文本分类训练;最后,通过多端输出层实现对微博用户的兴趣识别.实验结果表明,多粒度特征表示模型的分类实验结果比单粒度特征表示模型的精准率、召回率和F1值分别提高了8%,12%和13%.基于对文本粗、细语义粒度和词粒度的综合考量,结合神经网络分类算法,多粒度特征表示模型的评价指标均优于单粒度特征表示模型.

关键词

社交网络/微博用户/兴趣识别/文本特征/文本分类

引用本文复制引用

基金项目

国家社会科学基金(19BXW110)

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
被引量4
参考文献量9
段落导航相关论文