计算机科学2021,Vol.48Issue(10) :51-58.DOI:10.11896/jsjkx.200900194

多源异构用户生成内容的融合向量化表示学习

Fusion Vectorized Representation Learning of Multi-source Heterogeneous User-generated Contents

纪南巡 孙晓燕 李祯其
计算机科学2021,Vol.48Issue(10) :51-58.DOI:10.11896/jsjkx.200900194

多源异构用户生成内容的融合向量化表示学习

Fusion Vectorized Representation Learning of Multi-source Heterogeneous User-generated Contents

纪南巡 1孙晓燕 1李祯其1
扫码查看

作者信息

  • 1. 中国矿业大学信息与控制工程学院 江苏 徐州221008
  • 折叠

摘要

随着移动网络和APPs的发展,包含用户评价、标记、打分、图像和视频等多源异构数据的用户生成内容(User Genera-ted Contents,UGC)成为提高个性化服务质量的重要依据,对这些数据的融合和表示学习成为其应用的关键.对此,提出一种面向多源文本和图像的融合表示学习.采用Doc2vec和LDA模型,给出多源文本的向量化表示,采用深度卷积网络获取与评价文本相关的图像特征;给出多源文本向量化表示的多策略融合机制,以及文本和图像卷积融合的表示学习.将所提算法应用于亚马逊含UGC内容的商品数据集上,基于UGC向量化表示物品的分类准确率说明了该算法的可行性和有效性.

关键词

用户生成内容/表示学习/多源异构/融合/短文本

引用本文复制引用

基金项目

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
参考文献量3
段落导航相关论文