首页|基于网络短文本主题挖掘技术研究

基于网络短文本主题挖掘技术研究

扫码查看
由于短文本内容少,在语义特征上短文本要比长文本匮乏的多,传统的主题模型对于普通文档非常有效,然而严重的数据稀疏问题使得短文本主题建模困难.为了解决这一问题,提出了GBDP(Gravity Biterm Topic Model Hierarchical Dirichlet Process)模型,它是一种基于BTM(Biterm Topic Model)的Dirichlet过程,同时结合CRP(Chinese Restaurant Process)不仅考虑词汇之间相关性而且也考虑到了词对之间的联系,最后对实际数据进行了对比实验,结果表明GBDP在主题质量和困惑度方面效果显著.
Research on Topic Mining Technology Based on Network Short Article

冯鑫、汤鲲

展开 >

武汉邮电科学研究院 武汉 430074

南京烽火天地通信科技有限公司 南京 210019

南京烽火星空通信发展有限公司 南京 210000

狄利克雷过程 LDA BTM GBDP 主题挖掘

2021

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2021.49(5)
  • 3