上海师范大学学报(自然科学版)2006,Vol.35Issue(5) :21-26.

基于STC的中文文本聚类算法

An STC-based Chinese text clustering method

王国强 郑海清 牛军钰
上海师范大学学报(自然科学版)2006,Vol.35Issue(5) :21-26.

基于STC的中文文本聚类算法

An STC-based Chinese text clustering method

王国强 1郑海清 2牛军钰2
扫码查看

作者信息

  • 1. 上海市杨浦区业余大学,上海,200092
  • 2. 复旦大学计算机科学与工程系,上海,200433
  • 折叠

摘要

提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结构,辅助用户浏览检索结果.首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后提出了基于后缀树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算法实现的过程中遇到的关键问题及解决方案.

关键词

后缀树/文本聚类/文本处理

引用本文复制引用

出版年

2006
上海师范大学学报(自然科学版)
上海师范大学

上海师范大学学报(自然科学版)

CSTPCD
影响因子:0.255
ISSN:1000-5137
被引量2
参考文献量11
段落导航相关论文