高性能计算技术2015,Issue(3) :51-55.

基于语义指纹的文本相似检测算法研究与实现

Research and Implementation of Text Similarity Detection Algorithm Based on Semantic-Fingerprint

郭强 彭超 李晓静
高性能计算技术2015,Issue(3) :51-55.

基于语义指纹的文本相似检测算法研究与实现

Research and Implementation of Text Similarity Detection Algorithm Based on Semantic-Fingerprint

郭强 1彭超 1李晓静1
扫码查看

作者信息

  • 1. 江南计算技术研究所 无锡214000
  • 折叠

摘要

相似检测是大规模文本处理的一个研究热点.本文设计了一种生成语义指纹的算法,并基于语义指纹实现了一种文本相似检测方法.通过实验比较发现,基于语义指纹的相似检测能获得较好的检测结果和较高的执行效率,并将这种相似检测方法应用于垃圾邮件过滤,取得了显著的效果.

关键词

语义指纹/相似检测/垃圾过滤

引用本文复制引用

出版年

2015
高性能计算技术
中国人民解放军总参第五十六研究所

高性能计算技术

影响因子:0.038
ISSN:
参考文献量5
段落导航相关论文