首页|基于命名实体n-gram图的文本相似性度量

基于命名实体n-gram图的文本相似性度量

扫码查看
文本比较在自然语言处理中应用广泛.本文提出了一种新的文本相似性度量方法,该方法利用从文本和n-gram图中提取的命名实体信息来表示文档,使用OpenCalais作为命名实体识别服务,使用JIn?sect工具箱来构造和管理n-gram,使用文本聚类算法k-Means进行文本相似性度量,使用各种聚类有效性指标对生成的聚类进行评估.
Text Similarity Measurement Based on n-gram Graph of Named Entity

于营、周显春、贾树文

展开 >

三亚学院信息与智能工程学院,三亚 572000

三亚学院容淳铭院士工作站,三亚 572000

三亚学院盛宝金融科技商学院,三亚 572000

自然语言处理 n-gram图 文本聚类 文本相似性度量

海南省自然科学基金青年项目

621QN270

2022

现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
年,卷(期):2022.28(2)
  • 1