首页|基于VSM的文本相似度计算的研究

基于VSM的文本相似度计算的研究

扫码查看
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果.提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加
Similarity computing of documents based on VSM

郭庆琳、李艳梅、唐琦

展开 >

华北电力大学,计算机科学与技术学院,北京,102206

北京大学,计算机系,北京,100871

文本相似度 特征选择 词频-逆文档频率法 向量空间模型

国家自然科学基金国家自然科学基金国家自然科学基金国家自然科学基金

904120107057209060573166H0585

2008

计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
年,卷(期):2008.25(11)
  • 94
  • 2