首页|融合词性、语义及词序因子的中文短文本相似度计算方法

融合词性、语义及词序因子的中文短文本相似度计算方法

扫码查看
论文针对中文短文本特性,综合考虑词性、词序和语义等因素提出了一种新的文本相似度计算方法[1]。这种方法是在余弦相似度的基础上计算中文短文本的语义相似度,并通过加权词性、词序权重优化相似度计算结果。实验证明,论文的方法与其他方法相比,准确率和召回率有了显著提高,获得的相似度结果更具说服力。
Computing Method of Chinese Short Text Similarity Based on Part of Speech,Semantic and Word Order Factors
According to the characteristics of Chinese short texts,a method of calculating text similarity is proposed,which combines parts of speech,semantics and word order factors.This method relates the part of speech,meaning and position of words in Chinese short text,and on the basis of cosine formula,through the correlation between the similarity of words of text vectors and the weight of part of speech,this paper improves the method of Chinese short text similarity calculation,and introduces word order similarity to optimize text similarity.The experimental results show that this method has better accuracy and recall than other meth-ods,and is more in line with people's subjective judgment.

Chinese short text similaritypart of speechsemanticsword order

祖月芳、凌海风、汤润之、翟仕奇、王涛

展开 >

96761部队 三门峡 472100

陆军工程大学野战工程学院 南京 210004

32228部队 南京 210004

中文短文本相似度 词性 词序 语义

2024

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2024.52(8)