国家学术搜索
登录
注册
中文
EN
首页
|
一种基于字符对比的文本相似度计算方法
一种基于字符对比的文本相似度计算方法
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
为解决包含重复字符的文本相似度计算问题,提出了一种新的计算方法来获取两文本之间的相似度.首先根据单字符的对比情况统计重复字符数量;其次通过分析总的对比结果剔除重复字符的干扰;然后借助公式计算出正确的文本相似度,并拓展单字节字符和多字节字符混合时的相似度计算方法;最后编写算法代码来进行仿真分析,多组测试结果表明,用该方法计算得到的文本相似度与理论值相吻合.
外文标题:
Text similarity calculation method based on character comparison
收起全部
展开查看外文信息
作者:
汪亚东
展开 >
作者单位:
中北大学仪器与电子学院,山西 太原 030051
关键词:
自然语言处理
文本相似度
重复字符
计算算法
出版年:
2023
DOI:
10.16644/j.cnki.cn33-1094/tp.2023.06.018
计算机时代
浙江省计算技术研究所 浙江省计算机学会
计算机时代
影响因子:
0.411
ISSN:
1006-8228
年,卷(期):
2023.
(6)
被引量
1
参考文献量
10