国家学术搜索
登录
注册
中文
EN
计算机时代
2023,
Issue
(6) :
87-91.
DOI:
10.16644/j.cnki.cn33-1094/tp.2023.06.018
一种基于字符对比的文本相似度计算方法
Text similarity calculation method based on character comparison
汪亚东
计算机时代
2023,
Issue
(6) :
87-91.
DOI:
10.16644/j.cnki.cn33-1094/tp.2023.06.018
引用
认领
✕
来源:
NETL
NSTL
维普
万方数据
一种基于字符对比的文本相似度计算方法
Text similarity calculation method based on character comparison
汪亚东
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
中北大学仪器与电子学院,山西 太原 030051
折叠
摘要
为解决包含重复字符的文本相似度计算问题,提出了一种新的计算方法来获取两文本之间的相似度.首先根据单字符的对比情况统计重复字符数量;其次通过分析总的对比结果剔除重复字符的干扰;然后借助公式计算出正确的文本相似度,并拓展单字节字符和多字节字符混合时的相似度计算方法;最后编写算法代码来进行仿真分析,多组测试结果表明,用该方法计算得到的文本相似度与理论值相吻合.
关键词
自然语言处理
/
文本相似度
/
重复字符
/
计算算法
引用本文
复制引用
出版年
2023
计算机时代
浙江省计算技术研究所 浙江省计算机学会
计算机时代
影响因子:
0.411
ISSN:
1006-8228
引用
认领
被引量
1
参考文献量
10
段落导航
相关论文
摘要
关键词
引用本文
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果