首页|一种基于编辑距离的中文字符串近似匹配算法

一种基于编辑距离的中文字符串近似匹配算法

扫码查看
字符串近似匹配是模式匹配领域中的一个重要研究方向.在中文字符串近似匹配中,基于字符操作的编辑距离不能准确衡量由复制、剪贴等操作导致的相似关系.基于此,在传统编辑距离的基础上引入了字符串的平移和复制操作,给出了一种在贪心算法基础上进行动态规划搜索的计算方法,能有效计算改进的编辑距离,在真实数据集上的实验结果和分析显示了对文本检索的有效性.
A Chinese String Matching Algorithm Based on Edit Distance
Approximate string matching is an important research direction in the field of pattern matching.In Chinese string approximate matching,the edit distance based on character operation cannot accurately measure the similarity relationship caused by string copy and cut operations.This paper introduces the shift and copy operations of strings on the basis of the traditional edit distance,and presents a calculation method for dynamic programming search based on the greedy algorithm,which can effectively calculate the improved edit distance.Experimental re-sults and analysis show the effectiveness for text retrieval.

string matchingapproximate matchingdynamic programming algorithmedit distance

王昭、薛晨浩、裴卓雄

展开 >

国家计算机网络应急技术处理协调中心山西分中心,山西 太原 030012

字符串匹配 近似匹配 动态规划算法 编辑距离

2024

山西电子技术
山西省电子工业科学研究院 山西省电子学会

山西电子技术

影响因子:0.197
ISSN:1674-4578
年,卷(期):2024.(4)