首页|基于广义后缀树结合过滤因子的正则表达式匹配算法

基于广义后缀树结合过滤因子的正则表达式匹配算法

REGULAR EXPRESSION MATCHING ALGORITHM BASED ON GENERALIZED SUFFIX TREE COMBINE FILTER FACTOR

扫码查看
为了提高正则表达式在文本集合上的匹配效率,提出一种基于广义后缀树与过滤因子相结合的正则表达式匹配技术.根据给定的文本集合构建广义后缀树,通过在广义后缀树上定位过滤因子得到有效的候选匹配集合,利用过滤因子的序列信息进一步过滤候选集合,进而对候选集合中的字符串进行验证,得到匹配结果.通过在真实的数据集上进行实验,证明了该算法能够有效地提高正则表达式的匹配性能.

林婧、何震瀛

展开 >

复旦大学软件学院 上海 201203

复旦大学上海市数据科学重点实验室 上海 200433

复旦大学计算机科学技术学院 上海 201203

正则表达式 算法性能 过滤技术

国家重点研发计划

2018YFB1004404

2022

计算机应用与软件
上海市计算技术研究所 上海计算机软件技术开发中心

计算机应用与软件

CSTPCD北大核心
影响因子:0.615
ISSN:1000-386X
年,卷(期):2022.39(1)
  • 2
  • 13